2017-05-06 02 Илья Сиганов. Зачем учить машины?

Зачем учить машину?
Илья Сиганов
разработчик / аспирант
7bits / ОмГУ

Компьютеры становятся все умнее.
Ученые утверждают, что скоро они смогут
разговаривать с нами.
Дейв Барри

История техники. Аналоговые машины.
● Арифмометры

История техники. Аналоговые машины.
● “Аналитическая” машина
Бэббиджа
● перфокарты
● Программы от Ады
Лавлейс

История техники. Электроника
● Электронные и
электромеханические
компьютеры

История техники. Поколения выч.техники.
1. 1940-ые - Электронные лампы
2. Транзисторы
3. Интегральные схемы
4. Микропроцессоры
5. 1980-ые - Искусственный интеллект (sic!)

Пятое колесо поколение компьютеров
● Хотели запрограммировать искусственный
интеллект
● Потратили 10 лет и ~1 млрд. долларов!
● Не получили никакого результата

Проблема программного ИИ
● Программа - это зафиксированная абстракция
● Абстракции создает человек интерпретируя своё восприятие
● У людей разное восприятие, следовательно абстракции разные
НО
● Мир динамичный и меняющийся
● Абстракция - жесткая и статичная
● Тестировать нужно, баги исправлять вручную!

Упражнение. Кошкность.
● Чем кошка отличается от собаки?

Типичные “искусственные интеллекты”
● Переводчики между языками, основанные на моделях описания
языка, его структуры.
● поиск красных кубиков в видео
● Поиск лиц методом каскада Хаара
● Всевозможные фильтры сигналов
● Поиск музыки по отпечатку

Что делать?
● Искать гибкие методы, которые легко адаптировать
● Учитывать фактические реальные данные
● Убрать человека из цепочки создания абстракции

Кто это будет делать?

Как оно будет это делать?
● Машинное обучение - поиск зависимости между наблюдаемыми и
скрытыми данными, т.е. поиск скрытой закономерности

Что значит поиск закономерностей?
Закономерность ~ Функция ~ Алгоритм
Мы автоматизируем создание алгоритмов

Рефлексирующие программные системы
?
Обычные алгоритмы #1
Машинное обучение #2

Некоторые боятся, что их заменят скриптом.
Более продвинутые боятся, что их заменят
машинным обучением.

Новая проблема
● Кто выбирает алгоритмы второго уровня? (условно
ML-алгоритм)
● Нельзя просто так загрузить данные в google-engine и
получить ответ?
● Неужели нет “Единого Решения”, “Истинного
Алгоритма”?

К чему это приводит?
● Зоопарк алгоритмов машинного обучения
● Разнообразие классов “задача”
● Проблема предобработки данных
● Проблема интерпретации результата
● Проблема выбора подходящего алгоритма
● Проблема выбора метрики качества
● Проблема переобучения

Классы задач
● Классификация
● Регрессия
● Структурирование ( Кластеризация )
● Обнаружение аномалий
● Синтез
● Ранжирование
● Прогнозирование

Подходы к обучению
● с учителем
○ с подкреплением
● без учителя

Классификация
● Кредитный скоринг - по показателям клиентов
определить вернут они кредит или нет
● Медицинская диагностика
● Распознавание образов (картинок, звуков)
● Определение пола человека по его отпечатку в сети
интернет
● Идентификация пользователя по его биометрии

Регрессия
● Предсказание температуры воздуха
● Прогнозирование продаж товара
● Прогнозирование стоимости недвижимости
● Определение длительности игры
● Прогноз характеристик хим. соединений
● Кредитный скоринг - определение кредитного лимита

Поиск структуры
● Классификация без обучающей выборки
● Используется для поиска классов на неразмеченной
выборке
● Сегментация аудитории
● Поиск похожих текстов
● Обнаружение аномалий
● Рекомендации основанные на схожести товаров или
пользователей

Прогнозирование

Прогнозирование
● Метерология
● Банковское дело и предсказание стоимости ценных
бумаг
● Прогнозирование уровня зарплат
● Демографические прогнозы
● Всё что связано с трендами, циклическими
изменениями

Интерпретация. Деревья решений
Titanic dataset:
● Пол
● Возраст
● Класс (1, 2, 3)
● Тариф
● Порт отбытия
● Родственники на
борту

Интерпретация. Разделяющие поверхности

Интерпретация. Глубокие нейросети

Признаки. Категориальные, числовые.

Сложные вопросы. Какой класс задач?

Сложные вопросы. Какой класс задач?
Декомпозиция звука на компоненты
Разделить речь одновременно
говорящих людей
Подавить сложный шум

Человек всё еще нужен
● Человек подбирает признаки
● Человек выбирает подходящий класс алгоритмов ML
● Человек эвристически подбирает параметры
алгоритмов
Машина ищет закономерности в данных

Ответы на вопросы
● Какие модели есть в проде и где они используются
● Машинное обучение для анализа текстовых документов, примеры и
подходы.
● Какие задачи не могут быть решены нейронными сетями и почему?
● Возможно ли написать алгоритм обратного распространения ошибки,
который бы подходил для любой нейронной сети(с любым количеством
слоев, входов, выходов) ?

С чего начать?
● www.coursera.org/learn/vvedenie-mashinnoe-obuchenie/home/
welcome
● www.coursera.org/specializations/machine-learning-data-analy
sis
● datamininginaction.ru/
● habrahabr.ru/company/ods/
● yandexdataschool.ru/edu-process/courses/machine-learning

bit.ly/hdl2017_ml
Полезные материалы

ML-сообщество в Омске
Первая встреча 27 мая 2017
vk.com/mlomsk

2017-05-06 02 Илья Сиганов. Зачем учить машины?

Recommended

Recommended

More Related Content

Similar to 2017-05-06 02 Илья Сиганов. Зачем учить машины?

Similar to 2017-05-06 02 Илья Сиганов. Зачем учить машины? (20)

More from Омские ИТ-субботники

More from Омские ИТ-субботники (20)

2017-05-06 02 Илья Сиганов. Зачем учить машины?