SlideShare a Scribd company logo
1 of 31
Download to read offline
DEEP
NEURAL
LANGUAGE
PROCESSING
Михаил Бурцев,
к.ф.-м.н., зав. лаб.
«Нейронных сетей и глубокого обучения» МФТИ
Фундаментальная цель – Прикладная цель -
Понять природу человека Получить помощника
•
ЧТО ТАКОЕ
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ (ИИ)?
ДВА ПУТИ
Нейроны передают
электрические сигналы
мозг можно
смоделировать
электрической схемой
искусственные
нейронные
сети
Человеческий интеллект
основан на манипуляции
с символами
компьютер совершает
манипуляции с
символами
искусственный
интеллект
ЭВОЛЮЦИЯ ИИ
• Классификация
огромных массивов
изображений и видео.
• Google и Facebook
охотятся за головами
ученых занимающихся
нейронными сетями.
• Нейросети учатся играть
в игры по картинке.
deep learning
ЧТО ТАКОЕ
ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ И
ГЛУБОКОЕ ОБУЧЕНИЕ?
• Активность нейрона
определяется
преобразованием взвешенного
суммарного воздействия на
него
• Воздействия могут быть
активирующими
(положительные веса) или
тормозными (отрицательные
веса)
ИСКУССТВЕННЫЙ
НЕЙРОН
• Искусственная нейронная сеть
(ИНС) является концептуальной
моделью биологической
нейронной сети
• Состоит из элементов,
влияющих на активность друг
друга
• Основные свойства
– надежность – по мере
ухудшения качества входа,
удалении связей или элементов
эффективность сети снижается
постепенно
– гибкость – ИНС могут быть
применены в широком круге
задач
– генерализация – достаточно
обучения на ограниченной
выборке
– ассоциативность памяти
ИСКУССТВЕННАЯ
НЕЙРОНАЯ СЕТЬ
• Обучение нейросети
происходит за счет
изменения весов
БАЗОВЫЕ ПОНЯТИЯ
ЧТО ТАКОЕ
ГЛУБОКОЕ ОБУЧЕНИЕ?
DEEP LEARNING
=
NEURAL NETS +BIG DATA + GPU
ВИДЕТЬ ПОНИМАТЬ ДЕЙСТВОВАТЬ
СОВРЕМЕННЫЕ НАПРАВЛЕНИЯ
ИССЛЕДОВАНИЙ В ОБЛАСТИ
ГЛУБОКОГО ОБУЧЕНИЯ
РЕКУРРЕНТНЫЕ
НЕЙРОННЫЕ СЕТИ
задача предсказания временных рядов
архитектура рекуррентной сети
LSTM ячейка
примеры приложений в области работы с текстом
• «Классические»
нейронные сети – сети
прямого распространения
(feedforward network) не
обладают памятью.
• «Активации» проходят всю
сеть насквозь.
• Нейросети «с памятью» –
рекуррентные сети.
• За счет наличия обратных
связей «активации»
циркулируют в сети.
В ПОИСКАХ ПАМЯТИ
сеть прямого
распространения
рекуррентная сеть
• Сигнал затухает!
ПРОБЛЕМА ГЛУБИНЫ
LSTM: НЕЙРОАРХИТЕКТУРА
Алиса теперь счастлива.
Она не говорит, что это так.
Она в опасности.
Она выглядит прекрасно.
Она была на концерте Фаллуджи.
Я знаю, что она влюблена в него.
Она великолепна.
Она принесла нам немного воды.
Она ведьма.
А когда она говорит: "Я не говорю, что когда
она позвонит"
И когда она вернётся, я поняла,
Алиса попала в беду.
И все же так обожает.
Ты не нашел ее?
Она изменила свою жизнь.
. ♪ К кому она придумала это? ♪
Да, да. Она не умеет жить.
А она не знает, кто ты?
Я видела в ней все свои приключения.
Вот она вот и все.
Она не собирается никого убивать.
Джон теперь счастлив.
Спасибо.
Да, на дворе 800 фунтов на каждом месте
преступления в 1000 тысяч градусов по матче.
Он в самом деле собирается позволить себе
просто бросить все на свои места.
Да, я тоже так думал.
Я не знаю, что в нем
Джон попал в беду.
• Сверхъестественное: Ваша честь, это был
не мы.
• И все они возвращаются в Вашингтон.
• Он был не таким, как было в прошлом
году
• Придурок!
• Свиньи собираются в Старлинг Сити.
• Он был в отчаянии.
• Вот что я вам скажу.
• И когда он вернулся, я выбросил его в
офис.
• Я тоже хотел это сделать.
РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И
ДИАЛОГОВЫЕ СИСТЕМЫ
Около 25% всех сообщений электронной почты содержат менее 20 токенов.
Kannan, A., Kurach, K., Ravi, S., Kaufmann, T., Tomkins, A., Miklos, B., ... & Ramavajjala, V. (2016). Smart Reply: Automated Response Suggestion for Email. In
Proceedings of the ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD)} (Vol. 36, pp. 495-503).
РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И
ДИАЛОГОВЫЕ СИСТЕМЫ
Внутреннее представление вопроса
РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И
ДИАЛОГОВЫЕ СИСТЕМЫ
Вызовы:
• Качество
• недопустимость некачественных
ответов
• Полезность
• необходимо максимизировать
использования сервиса
• Масштабируемость
• миллионы сообщений в день
• Приватность
• должна использоваться только
агрегированная статистика
РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И
ДИАЛОГОВЫЕ СИСТЕМЫ
Предобработка
РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И
ДИАЛОГОВЫЕ СИСТЕМЫ
Триггер ответа
- сеть прямого распространения с 3 слоями;
- на вход подаются векторные представления
темы и содержания, а также дополнительная
информация (наличие отправителя в адресной
книге, наличие прочитанных писем от него);
- обучающая выборка состоит из писем двух
категорий – был ответ с мобильного устройства
или нет;
- в результате 10% сообщений классифицируются,
как требующие ответа.
РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И
ДИАЛОГОВЫЕ СИСТЕМЫ
Выбор ответа
- LSTM сеть
- на вход подается векторное представление
последовательности токенов;
- выход последовательность токенов ответа;
- при декодировании ответа используются
токены только из разрешенных ответов.
РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И
ДИАЛОГОВЫЕ СИСТЕМЫ
Множество разрешенных ответов
- выбор «канонических ответов»
- “Thanks for your kind update.”, “Thank you
for updating!”, “Thanks for the status
update.”
- кластеризация по намерению
- “Ha ha”, “lol” and “Oh that’s funny!” are
associated with the funny cluster
РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И
ДИАЛОГОВЫЕ СИСТЕМЫ
Диверсификация кандидатных ответов
- только один кандидат из кластера
- обязательное присутвие, как «позитивных», так и
«негативных» ответов
РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И
ДИАЛОГОВЫЕ СИСТЕМЫ
Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation https://arxiv.org/abs/1609.08144 , Mon, 26 Sep 2016
Google's Neural Machine Translation System
РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И
ДИАЛОГОВЫЕ СИСТЕМЫ
Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation https://arxiv.org/abs/1609.08144 , Mon, 26 Sep 2016
Проблема: Затухающие градиенты - Решение:Residual connections
РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И
ДИАЛОГОВЫЕ СИСТЕМЫ
Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation https://arxiv.org/abs/1609.08144 , Mon, 26 Sep 2016
Проблема: Затухающий сигнал - Решение: Двунаправленное кодирование
РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И
ДИАЛОГОВЫЕ СИСТЕМЫ
Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation https://arxiv.org/abs/1609.08144 , Mon, 26 Sep 2016
от BIG DATA к DEEP LEARNING
глубокое обучение делает большие данные осмысленными
Neural
Networks
and
Deep Learning
Lab
https://www.udacity.com/course/deep-learning--ud730

More Related Content

Viewers also liked

How to integrate chatbot into your business?
How to integrate chatbot into your business?How to integrate chatbot into your business?
How to integrate chatbot into your business?chatbotscommunity
 
Chatbots Сommunity 3 Months Dynamics
Chatbots Сommunity 3 Months DynamicsChatbots Сommunity 3 Months Dynamics
Chatbots Сommunity 3 Months Dynamicschatbotscommunity
 
1-ый в России бизнес-тренинг по чат-ботам (выжимка)
1-ый в России бизнес-тренинг по чат-ботам (выжимка)1-ый в России бизнес-тренинг по чат-ботам (выжимка)
1-ый в России бизнес-тренинг по чат-ботам (выжимка)chatbotscommunity
 
How to find AI community meetups in Digital October
How to find AI community meetups in Digital OctoberHow to find AI community meetups in Digital October
How to find AI community meetups in Digital Octoberchatbotscommunity
 
Подход к разработке чат-ботов в wobot.me
Подход к разработке чат-ботов в wobot.meПодход к разработке чат-ботов в wobot.me
Подход к разработке чат-ботов в wobot.mechatbotscommunity
 
SKOLKOVO.AI конференция 14 ноября 2016
SKOLKOVO.AI конференция 14 ноября 2016SKOLKOVO.AI конференция 14 ноября 2016
SKOLKOVO.AI конференция 14 ноября 2016Skolkovo Robotics Center
 
Сергей Шумский. Дорожная карта развития направления нейроассистенты
Сергей Шумский. Дорожная карта развития направления нейроассистентыСергей Шумский. Дорожная карта развития направления нейроассистенты
Сергей Шумский. Дорожная карта развития направления нейроассистентыSkolkovo Robotics Center
 
Поиск частых множеств признаков (товаров) и ассоциативные правила
Поиск частых множеств признаков (товаров) и ассоциативные правилаПоиск частых множеств признаков (товаров) и ассоциативные правила
Поиск частых множеств признаков (товаров) и ассоциативные правилаDmitrii Ignatov
 
Maxim Kamensky - Applying image matching algorithms to video recognition and ...
Maxim Kamensky - Applying image matching algorithms to video recognition and ...Maxim Kamensky - Applying image matching algorithms to video recognition and ...
Maxim Kamensky - Applying image matching algorithms to video recognition and ...Eastern European Computer Vision Conference
 
Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...
Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...
Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...Eastern European Computer Vision Conference
 
Александр Савостьянов "Чат-боты в образовании" - EdHack
Александр Савостьянов "Чат-боты в образовании" - EdHackАлександр Савостьянов "Чат-боты в образовании" - EdHack
Александр Савостьянов "Чат-боты в образовании" - EdHackchatbotscommunity
 
Павел Доронин - Мессенджеры и чатботы - Muzis Hackathon
Павел Доронин - Мессенджеры и чатботы - Muzis HackathonПавел Доронин - Мессенджеры и чатботы - Muzis Hackathon
Павел Доронин - Мессенджеры и чатботы - Muzis Hackathonchatbotscommunity
 

Viewers also liked (18)

How to integrate chatbot into your business?
How to integrate chatbot into your business?How to integrate chatbot into your business?
How to integrate chatbot into your business?
 
Chatbots Сommunity 3 Months Dynamics
Chatbots Сommunity 3 Months DynamicsChatbots Сommunity 3 Months Dynamics
Chatbots Сommunity 3 Months Dynamics
 
1-ый в России бизнес-тренинг по чат-ботам (выжимка)
1-ый в России бизнес-тренинг по чат-ботам (выжимка)1-ый в России бизнес-тренинг по чат-ботам (выжимка)
1-ый в России бизнес-тренинг по чат-ботам (выжимка)
 
How to find AI community meetups in Digital October
How to find AI community meetups in Digital OctoberHow to find AI community meetups in Digital October
How to find AI community meetups in Digital October
 
Подход к разработке чат-ботов в wobot.me
Подход к разработке чат-ботов в wobot.meПодход к разработке чат-ботов в wobot.me
Подход к разработке чат-ботов в wobot.me
 
SKOLKOVO.AI конференция 14 ноября 2016
SKOLKOVO.AI конференция 14 ноября 2016SKOLKOVO.AI конференция 14 ноября 2016
SKOLKOVO.AI конференция 14 ноября 2016
 
Сергей Шумский. Дорожная карта развития направления нейроассистенты
Сергей Шумский. Дорожная карта развития направления нейроассистентыСергей Шумский. Дорожная карта развития направления нейроассистенты
Сергей Шумский. Дорожная карта развития направления нейроассистенты
 
Taras Chaykivskyy - Computer Vision in Front-End
Taras Chaykivskyy - Computer Vision in Front-EndTaras Chaykivskyy - Computer Vision in Front-End
Taras Chaykivskyy - Computer Vision in Front-End
 
Eugene Khvedchenia - Image processing using FPGAs
Eugene Khvedchenia - Image processing using FPGAsEugene Khvedchenia - Image processing using FPGAs
Eugene Khvedchenia - Image processing using FPGAs
 
Andrii Babii - Application of fuzzy transform to image fusion
Andrii Babii - Application of fuzzy transform to image fusion Andrii Babii - Application of fuzzy transform to image fusion
Andrii Babii - Application of fuzzy transform to image fusion
 
Поиск частых множеств признаков (товаров) и ассоциативные правила
Поиск частых множеств признаков (товаров) и ассоциативные правилаПоиск частых множеств признаков (товаров) и ассоциативные правила
Поиск частых множеств признаков (товаров) и ассоциативные правила
 
Maxim Kamensky - Applying image matching algorithms to video recognition and ...
Maxim Kamensky - Applying image matching algorithms to video recognition and ...Maxim Kamensky - Applying image matching algorithms to video recognition and ...
Maxim Kamensky - Applying image matching algorithms to video recognition and ...
 
Michael Norel - High Accuracy Camera Calibration
Michael Norel - High Accuracy Camera Calibration Michael Norel - High Accuracy Camera Calibration
Michael Norel - High Accuracy Camera Calibration
 
Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...
Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...
Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...
 
Semantic evaluation on Dialog 2015
Semantic evaluation on Dialog 2015Semantic evaluation on Dialog 2015
Semantic evaluation on Dialog 2015
 
Learning by Analogy
Learning by AnalogyLearning by Analogy
Learning by Analogy
 
Александр Савостьянов "Чат-боты в образовании" - EdHack
Александр Савостьянов "Чат-боты в образовании" - EdHackАлександр Савостьянов "Чат-боты в образовании" - EdHack
Александр Савостьянов "Чат-боты в образовании" - EdHack
 
Павел Доронин - Мессенджеры и чатботы - Muzis Hackathon
Павел Доронин - Мессенджеры и чатботы - Muzis HackathonПавел Доронин - Мессенджеры и чатботы - Muzis Hackathon
Павел Доронин - Мессенджеры и чатботы - Muzis Hackathon
 

More from chatbotscommunity

Павел Доронин "9 грехов разработчиков чат-ботов" - EdHack
Павел Доронин "9 грехов разработчиков чат-ботов" - EdHackПавел Доронин "9 грехов разработчиков чат-ботов" - EdHack
Павел Доронин "9 грехов разработчиков чат-ботов" - EdHackchatbotscommunity
 
Виктор Сафронов "Тематическое моделирование" - EdHack
Виктор Сафронов "Тематическое моделирование" - EdHackВиктор Сафронов "Тематическое моделирование" - EdHack
Виктор Сафронов "Тематическое моделирование" - EdHackchatbotscommunity
 
Александр Белоцерковский "Microsoft Bot Framework" - EdHack
Александр Белоцерковский "Microsoft Bot Framework" - EdHackАлександр Белоцерковский "Microsoft Bot Framework" - EdHack
Александр Белоцерковский "Microsoft Bot Framework" - EdHackchatbotscommunity
 
Артемий Малков "Суперметодики обучения" - EdHack
Артемий Малков "Суперметодики обучения" - EdHackАртемий Малков "Суперметодики обучения" - EdHack
Артемий Малков "Суперметодики обучения" - EdHackchatbotscommunity
 
Вводная хакатона - EdHack
Вводная хакатона - EdHackВводная хакатона - EdHack
Вводная хакатона - EdHackchatbotscommunity
 
Вводная Конференции - EdHack
Вводная Конференции - EdHackВводная Конференции - EdHack
Вводная Конференции - EdHackchatbotscommunity
 
Zoo - EdHack - Chatbots Community
Zoo - EdHack - Chatbots CommunityZoo - EdHack - Chatbots Community
Zoo - EdHack - Chatbots Communitychatbotscommunity
 
WaveRider - EdHack - Chatbots Community
WaveRider - EdHack - Chatbots CommunityWaveRider - EdHack - Chatbots Community
WaveRider - EdHack - Chatbots Communitychatbotscommunity
 
Symmetrical-potato - EdHack - Chatbots Community
Symmetrical-potato - EdHack - Chatbots CommunitySymmetrical-potato - EdHack - Chatbots Community
Symmetrical-potato - EdHack - Chatbots Communitychatbotscommunity
 
Spellobot - EdHack - Chatbots Community
Spellobot - EdHack - Chatbots CommunitySpellobot - EdHack - Chatbots Community
Spellobot - EdHack - Chatbots Communitychatbotscommunity
 
RSK-K161 - EdHack - Chatbots Community
RSK-K161 - EdHack - Chatbots CommunityRSK-K161 - EdHack - Chatbots Community
RSK-K161 - EdHack - Chatbots Communitychatbotscommunity
 
OleggBankBot - EdHack - Chatbots Community
OleggBankBot - EdHack - Chatbots CommunityOleggBankBot - EdHack - Chatbots Community
OleggBankBot - EdHack - Chatbots Communitychatbotscommunity
 
Meet & Language - EdHack - Chatbots Community
Meet & Language - EdHack - Chatbots CommunityMeet & Language - EdHack - Chatbots Community
Meet & Language - EdHack - Chatbots Communitychatbotscommunity
 
LPBots - EdHack - Chatbots Community
LPBots - EdHack - Chatbots CommunityLPBots - EdHack - Chatbots Community
LPBots - EdHack - Chatbots Communitychatbotscommunity
 
Life.Film - EdHack - Chatbots Community
Life.Film - EdHack - Chatbots CommunityLife.Film - EdHack - Chatbots Community
Life.Film - EdHack - Chatbots Communitychatbotscommunity
 
Lexi Bot - EdHack - Chatbots Community
Lexi Bot - EdHack - Chatbots CommunityLexi Bot - EdHack - Chatbots Community
Lexi Bot - EdHack - Chatbots Communitychatbotscommunity
 
IamZlatan - EdHack - Chatbots Community
IamZlatan - EdHack - Chatbots CommunityIamZlatan - EdHack - Chatbots Community
IamZlatan - EdHack - Chatbots Communitychatbotscommunity
 
Five Lakes - EdHack - Chatbots Community
Five Lakes - EdHack - Chatbots CommunityFive Lakes - EdHack - Chatbots Community
Five Lakes - EdHack - Chatbots Communitychatbotscommunity
 
Data Union - EdHack - Chatbots Community
Data Union - EdHack - Chatbots CommunityData Union - EdHack - Chatbots Community
Data Union - EdHack - Chatbots Communitychatbotscommunity
 

More from chatbotscommunity (20)

WaveRider - Misis Hackathon
WaveRider - Misis HackathonWaveRider - Misis Hackathon
WaveRider - Misis Hackathon
 
Павел Доронин "9 грехов разработчиков чат-ботов" - EdHack
Павел Доронин "9 грехов разработчиков чат-ботов" - EdHackПавел Доронин "9 грехов разработчиков чат-ботов" - EdHack
Павел Доронин "9 грехов разработчиков чат-ботов" - EdHack
 
Виктор Сафронов "Тематическое моделирование" - EdHack
Виктор Сафронов "Тематическое моделирование" - EdHackВиктор Сафронов "Тематическое моделирование" - EdHack
Виктор Сафронов "Тематическое моделирование" - EdHack
 
Александр Белоцерковский "Microsoft Bot Framework" - EdHack
Александр Белоцерковский "Microsoft Bot Framework" - EdHackАлександр Белоцерковский "Microsoft Bot Framework" - EdHack
Александр Белоцерковский "Microsoft Bot Framework" - EdHack
 
Артемий Малков "Суперметодики обучения" - EdHack
Артемий Малков "Суперметодики обучения" - EdHackАртемий Малков "Суперметодики обучения" - EdHack
Артемий Малков "Суперметодики обучения" - EdHack
 
Вводная хакатона - EdHack
Вводная хакатона - EdHackВводная хакатона - EdHack
Вводная хакатона - EdHack
 
Вводная Конференции - EdHack
Вводная Конференции - EdHackВводная Конференции - EdHack
Вводная Конференции - EdHack
 
Zoo - EdHack - Chatbots Community
Zoo - EdHack - Chatbots CommunityZoo - EdHack - Chatbots Community
Zoo - EdHack - Chatbots Community
 
WaveRider - EdHack - Chatbots Community
WaveRider - EdHack - Chatbots CommunityWaveRider - EdHack - Chatbots Community
WaveRider - EdHack - Chatbots Community
 
Symmetrical-potato - EdHack - Chatbots Community
Symmetrical-potato - EdHack - Chatbots CommunitySymmetrical-potato - EdHack - Chatbots Community
Symmetrical-potato - EdHack - Chatbots Community
 
Spellobot - EdHack - Chatbots Community
Spellobot - EdHack - Chatbots CommunitySpellobot - EdHack - Chatbots Community
Spellobot - EdHack - Chatbots Community
 
RSK-K161 - EdHack - Chatbots Community
RSK-K161 - EdHack - Chatbots CommunityRSK-K161 - EdHack - Chatbots Community
RSK-K161 - EdHack - Chatbots Community
 
OleggBankBot - EdHack - Chatbots Community
OleggBankBot - EdHack - Chatbots CommunityOleggBankBot - EdHack - Chatbots Community
OleggBankBot - EdHack - Chatbots Community
 
Meet & Language - EdHack - Chatbots Community
Meet & Language - EdHack - Chatbots CommunityMeet & Language - EdHack - Chatbots Community
Meet & Language - EdHack - Chatbots Community
 
LPBots - EdHack - Chatbots Community
LPBots - EdHack - Chatbots CommunityLPBots - EdHack - Chatbots Community
LPBots - EdHack - Chatbots Community
 
Life.Film - EdHack - Chatbots Community
Life.Film - EdHack - Chatbots CommunityLife.Film - EdHack - Chatbots Community
Life.Film - EdHack - Chatbots Community
 
Lexi Bot - EdHack - Chatbots Community
Lexi Bot - EdHack - Chatbots CommunityLexi Bot - EdHack - Chatbots Community
Lexi Bot - EdHack - Chatbots Community
 
IamZlatan - EdHack - Chatbots Community
IamZlatan - EdHack - Chatbots CommunityIamZlatan - EdHack - Chatbots Community
IamZlatan - EdHack - Chatbots Community
 
Five Lakes - EdHack - Chatbots Community
Five Lakes - EdHack - Chatbots CommunityFive Lakes - EdHack - Chatbots Community
Five Lakes - EdHack - Chatbots Community
 
Data Union - EdHack - Chatbots Community
Data Union - EdHack - Chatbots CommunityData Union - EdHack - Chatbots Community
Data Union - EdHack - Chatbots Community
 

#3 Global AI Meetup (NLP) - Михаил Бурцев, DeepHackLab

  • 1. DEEP NEURAL LANGUAGE PROCESSING Михаил Бурцев, к.ф.-м.н., зав. лаб. «Нейронных сетей и глубокого обучения» МФТИ
  • 2. Фундаментальная цель – Прикладная цель - Понять природу человека Получить помощника • ЧТО ТАКОЕ ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ (ИИ)?
  • 3. ДВА ПУТИ Нейроны передают электрические сигналы мозг можно смоделировать электрической схемой искусственные нейронные сети Человеческий интеллект основан на манипуляции с символами компьютер совершает манипуляции с символами искусственный интеллект
  • 4. ЭВОЛЮЦИЯ ИИ • Классификация огромных массивов изображений и видео. • Google и Facebook охотятся за головами ученых занимающихся нейронными сетями. • Нейросети учатся играть в игры по картинке. deep learning
  • 5. ЧТО ТАКОЕ ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ И ГЛУБОКОЕ ОБУЧЕНИЕ?
  • 6. • Активность нейрона определяется преобразованием взвешенного суммарного воздействия на него • Воздействия могут быть активирующими (положительные веса) или тормозными (отрицательные веса) ИСКУССТВЕННЫЙ НЕЙРОН
  • 7. • Искусственная нейронная сеть (ИНС) является концептуальной моделью биологической нейронной сети • Состоит из элементов, влияющих на активность друг друга • Основные свойства – надежность – по мере ухудшения качества входа, удалении связей или элементов эффективность сети снижается постепенно – гибкость – ИНС могут быть применены в широком круге задач – генерализация – достаточно обучения на ограниченной выборке – ассоциативность памяти ИСКУССТВЕННАЯ НЕЙРОНАЯ СЕТЬ
  • 8. • Обучение нейросети происходит за счет изменения весов БАЗОВЫЕ ПОНЯТИЯ
  • 9. ЧТО ТАКОЕ ГЛУБОКОЕ ОБУЧЕНИЕ? DEEP LEARNING = NEURAL NETS +BIG DATA + GPU
  • 10. ВИДЕТЬ ПОНИМАТЬ ДЕЙСТВОВАТЬ СОВРЕМЕННЫЕ НАПРАВЛЕНИЯ ИССЛЕДОВАНИЙ В ОБЛАСТИ ГЛУБОКОГО ОБУЧЕНИЯ
  • 11. РЕКУРРЕНТНЫЕ НЕЙРОННЫЕ СЕТИ задача предсказания временных рядов архитектура рекуррентной сети LSTM ячейка примеры приложений в области работы с текстом
  • 12. • «Классические» нейронные сети – сети прямого распространения (feedforward network) не обладают памятью. • «Активации» проходят всю сеть насквозь. • Нейросети «с памятью» – рекуррентные сети. • За счет наличия обратных связей «активации» циркулируют в сети. В ПОИСКАХ ПАМЯТИ сеть прямого распространения рекуррентная сеть
  • 15.
  • 16. Алиса теперь счастлива. Она не говорит, что это так. Она в опасности. Она выглядит прекрасно. Она была на концерте Фаллуджи. Я знаю, что она влюблена в него. Она великолепна. Она принесла нам немного воды. Она ведьма. А когда она говорит: "Я не говорю, что когда она позвонит" И когда она вернётся, я поняла, Алиса попала в беду. И все же так обожает. Ты не нашел ее? Она изменила свою жизнь. . ♪ К кому она придумала это? ♪ Да, да. Она не умеет жить. А она не знает, кто ты? Я видела в ней все свои приключения. Вот она вот и все. Она не собирается никого убивать. Джон теперь счастлив. Спасибо. Да, на дворе 800 фунтов на каждом месте преступления в 1000 тысяч градусов по матче. Он в самом деле собирается позволить себе просто бросить все на свои места. Да, я тоже так думал. Я не знаю, что в нем Джон попал в беду. • Сверхъестественное: Ваша честь, это был не мы. • И все они возвращаются в Вашингтон. • Он был не таким, как было в прошлом году • Придурок! • Свиньи собираются в Старлинг Сити. • Он был в отчаянии. • Вот что я вам скажу. • И когда он вернулся, я выбросил его в офис. • Я тоже хотел это сделать.
  • 17. РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ Около 25% всех сообщений электронной почты содержат менее 20 токенов. Kannan, A., Kurach, K., Ravi, S., Kaufmann, T., Tomkins, A., Miklos, B., ... & Ramavajjala, V. (2016). Smart Reply: Automated Response Suggestion for Email. In Proceedings of the ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD)} (Vol. 36, pp. 495-503).
  • 18. РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ Внутреннее представление вопроса
  • 19. РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ Вызовы: • Качество • недопустимость некачественных ответов • Полезность • необходимо максимизировать использования сервиса • Масштабируемость • миллионы сообщений в день • Приватность • должна использоваться только агрегированная статистика
  • 20. РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ Предобработка
  • 21. РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ Триггер ответа - сеть прямого распространения с 3 слоями; - на вход подаются векторные представления темы и содержания, а также дополнительная информация (наличие отправителя в адресной книге, наличие прочитанных писем от него); - обучающая выборка состоит из писем двух категорий – был ответ с мобильного устройства или нет; - в результате 10% сообщений классифицируются, как требующие ответа.
  • 22. РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ Выбор ответа - LSTM сеть - на вход подается векторное представление последовательности токенов; - выход последовательность токенов ответа; - при декодировании ответа используются токены только из разрешенных ответов.
  • 23. РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ Множество разрешенных ответов - выбор «канонических ответов» - “Thanks for your kind update.”, “Thank you for updating!”, “Thanks for the status update.” - кластеризация по намерению - “Ha ha”, “lol” and “Oh that’s funny!” are associated with the funny cluster
  • 24. РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ Диверсификация кандидатных ответов - только один кандидат из кластера - обязательное присутвие, как «позитивных», так и «негативных» ответов
  • 25. РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation https://arxiv.org/abs/1609.08144 , Mon, 26 Sep 2016 Google's Neural Machine Translation System
  • 26. РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation https://arxiv.org/abs/1609.08144 , Mon, 26 Sep 2016 Проблема: Затухающие градиенты - Решение:Residual connections
  • 27. РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation https://arxiv.org/abs/1609.08144 , Mon, 26 Sep 2016 Проблема: Затухающий сигнал - Решение: Двунаправленное кодирование
  • 28. РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation https://arxiv.org/abs/1609.08144 , Mon, 26 Sep 2016
  • 29. от BIG DATA к DEEP LEARNING глубокое обучение делает большие данные осмысленными