SlideShare a Scribd company logo
1 of 15
Download to read offline
Через грабли - к чат-ботам:
технологии, эвристики и жестокая
реальность
О чем расскажу
 Технологии – это круто (но про них и без меня расскажут)
 Эвристики – это не так круто, но без них не обойтись
 Данные – это больно
Дисклеймер: презентацию делал ночью и уставший 
Технологии NLP
Чаще:
 Базовая подготовка (токенизация, удаление знаков препинания и стоп-
слов, приведение к одному регистру)
 Морфологический анализ (чаще всего – лемматизация, частеречное
тегирование)
 Исправление опечаток (а вот тут косяк)
 Выделение ключевых слов/(именованных) сущностей (для goal-oriented-
ботов)
Реже:
 Синтаксический анализ (SyntaxNet же!)
 Тематическое моделирование
 Анализ тональности
 Реферирование и аннотирование
 Выделение значимых частей текста
Технологии ML
Правила-шаблоны-ключевики
Классические алгоритмы (статистические)
Дистрибутивная семантика (все-что-угодно2vec)
Глубинное/глубокое обучение
 Скоринговые модели (извлекающие)
 Генеративные модели (порождающие)
Всякие гибриды
Инструменты
NLP
 Apache OpenNLP, NLTK, АОТ
 api.ai, wit.ai
 AlchemyAPI
Машинное обучение + глубинное обучение
 Gensim, scikit-learn
 TensorFlow, Keras, Theano, Torch, Caffe, Deeplearning4j
 Тысячи их!
Фреймворки для создания чат-ботов
 Microsoft Bot Framework,
 Pandorabots, Synthetic Intelligence Network,
 Chatfuel, Botkit, Errbot, Hubot, DialTech
 Десятки их!
Факторы успеха
 Алгоритмы всем известны
 Сделать модельку могут многие (даже я!)
 Грабли
 Как заменять у бота ответы без переобучения модели?
 Как сделать боту стабильную личность?
 Знание доменных областей (банки, биржи, телеком)
 Особенности процессов
 Особенности принятия решений
 Функциональное продакшн-решение
 Возможности кастомизации
 Интеграция, оптимизация, большая нагрузка
 Универсальное решение для всех из коробки - маловероятно
Эвристики
Выделение значимых для ответа частей из запроса
• Знаки препинания?
• Части речи?
• Ключевые слова?
• Обучаем модель?
Обработка сложного запроса из нескольких вопросов
• Знаки препинания?
• Графические признаки?
• Обучаем модель?
Правильная обработка отрицаний
• Склеиваем отрицание со значимым словом?
• Игнорируем отрицания?
• Учитываем отрицания как значимое слово?
Работа с неизвестными для модели значимыми словами
Определение и фильтрация бреда
Разрешение анафоры в диалоге
Данные в мире розовых
пони
Реальные данные
Максимально дурацкий формат
• Фотографии сканов экселевских таблиц
Люди неграмотные и не знают, чего хотят
• Скожит мой автамабел утелезерованн нет что
Данных мало
• Или еще хуже, очень много
Данные грязные до ужаса
• Ошибки форматирования
• Неправильные ответы
• Неправильная разметка
Данные нерепрезентативные
• Плохо представлены редкие категории
Что делать?
• Снимать штаны и бегать (опционально)
• Смириться с жестокостью жизни (рекомендуется)
• Иметь вспомогательные скрипты для работы с самыми частотными
форматами
• Иметь вспомогательные скрипты для очистки данных
• Иметь вспомогательные скрипты для быстрого анализа данных или
уметь быстро глазами определять их пригодность
• Иметь domain-specific наработки на случай отсутствия данных
• Иметь автотестер для получившейся модели
• Дообучаться в процессе работы
Кейс автоматизации
Кто:
• Компания, которая выдает займы
Проблема:
• На почту приходят письма с вопросами в больших количествах, операторы не
справляются (да и не спешат особо), некоторые письма висят по несколько дней,
клиенты недовольны
Изначальный процесс:
• Читать письмо
• Пытаться понять, о чем оно (это непросто!)
• Поставить категорию письма из выпадающего списка (это тоже непросто)
• Найти в скриптах для операторов подходящий ответ (это лениво)
Кейс автоматизации
Самостоятельная попытка автоматизации:
• Ключевые слова, конечно же. Стало проще, но не сильно.
Решение:
• Рекомендательная система для операторов с возможностью автоответа
пользователям
На входе:
• Вопрос клиента
На выходе:
• Категория вопроса
• Наиболее вероятный ответ
• Степень уверенности в ответе
Кейс автоматизации
Как делали:
• Анализ и обработка вопросов
• Обучение модели
• Тестирование модели
• Доработка модели
Какие были данные:
• Неправильно категоризированные вопросы (операторы халтурщики)
• Неинтерпретируемые вопросы
• Нерелевантные ответы на вопросы (прям как-то много!)
• Маньяцкий формат данных (архив с архивами с битыми JSON)
• Неравномерное распределение категорий вопросов
по набору данных (классика!)
Немного о DialTech
• Платформа для разработки чат-ботов и управления ими (админка,
переключение на оператора, WoZ, вот это вот всё)
• Свой NLP-движок (куда ж без этого!)
• Есть API
• Базовая интеграция со всеми основными мессенджерами и HelpDesk
(Usedesk, Zendesk, вот это вот всё)
• Возможность быстро интегрироваться почти с чем угодно
Немножко обо мне
https://www.facebook.com/nnikitinsky
nlpx.net
В LinkedIn меня тоже можно найти:
Nikita Nikitinsky

More Related Content

Viewers also liked

Join #1 Global Chatbots Hackathon with Webinar.ru
Join #1 Global Chatbots Hackathon with Webinar.ruJoin #1 Global Chatbots Hackathon with Webinar.ru
Join #1 Global Chatbots Hackathon with Webinar.ruchatbotscommunity
 
Chatbots Сommunity 3 Months Dynamics
Chatbots Сommunity 3 Months DynamicsChatbots Сommunity 3 Months Dynamics
Chatbots Сommunity 3 Months Dynamicschatbotscommunity
 
How to find AI community meetups in Digital October
How to find AI community meetups in Digital OctoberHow to find AI community meetups in Digital October
How to find AI community meetups in Digital Octoberchatbotscommunity
 
1-ый в России бизнес-тренинг по чат-ботам (выжимка)
1-ый в России бизнес-тренинг по чат-ботам (выжимка)1-ый в России бизнес-тренинг по чат-ботам (выжимка)
1-ый в России бизнес-тренинг по чат-ботам (выжимка)chatbotscommunity
 
Подход к разработке чат-ботов в wobot.me
Подход к разработке чат-ботов в wobot.meПодход к разработке чат-ботов в wobot.me
Подход к разработке чат-ботов в wobot.mechatbotscommunity
 
How to integrate chatbot into your business?
How to integrate chatbot into your business?How to integrate chatbot into your business?
How to integrate chatbot into your business?chatbotscommunity
 
SKOLKOVO.AI конференция 14 ноября 2016
SKOLKOVO.AI конференция 14 ноября 2016SKOLKOVO.AI конференция 14 ноября 2016
SKOLKOVO.AI конференция 14 ноября 2016Skolkovo Robotics Center
 
Сергей Шумский. Дорожная карта развития направления нейроассистенты
Сергей Шумский. Дорожная карта развития направления нейроассистентыСергей Шумский. Дорожная карта развития направления нейроассистенты
Сергей Шумский. Дорожная карта развития направления нейроассистентыSkolkovo Robotics Center
 
Поиск частых множеств признаков (товаров) и ассоциативные правила
Поиск частых множеств признаков (товаров) и ассоциативные правилаПоиск частых множеств признаков (товаров) и ассоциативные правила
Поиск частых множеств признаков (товаров) и ассоциативные правилаDmitrii Ignatov
 
Maxim Kamensky - Applying image matching algorithms to video recognition and ...
Maxim Kamensky - Applying image matching algorithms to video recognition and ...Maxim Kamensky - Applying image matching algorithms to video recognition and ...
Maxim Kamensky - Applying image matching algorithms to video recognition and ...Eastern European Computer Vision Conference
 
Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...
Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...
Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...Eastern European Computer Vision Conference
 
Александр Савостьянов "Чат-боты в образовании" - EdHack
Александр Савостьянов "Чат-боты в образовании" - EdHackАлександр Савостьянов "Чат-боты в образовании" - EdHack
Александр Савостьянов "Чат-боты в образовании" - EdHackchatbotscommunity
 
Моряк Папай - Muzis Hackathon
Моряк Папай - Muzis HackathonМоряк Папай - Muzis Hackathon
Моряк Папай - Muzis Hackathonchatbotscommunity
 

Viewers also liked (19)

Join #1 Global Chatbots Hackathon with Webinar.ru
Join #1 Global Chatbots Hackathon with Webinar.ruJoin #1 Global Chatbots Hackathon with Webinar.ru
Join #1 Global Chatbots Hackathon with Webinar.ru
 
Chatbots Сommunity 3 Months Dynamics
Chatbots Сommunity 3 Months DynamicsChatbots Сommunity 3 Months Dynamics
Chatbots Сommunity 3 Months Dynamics
 
How to find AI community meetups in Digital October
How to find AI community meetups in Digital OctoberHow to find AI community meetups in Digital October
How to find AI community meetups in Digital October
 
1-ый в России бизнес-тренинг по чат-ботам (выжимка)
1-ый в России бизнес-тренинг по чат-ботам (выжимка)1-ый в России бизнес-тренинг по чат-ботам (выжимка)
1-ый в России бизнес-тренинг по чат-ботам (выжимка)
 
Подход к разработке чат-ботов в wobot.me
Подход к разработке чат-ботов в wobot.meПодход к разработке чат-ботов в wobot.me
Подход к разработке чат-ботов в wobot.me
 
How to integrate chatbot into your business?
How to integrate chatbot into your business?How to integrate chatbot into your business?
How to integrate chatbot into your business?
 
SKOLKOVO.AI конференция 14 ноября 2016
SKOLKOVO.AI конференция 14 ноября 2016SKOLKOVO.AI конференция 14 ноября 2016
SKOLKOVO.AI конференция 14 ноября 2016
 
Сергей Шумский. Дорожная карта развития направления нейроассистенты
Сергей Шумский. Дорожная карта развития направления нейроассистентыСергей Шумский. Дорожная карта развития направления нейроассистенты
Сергей Шумский. Дорожная карта развития направления нейроассистенты
 
Taras Chaykivskyy - Computer Vision in Front-End
Taras Chaykivskyy - Computer Vision in Front-EndTaras Chaykivskyy - Computer Vision in Front-End
Taras Chaykivskyy - Computer Vision in Front-End
 
Eugene Khvedchenia - Image processing using FPGAs
Eugene Khvedchenia - Image processing using FPGAsEugene Khvedchenia - Image processing using FPGAs
Eugene Khvedchenia - Image processing using FPGAs
 
Andrii Babii - Application of fuzzy transform to image fusion
Andrii Babii - Application of fuzzy transform to image fusion Andrii Babii - Application of fuzzy transform to image fusion
Andrii Babii - Application of fuzzy transform to image fusion
 
Поиск частых множеств признаков (товаров) и ассоциативные правила
Поиск частых множеств признаков (товаров) и ассоциативные правилаПоиск частых множеств признаков (товаров) и ассоциативные правила
Поиск частых множеств признаков (товаров) и ассоциативные правила
 
Maxim Kamensky - Applying image matching algorithms to video recognition and ...
Maxim Kamensky - Applying image matching algorithms to video recognition and ...Maxim Kamensky - Applying image matching algorithms to video recognition and ...
Maxim Kamensky - Applying image matching algorithms to video recognition and ...
 
Michael Norel - High Accuracy Camera Calibration
Michael Norel - High Accuracy Camera Calibration Michael Norel - High Accuracy Camera Calibration
Michael Norel - High Accuracy Camera Calibration
 
Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...
Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...
Viktor Sdobnikov - Computer Vision for Advanced Driver Assistance Systems (AD...
 
Semantic evaluation on Dialog 2015
Semantic evaluation on Dialog 2015Semantic evaluation on Dialog 2015
Semantic evaluation on Dialog 2015
 
Learning by Analogy
Learning by AnalogyLearning by Analogy
Learning by Analogy
 
Александр Савостьянов "Чат-боты в образовании" - EdHack
Александр Савостьянов "Чат-боты в образовании" - EdHackАлександр Савостьянов "Чат-боты в образовании" - EdHack
Александр Савостьянов "Чат-боты в образовании" - EdHack
 
Моряк Папай - Muzis Hackathon
Моряк Папай - Muzis HackathonМоряк Папай - Muzis Hackathon
Моряк Папай - Muzis Hackathon
 

More from chatbotscommunity

Павел Доронин "9 грехов разработчиков чат-ботов" - EdHack
Павел Доронин "9 грехов разработчиков чат-ботов" - EdHackПавел Доронин "9 грехов разработчиков чат-ботов" - EdHack
Павел Доронин "9 грехов разработчиков чат-ботов" - EdHackchatbotscommunity
 
Виктор Сафронов "Тематическое моделирование" - EdHack
Виктор Сафронов "Тематическое моделирование" - EdHackВиктор Сафронов "Тематическое моделирование" - EdHack
Виктор Сафронов "Тематическое моделирование" - EdHackchatbotscommunity
 
Александр Белоцерковский "Microsoft Bot Framework" - EdHack
Александр Белоцерковский "Microsoft Bot Framework" - EdHackАлександр Белоцерковский "Microsoft Bot Framework" - EdHack
Александр Белоцерковский "Microsoft Bot Framework" - EdHackchatbotscommunity
 
Артемий Малков "Суперметодики обучения" - EdHack
Артемий Малков "Суперметодики обучения" - EdHackАртемий Малков "Суперметодики обучения" - EdHack
Артемий Малков "Суперметодики обучения" - EdHackchatbotscommunity
 
Вводная хакатона - EdHack
Вводная хакатона - EdHackВводная хакатона - EdHack
Вводная хакатона - EdHackchatbotscommunity
 
Вводная Конференции - EdHack
Вводная Конференции - EdHackВводная Конференции - EdHack
Вводная Конференции - EdHackchatbotscommunity
 
Zoo - EdHack - Chatbots Community
Zoo - EdHack - Chatbots CommunityZoo - EdHack - Chatbots Community
Zoo - EdHack - Chatbots Communitychatbotscommunity
 
WaveRider - EdHack - Chatbots Community
WaveRider - EdHack - Chatbots CommunityWaveRider - EdHack - Chatbots Community
WaveRider - EdHack - Chatbots Communitychatbotscommunity
 
Symmetrical-potato - EdHack - Chatbots Community
Symmetrical-potato - EdHack - Chatbots CommunitySymmetrical-potato - EdHack - Chatbots Community
Symmetrical-potato - EdHack - Chatbots Communitychatbotscommunity
 
Spellobot - EdHack - Chatbots Community
Spellobot - EdHack - Chatbots CommunitySpellobot - EdHack - Chatbots Community
Spellobot - EdHack - Chatbots Communitychatbotscommunity
 
RSK-K161 - EdHack - Chatbots Community
RSK-K161 - EdHack - Chatbots CommunityRSK-K161 - EdHack - Chatbots Community
RSK-K161 - EdHack - Chatbots Communitychatbotscommunity
 
OleggBankBot - EdHack - Chatbots Community
OleggBankBot - EdHack - Chatbots CommunityOleggBankBot - EdHack - Chatbots Community
OleggBankBot - EdHack - Chatbots Communitychatbotscommunity
 
Meet & Language - EdHack - Chatbots Community
Meet & Language - EdHack - Chatbots CommunityMeet & Language - EdHack - Chatbots Community
Meet & Language - EdHack - Chatbots Communitychatbotscommunity
 
LPBots - EdHack - Chatbots Community
LPBots - EdHack - Chatbots CommunityLPBots - EdHack - Chatbots Community
LPBots - EdHack - Chatbots Communitychatbotscommunity
 
Life.Film - EdHack - Chatbots Community
Life.Film - EdHack - Chatbots CommunityLife.Film - EdHack - Chatbots Community
Life.Film - EdHack - Chatbots Communitychatbotscommunity
 
Lexi Bot - EdHack - Chatbots Community
Lexi Bot - EdHack - Chatbots CommunityLexi Bot - EdHack - Chatbots Community
Lexi Bot - EdHack - Chatbots Communitychatbotscommunity
 
IamZlatan - EdHack - Chatbots Community
IamZlatan - EdHack - Chatbots CommunityIamZlatan - EdHack - Chatbots Community
IamZlatan - EdHack - Chatbots Communitychatbotscommunity
 
Five Lakes - EdHack - Chatbots Community
Five Lakes - EdHack - Chatbots CommunityFive Lakes - EdHack - Chatbots Community
Five Lakes - EdHack - Chatbots Communitychatbotscommunity
 
Data Union - EdHack - Chatbots Community
Data Union - EdHack - Chatbots CommunityData Union - EdHack - Chatbots Community
Data Union - EdHack - Chatbots Communitychatbotscommunity
 

More from chatbotscommunity (20)

WaveRider - Misis Hackathon
WaveRider - Misis HackathonWaveRider - Misis Hackathon
WaveRider - Misis Hackathon
 
Павел Доронин "9 грехов разработчиков чат-ботов" - EdHack
Павел Доронин "9 грехов разработчиков чат-ботов" - EdHackПавел Доронин "9 грехов разработчиков чат-ботов" - EdHack
Павел Доронин "9 грехов разработчиков чат-ботов" - EdHack
 
Виктор Сафронов "Тематическое моделирование" - EdHack
Виктор Сафронов "Тематическое моделирование" - EdHackВиктор Сафронов "Тематическое моделирование" - EdHack
Виктор Сафронов "Тематическое моделирование" - EdHack
 
Александр Белоцерковский "Microsoft Bot Framework" - EdHack
Александр Белоцерковский "Microsoft Bot Framework" - EdHackАлександр Белоцерковский "Microsoft Bot Framework" - EdHack
Александр Белоцерковский "Microsoft Bot Framework" - EdHack
 
Артемий Малков "Суперметодики обучения" - EdHack
Артемий Малков "Суперметодики обучения" - EdHackАртемий Малков "Суперметодики обучения" - EdHack
Артемий Малков "Суперметодики обучения" - EdHack
 
Вводная хакатона - EdHack
Вводная хакатона - EdHackВводная хакатона - EdHack
Вводная хакатона - EdHack
 
Вводная Конференции - EdHack
Вводная Конференции - EdHackВводная Конференции - EdHack
Вводная Конференции - EdHack
 
Zoo - EdHack - Chatbots Community
Zoo - EdHack - Chatbots CommunityZoo - EdHack - Chatbots Community
Zoo - EdHack - Chatbots Community
 
WaveRider - EdHack - Chatbots Community
WaveRider - EdHack - Chatbots CommunityWaveRider - EdHack - Chatbots Community
WaveRider - EdHack - Chatbots Community
 
Symmetrical-potato - EdHack - Chatbots Community
Symmetrical-potato - EdHack - Chatbots CommunitySymmetrical-potato - EdHack - Chatbots Community
Symmetrical-potato - EdHack - Chatbots Community
 
Spellobot - EdHack - Chatbots Community
Spellobot - EdHack - Chatbots CommunitySpellobot - EdHack - Chatbots Community
Spellobot - EdHack - Chatbots Community
 
RSK-K161 - EdHack - Chatbots Community
RSK-K161 - EdHack - Chatbots CommunityRSK-K161 - EdHack - Chatbots Community
RSK-K161 - EdHack - Chatbots Community
 
OleggBankBot - EdHack - Chatbots Community
OleggBankBot - EdHack - Chatbots CommunityOleggBankBot - EdHack - Chatbots Community
OleggBankBot - EdHack - Chatbots Community
 
Meet & Language - EdHack - Chatbots Community
Meet & Language - EdHack - Chatbots CommunityMeet & Language - EdHack - Chatbots Community
Meet & Language - EdHack - Chatbots Community
 
LPBots - EdHack - Chatbots Community
LPBots - EdHack - Chatbots CommunityLPBots - EdHack - Chatbots Community
LPBots - EdHack - Chatbots Community
 
Life.Film - EdHack - Chatbots Community
Life.Film - EdHack - Chatbots CommunityLife.Film - EdHack - Chatbots Community
Life.Film - EdHack - Chatbots Community
 
Lexi Bot - EdHack - Chatbots Community
Lexi Bot - EdHack - Chatbots CommunityLexi Bot - EdHack - Chatbots Community
Lexi Bot - EdHack - Chatbots Community
 
IamZlatan - EdHack - Chatbots Community
IamZlatan - EdHack - Chatbots CommunityIamZlatan - EdHack - Chatbots Community
IamZlatan - EdHack - Chatbots Community
 
Five Lakes - EdHack - Chatbots Community
Five Lakes - EdHack - Chatbots CommunityFive Lakes - EdHack - Chatbots Community
Five Lakes - EdHack - Chatbots Community
 
Data Union - EdHack - Chatbots Community
Data Union - EdHack - Chatbots CommunityData Union - EdHack - Chatbots Community
Data Union - EdHack - Chatbots Community
 

#3 Global AI Meetup (NLP) - Никита Никитинский, DialTech

  • 1. Через грабли - к чат-ботам: технологии, эвристики и жестокая реальность
  • 2. О чем расскажу  Технологии – это круто (но про них и без меня расскажут)  Эвристики – это не так круто, но без них не обойтись  Данные – это больно Дисклеймер: презентацию делал ночью и уставший 
  • 3. Технологии NLP Чаще:  Базовая подготовка (токенизация, удаление знаков препинания и стоп- слов, приведение к одному регистру)  Морфологический анализ (чаще всего – лемматизация, частеречное тегирование)  Исправление опечаток (а вот тут косяк)  Выделение ключевых слов/(именованных) сущностей (для goal-oriented- ботов) Реже:  Синтаксический анализ (SyntaxNet же!)  Тематическое моделирование  Анализ тональности  Реферирование и аннотирование  Выделение значимых частей текста
  • 4. Технологии ML Правила-шаблоны-ключевики Классические алгоритмы (статистические) Дистрибутивная семантика (все-что-угодно2vec) Глубинное/глубокое обучение  Скоринговые модели (извлекающие)  Генеративные модели (порождающие) Всякие гибриды
  • 5. Инструменты NLP  Apache OpenNLP, NLTK, АОТ  api.ai, wit.ai  AlchemyAPI Машинное обучение + глубинное обучение  Gensim, scikit-learn  TensorFlow, Keras, Theano, Torch, Caffe, Deeplearning4j  Тысячи их! Фреймворки для создания чат-ботов  Microsoft Bot Framework,  Pandorabots, Synthetic Intelligence Network,  Chatfuel, Botkit, Errbot, Hubot, DialTech  Десятки их!
  • 6. Факторы успеха  Алгоритмы всем известны  Сделать модельку могут многие (даже я!)  Грабли  Как заменять у бота ответы без переобучения модели?  Как сделать боту стабильную личность?  Знание доменных областей (банки, биржи, телеком)  Особенности процессов  Особенности принятия решений  Функциональное продакшн-решение  Возможности кастомизации  Интеграция, оптимизация, большая нагрузка  Универсальное решение для всех из коробки - маловероятно
  • 7. Эвристики Выделение значимых для ответа частей из запроса • Знаки препинания? • Части речи? • Ключевые слова? • Обучаем модель? Обработка сложного запроса из нескольких вопросов • Знаки препинания? • Графические признаки? • Обучаем модель? Правильная обработка отрицаний • Склеиваем отрицание со значимым словом? • Игнорируем отрицания? • Учитываем отрицания как значимое слово? Работа с неизвестными для модели значимыми словами Определение и фильтрация бреда Разрешение анафоры в диалоге
  • 8. Данные в мире розовых пони
  • 9. Реальные данные Максимально дурацкий формат • Фотографии сканов экселевских таблиц Люди неграмотные и не знают, чего хотят • Скожит мой автамабел утелезерованн нет что Данных мало • Или еще хуже, очень много Данные грязные до ужаса • Ошибки форматирования • Неправильные ответы • Неправильная разметка Данные нерепрезентативные • Плохо представлены редкие категории
  • 10. Что делать? • Снимать штаны и бегать (опционально) • Смириться с жестокостью жизни (рекомендуется) • Иметь вспомогательные скрипты для работы с самыми частотными форматами • Иметь вспомогательные скрипты для очистки данных • Иметь вспомогательные скрипты для быстрого анализа данных или уметь быстро глазами определять их пригодность • Иметь domain-specific наработки на случай отсутствия данных • Иметь автотестер для получившейся модели • Дообучаться в процессе работы
  • 11. Кейс автоматизации Кто: • Компания, которая выдает займы Проблема: • На почту приходят письма с вопросами в больших количествах, операторы не справляются (да и не спешат особо), некоторые письма висят по несколько дней, клиенты недовольны Изначальный процесс: • Читать письмо • Пытаться понять, о чем оно (это непросто!) • Поставить категорию письма из выпадающего списка (это тоже непросто) • Найти в скриптах для операторов подходящий ответ (это лениво)
  • 12. Кейс автоматизации Самостоятельная попытка автоматизации: • Ключевые слова, конечно же. Стало проще, но не сильно. Решение: • Рекомендательная система для операторов с возможностью автоответа пользователям На входе: • Вопрос клиента На выходе: • Категория вопроса • Наиболее вероятный ответ • Степень уверенности в ответе
  • 13. Кейс автоматизации Как делали: • Анализ и обработка вопросов • Обучение модели • Тестирование модели • Доработка модели Какие были данные: • Неправильно категоризированные вопросы (операторы халтурщики) • Неинтерпретируемые вопросы • Нерелевантные ответы на вопросы (прям как-то много!) • Маньяцкий формат данных (архив с архивами с битыми JSON) • Неравномерное распределение категорий вопросов по набору данных (классика!)
  • 14. Немного о DialTech • Платформа для разработки чат-ботов и управления ими (админка, переключение на оператора, WoZ, вот это вот всё) • Свой NLP-движок (куда ж без этого!) • Есть API • Базовая интеграция со всеми основными мессенджерами и HelpDesk (Usedesk, Zendesk, вот это вот всё) • Возможность быстро интегрироваться почти с чем угодно
  • 15. Немножко обо мне https://www.facebook.com/nnikitinsky nlpx.net В LinkedIn меня тоже можно найти: Nikita Nikitinsky