Эксплуатация ML в Почте Mail.ru

Эксплуатация ML
в Почте Mail.ru
Tyantov Eduard

чеки
из интернет-
магазинов
билеты
на самолёты
брони
отелей
уведомления
от «Госуслуг»
выписки
из банков
уведомления
о штрафах
результаты
медицинских
анализов
записи
к врачам

Группировка писем
из интернет-магазинов
До

Группировка писем
из интернет-магазинов
После

Антифишинг на лого

– 1.5B писем в сутки
– 30М+ DAU
– ~30 ML систем
Цифры

Rejected
Spam
Все
письма
рассылки

Куча систем
это
Куча эксплуатации

Деградация моделей
Причины
1. Постепенная деградация софта

Причины
2. Естественная эволюция данных

Причины
2. Естественная эволюция данных
3. Gaming/adversary

1. Поддержка системы дорогая
2. Чем быстрее меняется среда, тем ее больше
Высокие косты => Автоматизация
Эксплуатация

AutoML
Что можно автоматизировать
– Сбор данных
– Дообучение
– Деплой
– Мониторинг

Infrastructure
trumps
Model Complexity
Claim

1. Поддержка моделей свойственна любому
проекту
2. Среда меняется все быстрее
3. Грабли одни и те же
Relatable

Plan
1.Сбор данных
2.Дообучение
3.Maintenance

AutoML
Что можно автоматизировать
– Сбор данных
– Дообучение
– Деплой
– Мониторинг
Feedback Loop

Adversary in Antispam
Адаптация

Adversary in Antispam
1 месяц разработчика vs 4h спамера
Адаптация

Think in advance about Feedback Loop

Why Feedback Loop
– Data is fuel
– People is fuel
– User Feedback

Качество фидбека
– Разное понимание фичи
– Юзерам нельзя верить

По мнению пользователя это не спам

– Разное понимание фичи
– Юзерам нельзя верить
– Возможен Adversary
Вывод
Не годится для обучения

Просев фидбека
ML учит ML
– Фидбек от связанного ML
– Классификатор чистого клика

Классификатор кликов
В почте
– Признаки:
• Юзера
• Отправителя
• Контент
– Precision важнее Recall

Со стороны пользователя
– Пользователю надо как-то жить с ошибками
– Проблема не должна повторяться

Ошибки: решение
Варианты
– Перманентные эвристики per user
– Временные костыли в модели

Эвристики для обучения
Проблема дообучения
– Feedback иногда недостаточно для исправления модели
Решение
– Поток с точной эвристики => модель

Костыли в модели
Процесс
КостыльМодель
данные
Мониторинг
– Дообучение на данных с костыля
• Если больше не фолзит, вырубаем
– Мониторинг срабатывания
– Временный костыль

Эвристики для обучения
Армия костылей полезна
для ваших моделей

Intermediate Recap
1. Думаем про UX
2. Фильтруем фидбек с помощью ML
3. Используем эвристики для дообучения

Дообучение
Текущая выборка
Чистый фидбек
пользователей
Текущая
модель Новая
модель

Проблемы с дообучением
Модель может
– Не поддерживать дообучение
– Ухудшится
– Не предсказуемо измениться
• Создать новые ошибки или вернуть старые

Point
Надо гарантировать улучшение
или хотя бы не ухудшение

Active learning
меняет распределение данных в выборке
0% 100%85%
Не финансы Финансы
Граница принятия решения

Концепция
Цель
– Сохранить прежние паттерны
– Приобретать новые
Преемственность
Старой прод. модели можно верить!

В Почте
– Линейные
– Деревья
– Нейросети
Для каждой свой алгоритм

Линейные модели
• Тренируем на новом сете
𝐿𝑜𝑠𝑠 = 𝑐1 𝐿(𝑋 𝑛𝑒𝑤) + 𝛼 𝜃 𝑛𝑒𝑤
2
• Регуляризуем веса новых признаков

• Контроль метрик на старом
2
+ 𝑐2 𝐿(𝑋 𝑜𝑙𝑑)

• Harmonic regularization
– веса старых признаков не сильно отличаются
2
+𝛽 𝜃 𝑜𝑙𝑑
𝑖
− 𝜃 𝑜𝑙𝑑
𝑖−1 2

Гипер-параметры = гибкость
2
+𝛽 𝜃 𝑜𝑙𝑑
𝑖
𝑖−1 2

Trees
… На старом сете

Trees
…
+
На старом сете
На новом сете
– - N=5
– + M=10
– Основной размер ~ 100-300

Trees: безудержный рост
– Число деревьев растет
• => надо упрощать
– Knowledge Distillation

Trees
Добавление деревьев + KD обеспечивают
– Новые паттерны
– Преемственность

FastText
– 𝐸𝑚𝑏 𝑤𝑜𝑟𝑑 = 𝐸𝑚𝑏 𝑛𝑔𝑟𝑎𝑚 + 𝐸𝑚𝑏 𝑤𝑜𝑟𝑑
– N-grams: bucket hashing
dimension
n_words
n_buckets
Weights

Дообучение FastText
New text => new words, n-grams
dimension
n_words
n_buckets
Дефолтное дообучение
– Только старые веса
– Веса изменяются непредсказуемо
• => Нет преемственности

Дообучение FastText
Рецепт
– Добавляем все новое
𝐿𝑜𝑠𝑠 = 𝐶𝑟𝑜𝑠𝑠 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 + 𝛽 𝜃 𝑜𝑙𝑑
𝑖
𝑖−1 2
New words
New buckets
CE– Учим CrossEntropy
– Harmonic regularization
Harmonic
Reg.
Harmonic
Reg.

CNN
Варианты:
– Harmonic regularization
– Гибкий генератор (пример: OCR)
– Embeddings: triplet loss + harmonic

Triplet loss для Антифишинга
Anchor
positive + α < negative
minimize maximize
Negative
Positive
FaceNet: A Unified Embedding for Face Recognition and Clustering

Triplet loss: harmonic
– Learn from scratch Model v2
Anchor
minimize maximize
Negative
Positive
New

Triplet loss: harmonic
– Learn from scratch Model v2
minimize maximize
Emb v1
Emb v2
Emb v1
Emb v2
Emb v1
– Retrain Embedding layer
– Then the whole net

Архитектура
CNN
Other Features
…Decision
Score
Embeddings

Архитектура: дообучение
Harmonic
regularization
CNN
Other Features

Calibration
Harmonic
regularization

Incremental
Calibration
Harmonic
regularization
…

Hierarchy
Обновляем компоненты по одному

Вывод
Преемственность решает

Тестирование и мониторинг
не вредит вашему здоровью

Why
Everything breaks b/c:
– Cost of innovation
– Entropy
time
Number of errors

Why
– Lifetime value
– Нельзя полагаться на людей
Блокировки
Время
Кол-во
Ошибки

AutoAB
– Все изменения - через АВ
– Автодеплой по метрикам
• Up to 50% auto, 100% manual
– Rollback Tests

Testing
– Integration tests
– Data tests
– Training vs serving model

Распределение (KLdiv)
– Ответов
– Скоров
– Признаков

Эвристики полезны для мониторинга ML
Доля пропусков модели на эвристиках

ML as a Service
Легче поддерживать, масштабировать, переписывать
– TensorFlow Serving
– Kubeflow
– TensorRT Inference Server

Bottom line
Думать об эксплуатации ML
надо заранее

Recap
• Feedback Loop
– Думаем про пользователя
– Фильтрация фидбека
• Дообучение
– Преемственность
• Эксплуатация
– Тесты
– Мониторинги

Эксплуатация ML в Почте Mail.ru

Recommended

Recommended

More Related Content

Similar to Эксплуатация ML в Почте Mail.ru

Similar to Эксплуатация ML в Почте Mail.ru (20)

More from Eduard Tyantov

More from Eduard Tyantov (8)

Эксплуатация ML в Почте Mail.ru

Editor's Notes