SlideShare a Scribd company logo
1 of 21
Мифы и легенды о больших
данных
Михаил Левин
руководитель службы анализа больших данных
Yandex Data Factory
› Создана в 2014 году
› Машинное обучение для
других индустрий
› Вычислительные мощности
› Инфраструктура для
машинного обучения
› Data scientists
› Данные о поведении пользователей (в Интернете,
телекоммуникациях и пр.)
› Данные сенсоров и телеметрии
› Банковские транзакции, кредиты и депозиты
› Эксперименты в ЦЕРНе
› Протоколы плавок стали
› Данные о дорожном движении и ДТП
› Данные о продажах
› …
Откуда берутся большие
данные?
4
› Само по себе – нет
› Хранение – затратно
› Некоторые данные обязательно хранить по закону
› Все хотят получать выгоду, а не только тратиться
Большие данные – это
выгодно?
5
› Редко
› Нужно самостоятельно ставить гипотезы
› “Know your customer”?
› Нельзя на самом деле «знать» миллион людей
› Итого, это просто сводится к сегментам
› Создать больше сегментов с помощью больших данных?
› Не особенно поможет
“Getting insights from your
data”
6
› Получение знаний – полезно, но очень медленно
› То, чего на самом деле хочется – это оптимизация
› Повышение доходов или снижение издержек
› Оптимизировать можно без понимания
› Предсказывающие и предписывающие модели
› Гораздо точнее, чем модели, созданные человеком
Прогнозы и предписания
7
› 100, 1000, 10000 характеристик vs 5-7
› Огромный набор гипотез vs несколько идей
› Быстрая и автоматизированная оптимизация
› Результат – лучше модель
› Хорошо масштабируется
Машинное обучение против
аналитики
8
› Рекомендательные системы для upsale/cross-sale
› Предсказание оттока для телекомов, онлайн-игр
› Оптимизация использования химических веществ
› Автоматический мониторинг с распознаванием
изображений
› Размещение дорожных патрулей с использованием
информации о пробках и предсказании ДТП
› Идентификация & верификация лиц
Примеры
9
› Крупный банк с миллионами клиентов
› Кредиты, депозиты, мобильный банкинг, страховка
› Upsale/cross-sale
› Обычные e-mail/sms рассылки
› Используют сегментацию
› При добавлении персонализации -> +13% дохода
Рекомендательная система
10
› Если клиент не пользуется услугой 3 месяца – он потерян
› Хотим это предотвратить
› Кто уйдет на следующей неделе?
› Lift-10%
› Кампания по удержанию топа
› Дольше продолжительность жизни клиента -> выше доходы
Предсказание оттока
11
› Давно известная задача
› Обычно используются простые модели
› Используют только агрегированные данные
› Есть более эффективные методы
› Наш результат: +10-20% в значении метрики Lift-10%
Предсказание оттока
12
› ЛЭП или трубопровод длиной сотни километров
› Рядом с ними не должно быть домов, машин, свалок и пр.
› Непроходимая местность
› Регулярный мониторинг наземными патрулями - дорого
› Фотосъемка беспилотниками
› Автоматическое распознавание нежелательных объектов
› Возможно даже в реальном времени
Автоматический мониторинг
13
› Данные о качестве дорог, размещении дорожных знаков,
пешеходных перекрестков и т.д.
› Данные о движении автомобилей и пробках
› Данные о погоде
› Данные о прошлых ДТП
› Предсказание пробок и ДТП
› Предсказание наиболее опасных сегментов – вероятность ДТП
выше в 30 раз
› В 7 раз больше ДТП, чем модель по статистике
› Можно предотвращать ДТП или быстрее ликвидировать
последствия
Размещение дорожных
патрулей
14
› Не обязательно очень большие, иногда достаточно одного
компьютера для их обработки
› More data beats better algorithms
› Хотя бы 10000 объектов и дюжина характеристик
› Можно работать с миллиардами характеристик и
триллионами событий – и выигрывать за счет этого
Обязательно большие
данные?
15
› Хорошие алгоритмы на больших данных – еще лучше
› Можно выигрывать у линейных моделей на 10+%
› Классификация изображений близка к уровню человека
› Использование глубоких нейронных сетей
› С большим количеством трюков
› Распознавание мультиканальной речи лучше человека
› Тоже DNN
Нужны ли сложные
алгоритмы?
16
› Алгоритмы уже обучают сами себя…
› 20 лет исследований машинного перевода побеждены
DNN…
› DNN “just want to work”…
Нужны ли data scientist’ы?
17
› DNN “just want to work”…
› На самом деле, нет 
› Множество хитростей при тренировке модели
› Feature engineering
› Лучшие - совершенствуют алгоритмы и решают новые
задачи
› Обычные DS применяют готовые рецепты – тоже очень
востребованно
› The sexiest job of 21st century по мнению HBR
Нужны ли data scientist’ы?
18
› Правильно поставить задачу
› Добыть все нужные данные
› Выработать метрики и критерии успеха
› Описать эксперимент
› Подобрать модель
› Статистика & вероятность
› Математическая оптимизация
› Алгоритмы
› Параллельные вычисления
Что нужно уметь
19
› Большие данные сами по себе не несут ценности
› Все накапливают данные
› Машинное обучение широко применимо
› Лучше больше данных, чем умные алгоритмы
› Умные алгоритмы на больших данных – еще лучше
› Знание математики, которая за ними стоит – очень важно
› Знание предметной области необязательно, но полезно
› Спрос на data scientist’ов велик и растет, а их мало
Заключение
20
Контакты
mlevin@yandex-team.ru
Михаил Левин
Chief Data Scientist,
Yandex Data Factory

More Related Content

Viewers also liked

Большие Данные
Большие ДанныеБольшие Данные
Большие ДанныеLeonid Zhukov
 
4 sas and big data short
4 sas and big data short4 sas and big data short
4 sas and big data shortantishmanti
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi octantishmanti
 
1509210046futureofworkmitblakei 150923233545-lva1-app6892
1509210046futureofworkmitblakei 150923233545-lva1-app68921509210046futureofworkmitblakei 150923233545-lva1-app6892
1509210046futureofworkmitblakei 150923233545-lva1-app6892Vera Kovaleva
 
Data Science Weekend 2017. New Professions Lab. Образование в области Data Sc...
Data Science Weekend 2017. New Professions Lab. Образование в области Data Sc...Data Science Weekend 2017. New Professions Lab. Образование в области Data Sc...
Data Science Weekend 2017. New Professions Lab. Образование в области Data Sc...Newprolab
 
Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean
Data Science Weekend 2017. Qlean. Как устроено машинное обучение в QleanData Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean
Data Science Weekend 2017. Qlean. Как устроено машинное обучение в QleanNewprolab
 
Data Science Weekend 2017. МегаФон. Аналитика больших данных в телекоме. Опыт...
Data Science Weekend 2017. МегаФон. Аналитика больших данных в телекоме. Опыт...Data Science Weekend 2017. МегаФон. Аналитика больших данных в телекоме. Опыт...
Data Science Weekend 2017. МегаФон. Аналитика больших данных в телекоме. Опыт...Newprolab
 
Rtb-media.ru b2b presentation
Rtb-media.ru b2b presentationRtb-media.ru b2b presentation
Rtb-media.ru b2b presentationRTB-media RU
 
Презентация сервиса Crossss
Презентация сервиса CrossssПрезентация сервиса Crossss
Презентация сервиса CrossssДаниил Ханин
 
Презентация Big data
Презентация Big dataПрезентация Big data
Презентация Big dataSatur-D
 
"Феномен Трампа" и победа интернет-маркетинга, bigdata, политрекламы & соцсетей"
"Феномен Трампа" и победа интернет-маркетинга, bigdata, политрекламы & соцсетей""Феномен Трампа" и победа интернет-маркетинга, bigdata, политрекламы & соцсетей"
"Феномен Трампа" и победа интернет-маркетинга, bigdata, политрекламы & соцсетей"Michel Vershinin
 
пр Куда идет ИБ в России? (региональные аспекты)
пр Куда идет ИБ в России? (региональные аспекты)пр Куда идет ИБ в России? (региональные аспекты)
пр Куда идет ИБ в России? (региональные аспекты)Andrey Prozorov, CISM, CIPP/E, CDPSE. LA 27001
 
Introduction to Machine Learning
Introduction to Machine LearningIntroduction to Machine Learning
Introduction to Machine LearningLior Rokach
 
3 Things Every Sales Team Needs to Be Thinking About in 2017
3 Things Every Sales Team Needs to Be Thinking About in 20173 Things Every Sales Team Needs to Be Thinking About in 2017
3 Things Every Sales Team Needs to Be Thinking About in 2017Drift
 

Viewers also liked (17)

Большие Данные
Большие ДанныеБольшие Данные
Большие Данные
 
2 bdw.key
2 bdw.key2 bdw.key
2 bdw.key
 
4 sas and big data short
4 sas and big data short4 sas and big data short
4 sas and big data short
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi oct
 
1509210046futureofworkmitblakei 150923233545-lva1-app6892
1509210046futureofworkmitblakei 150923233545-lva1-app68921509210046futureofworkmitblakei 150923233545-lva1-app6892
1509210046futureofworkmitblakei 150923233545-lva1-app6892
 
Data Science Weekend 2017. New Professions Lab. Образование в области Data Sc...
Data Science Weekend 2017. New Professions Lab. Образование в области Data Sc...Data Science Weekend 2017. New Professions Lab. Образование в области Data Sc...
Data Science Weekend 2017. New Professions Lab. Образование в области Data Sc...
 
Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean
Data Science Weekend 2017. Qlean. Как устроено машинное обучение в QleanData Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean
Data Science Weekend 2017. Qlean. Как устроено машинное обучение в Qlean
 
Data Science Weekend 2017. МегаФон. Аналитика больших данных в телекоме. Опыт...
Data Science Weekend 2017. МегаФон. Аналитика больших данных в телекоме. Опыт...Data Science Weekend 2017. МегаФон. Аналитика больших данных в телекоме. Опыт...
Data Science Weekend 2017. МегаФон. Аналитика больших данных в телекоме. Опыт...
 
Rtb-media.ru b2b presentation
Rtb-media.ru b2b presentationRtb-media.ru b2b presentation
Rtb-media.ru b2b presentation
 
Презентация сервиса Crossss
Презентация сервиса CrossssПрезентация сервиса Crossss
Презентация сервиса Crossss
 
Презентация Big data
Презентация Big dataПрезентация Big data
Презентация Big data
 
пр про SOC для ФСТЭК
пр про SOC для ФСТЭКпр про SOC для ФСТЭК
пр про SOC для ФСТЭК
 
"Феномен Трампа" и победа интернет-маркетинга, bigdata, политрекламы & соцсетей"
"Феномен Трампа" и победа интернет-маркетинга, bigdata, политрекламы & соцсетей""Феномен Трампа" и победа интернет-маркетинга, bigdata, политрекламы & соцсетей"
"Феномен Трампа" и победа интернет-маркетинга, bigdata, политрекламы & соцсетей"
 
пр Спроси эксперта про прогнозы ИБ
пр Спроси эксперта про прогнозы ИБпр Спроси эксперта про прогнозы ИБ
пр Спроси эксперта про прогнозы ИБ
 
пр Куда идет ИБ в России? (региональные аспекты)
пр Куда идет ИБ в России? (региональные аспекты)пр Куда идет ИБ в России? (региональные аспекты)
пр Куда идет ИБ в России? (региональные аспекты)
 
Introduction to Machine Learning
Introduction to Machine LearningIntroduction to Machine Learning
Introduction to Machine Learning
 
3 Things Every Sales Team Needs to Be Thinking About in 2017
3 Things Every Sales Team Needs to Be Thinking About in 20173 Things Every Sales Team Needs to Be Thinking About in 2017
3 Things Every Sales Team Needs to Be Thinking About in 2017
 

Similar to 1 20150424 ydf_mlevin_мифы и легенды о больших данных

Microsoft BigData event @ Bibliotech
Microsoft BigData event @ BibliotechMicrosoft BigData event @ Bibliotech
Microsoft BigData event @ BibliotechAndrey Burlutskiy
 
Данные - Основа Digital революции
Данные - Основа Digital революцииДанные - Основа Digital революции
Данные - Основа Digital революцииDen Reymer
 
Cовременные тенденции против устаревших стереотипов бизнеса
Cовременные тенденции против устаревших стереотипов бизнесаCовременные тенденции против устаревших стереотипов бизнеса
Cовременные тенденции против устаревших стереотипов бизнеса1C-KPD
 
MESImeetup_DenReymer_presentation
MESImeetup_DenReymer_presentationMESImeetup_DenReymer_presentation
MESImeetup_DenReymer_presentationCleverDATA
 
Dsml for business.full version
Dsml for business.full versionDsml for business.full version
Dsml for business.full versionDmitry Guzenko
 
TAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - МакаровTAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - МакаровStanislav Makarov
 
DenReymer_presentation_for_CNewsforum_14112014
DenReymer_presentation_for_CNewsforum_14112014DenReymer_presentation_for_CNewsforum_14112014
DenReymer_presentation_for_CNewsforum_14112014CleverDATA
 
10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis 10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis CleverDATA
 
Clever data 1dmp_oracle_fors
Clever data 1dmp_oracle_forsClever data 1dmp_oracle_fors
Clever data 1dmp_oracle_forsCleverDATA
 
Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?Den Reymer
 
HR_Scoring_CleverDATA
HR_Scoring_CleverDATAHR_Scoring_CleverDATA
HR_Scoring_CleverDATACleverDATA
 
Konstantin Obukhov - Customer Experience Technologies
Konstantin Obukhov - Customer Experience TechnologiesKonstantin Obukhov - Customer Experience Technologies
Konstantin Obukhov - Customer Experience TechnologiesAIST
 
CleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterpriseCleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterpriseCleverDATA
 
1 search
1 search1 search
1 searchYandex
 
Будущее социального веба и тренды SMM
Будущее социального веба и тренды SMMБудущее социального веба и тренды SMM
Будущее социального веба и тренды SMMbufferbay
 
Gartner Hype Cycle for Big Data, 2014
Gartner Hype Cycle for Big Data, 2014Gartner Hype Cycle for Big Data, 2014
Gartner Hype Cycle for Big Data, 2014Den Reymer
 
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA
 
Поймать Цифровую Волну. CleverDATA на Cnews Forum 2015
Поймать Цифровую Волну. CleverDATA на Cnews Forum 2015Поймать Цифровую Волну. CleverDATA на Cnews Forum 2015
Поймать Цифровую Волну. CleverDATA на Cnews Forum 2015Den Reymer
 

Similar to 1 20150424 ydf_mlevin_мифы и легенды о больших данных (20)

Microsoft BigData event @ Bibliotech
Microsoft BigData event @ BibliotechMicrosoft BigData event @ Bibliotech
Microsoft BigData event @ Bibliotech
 
Формула лидерства и инноваций. Максим Браверман
Формула лидерства и инноваций. Максим БраверманФормула лидерства и инноваций. Максим Браверман
Формула лидерства и инноваций. Максим Браверман
 
Данные - Основа Digital революции
Данные - Основа Digital революцииДанные - Основа Digital революции
Данные - Основа Digital революции
 
Cовременные тенденции против устаревших стереотипов бизнеса
Cовременные тенденции против устаревших стереотипов бизнесаCовременные тенденции против устаревших стереотипов бизнеса
Cовременные тенденции против устаревших стереотипов бизнеса
 
MESImeetup_DenReymer_presentation
MESImeetup_DenReymer_presentationMESImeetup_DenReymer_presentation
MESImeetup_DenReymer_presentation
 
Dsml for business.full version
Dsml for business.full versionDsml for business.full version
Dsml for business.full version
 
TAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - МакаровTAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - Макаров
 
DenReymer_presentation_for_CNewsforum_14112014
DenReymer_presentation_for_CNewsforum_14112014DenReymer_presentation_for_CNewsforum_14112014
DenReymer_presentation_for_CNewsforum_14112014
 
10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis 10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis
 
Clever data 1dmp_oracle_fors
Clever data 1dmp_oracle_forsClever data 1dmp_oracle_fors
Clever data 1dmp_oracle_fors
 
Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?
 
HR_Scoring_CleverDATA
HR_Scoring_CleverDATAHR_Scoring_CleverDATA
HR_Scoring_CleverDATA
 
Konstantin Obukhov - Customer Experience Technologies
Konstantin Obukhov - Customer Experience TechnologiesKonstantin Obukhov - Customer Experience Technologies
Konstantin Obukhov - Customer Experience Technologies
 
Sokolov 2017-06-06
Sokolov 2017-06-06Sokolov 2017-06-06
Sokolov 2017-06-06
 
CleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterpriseCleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterprise
 
1 search
1 search1 search
1 search
 
Будущее социального веба и тренды SMM
Будущее социального веба и тренды SMMБудущее социального веба и тренды SMM
Будущее социального веба и тренды SMM
 
Gartner Hype Cycle for Big Data, 2014
Gartner Hype Cycle for Big Data, 2014Gartner Hype Cycle for Big Data, 2014
Gartner Hype Cycle for Big Data, 2014
 
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
 
Поймать Цифровую Волну. CleverDATA на Cnews Forum 2015
Поймать Цифровую Волну. CleverDATA на Cnews Forum 2015Поймать Цифровую Волну. CleverDATA на Cnews Forum 2015
Поймать Цифровую Волну. CleverDATA на Cnews Forum 2015
 

1 20150424 ydf_mlevin_мифы и легенды о больших данных

  • 1.
  • 2. Мифы и легенды о больших данных Михаил Левин руководитель службы анализа больших данных
  • 3. Yandex Data Factory › Создана в 2014 году › Машинное обучение для других индустрий › Вычислительные мощности › Инфраструктура для машинного обучения › Data scientists
  • 4. › Данные о поведении пользователей (в Интернете, телекоммуникациях и пр.) › Данные сенсоров и телеметрии › Банковские транзакции, кредиты и депозиты › Эксперименты в ЦЕРНе › Протоколы плавок стали › Данные о дорожном движении и ДТП › Данные о продажах › … Откуда берутся большие данные? 4
  • 5. › Само по себе – нет › Хранение – затратно › Некоторые данные обязательно хранить по закону › Все хотят получать выгоду, а не только тратиться Большие данные – это выгодно? 5
  • 6. › Редко › Нужно самостоятельно ставить гипотезы › “Know your customer”? › Нельзя на самом деле «знать» миллион людей › Итого, это просто сводится к сегментам › Создать больше сегментов с помощью больших данных? › Не особенно поможет “Getting insights from your data” 6
  • 7. › Получение знаний – полезно, но очень медленно › То, чего на самом деле хочется – это оптимизация › Повышение доходов или снижение издержек › Оптимизировать можно без понимания › Предсказывающие и предписывающие модели › Гораздо точнее, чем модели, созданные человеком Прогнозы и предписания 7
  • 8. › 100, 1000, 10000 характеристик vs 5-7 › Огромный набор гипотез vs несколько идей › Быстрая и автоматизированная оптимизация › Результат – лучше модель › Хорошо масштабируется Машинное обучение против аналитики 8
  • 9. › Рекомендательные системы для upsale/cross-sale › Предсказание оттока для телекомов, онлайн-игр › Оптимизация использования химических веществ › Автоматический мониторинг с распознаванием изображений › Размещение дорожных патрулей с использованием информации о пробках и предсказании ДТП › Идентификация & верификация лиц Примеры 9
  • 10. › Крупный банк с миллионами клиентов › Кредиты, депозиты, мобильный банкинг, страховка › Upsale/cross-sale › Обычные e-mail/sms рассылки › Используют сегментацию › При добавлении персонализации -> +13% дохода Рекомендательная система 10
  • 11. › Если клиент не пользуется услугой 3 месяца – он потерян › Хотим это предотвратить › Кто уйдет на следующей неделе? › Lift-10% › Кампания по удержанию топа › Дольше продолжительность жизни клиента -> выше доходы Предсказание оттока 11
  • 12. › Давно известная задача › Обычно используются простые модели › Используют только агрегированные данные › Есть более эффективные методы › Наш результат: +10-20% в значении метрики Lift-10% Предсказание оттока 12
  • 13. › ЛЭП или трубопровод длиной сотни километров › Рядом с ними не должно быть домов, машин, свалок и пр. › Непроходимая местность › Регулярный мониторинг наземными патрулями - дорого › Фотосъемка беспилотниками › Автоматическое распознавание нежелательных объектов › Возможно даже в реальном времени Автоматический мониторинг 13
  • 14. › Данные о качестве дорог, размещении дорожных знаков, пешеходных перекрестков и т.д. › Данные о движении автомобилей и пробках › Данные о погоде › Данные о прошлых ДТП › Предсказание пробок и ДТП › Предсказание наиболее опасных сегментов – вероятность ДТП выше в 30 раз › В 7 раз больше ДТП, чем модель по статистике › Можно предотвращать ДТП или быстрее ликвидировать последствия Размещение дорожных патрулей 14
  • 15. › Не обязательно очень большие, иногда достаточно одного компьютера для их обработки › More data beats better algorithms › Хотя бы 10000 объектов и дюжина характеристик › Можно работать с миллиардами характеристик и триллионами событий – и выигрывать за счет этого Обязательно большие данные? 15
  • 16. › Хорошие алгоритмы на больших данных – еще лучше › Можно выигрывать у линейных моделей на 10+% › Классификация изображений близка к уровню человека › Использование глубоких нейронных сетей › С большим количеством трюков › Распознавание мультиканальной речи лучше человека › Тоже DNN Нужны ли сложные алгоритмы? 16
  • 17. › Алгоритмы уже обучают сами себя… › 20 лет исследований машинного перевода побеждены DNN… › DNN “just want to work”… Нужны ли data scientist’ы? 17
  • 18. › DNN “just want to work”… › На самом деле, нет  › Множество хитростей при тренировке модели › Feature engineering › Лучшие - совершенствуют алгоритмы и решают новые задачи › Обычные DS применяют готовые рецепты – тоже очень востребованно › The sexiest job of 21st century по мнению HBR Нужны ли data scientist’ы? 18
  • 19. › Правильно поставить задачу › Добыть все нужные данные › Выработать метрики и критерии успеха › Описать эксперимент › Подобрать модель › Статистика & вероятность › Математическая оптимизация › Алгоритмы › Параллельные вычисления Что нужно уметь 19
  • 20. › Большие данные сами по себе не несут ценности › Все накапливают данные › Машинное обучение широко применимо › Лучше больше данных, чем умные алгоритмы › Умные алгоритмы на больших данных – еще лучше › Знание математики, которая за ними стоит – очень важно › Знание предметной области необязательно, но полезно › Спрос на data scientist’ов велик и растет, а их мало Заключение 20