Международная научно-практическая конференция International Conference on Big Data and its Applications (ICBDA) выросла из мероприятия Big Data Russia и проводится один раз в год, объединяя на одной площадке создателей новых технологий в области больших данных, представителей бизнеса, а также научных сотрудников и молодых ученых. В этом году конференция прошла 16 сентября в коворкинге Deworkracy.
Организаторы ICBDA благодарят Data-Centric Alliance (DCA) за поддержку мероприятия, а также отдельное спасибо Artox Media и NVIDIA.
Анатолий Климчук – ARTOX Media International – ICBDA 2016
1. КАК ПРАВИЛЬНО СЛУШАТЬ
И СЛЫШАТЬ ИНТЕРНЕТ
ПРОГНОЗИРОВАНИЕ РЕЗУЛЬТАТОВ ЗДОРОВЬЯ
ЧЕЛОВЕКА ДЛЯ СТРАХОВЫХ КОМПАНИЙ
ДИРЕКТОР ARTOX MEDIA INTERNATIONAL
АНАТОЛИЙ КЛИМЧУК
2. Выявление корреляции
найденных упоминаний
для целей проекта
Проблематика и рамки
маркетингового
исследования
СОДЕРЖАНИЕ
Создание области поиска
для нового продукта
Подготовка рекомендаций для
следующих шагов: подбор
целевой группы
заинтересованных граждан.
Создание настроек для
проведения медийной кампании
по ознакомлению с новым
сервисом
3. *Материалы не являются результатами работы компании Illumina
Illumina, Inc. (Сан-Диего) с 1998 года, занимается
разработкой, производством и внедрением систем анализа
генетического разнообразия и биологических функций.
Illumina производит линейку продуктов и услуг для
секвенирования, генотипирования и изучения экспрессии
генов.
Исследование проведено ARTOX media совместно с
Сергеем Манаковым, Bioinformatics Scientist at Illumina
5. НОВЫЙ ПРОДУКТ И ЭПИГЕНЕТИКА
Стиль жизни,
курение,
старение,
стресс,
лекарственные
препараты,
диета и пр.
Абсолютно одинаковый
набор генов, но выключается
один из них
DNA
Каждый имеет набор генов
Gene
A
Gene B
Gene C
Protein A Protein B
Protein C
DNA
Gene
A
Gene B
Gene C
Protein A
Protein C
×
Epigenetic modification,
e.g. cytosine methylation
6. ЗАДАЧИ
Проблематика и область
маркетингового исследования.
Создание диапазона поиска
упоминаний в web для нового
продукта.
Выявление корреляции найденных
упоминаний для целей проекта.
Подготовка рекомендаций для
следующих шагов: подбор целевой
группы заинтересованных граждан.
Создание настроек для проведения
медийной кампании
по ознакомлению с новым сервисом.
1
2
3
4
5
7. ЦЕЛЬ ПРОЕКТА
Выборка: ученые, СМИ, заинтересованные группы граждан США (англоговорящие) и СНГ (русскоговорящие)
Выявить корреляцию
неструктурированных
(субъективных) текстовых
сообщений
в WEB2.0 и
структурированной
текстовой информации в
WEB (научные статьи)
Выявить
потребительское
мнение при создании
новогоуникального
продукта для
страховых компаний
Составить список
рекомендаций для набора
группы заинтересованных
граждан для
подтверждения
/опровержения гипотезы
«Плохой результат в диете»
8. СТРУКТУРА И КОМАНДА ПРОЕКТА
Project manager
Аналитик Crimson
Hexagon
Digital
стратег
Ученый в области
эпигенетики Illumina
ПЕРИОД 2 НЕДЕЛИ
9. ПРОБЛЕМАТИКА И ОБЛАСТЬ
МАРКЕТИНГОВОГО ИССЛЕДОВАНИЯ
#ObamaCare
43 респондента,
149 уникальных слов-ассоциаций
66% слов были уникальными при создании
выборки
* «Computer-assisted Keyword…» 2016, G.King, P.Lam, M.E.Roberts
#BostonMarathon
42 респондента, 149 уникальных слов-
ассоциаций
59% слов не повторялись при создании выборки
10. Структурированный
текстовый поиск:
сосредоточимся на диете!
ТРЕНДЫ
В ПОИСКОВОЙ ВЫДАЧЕ
История поисковых запросов
за 5 лет (2011-2016)
Частотность показов 1
месяц (август 2016)
12. СОЗДАНИЕ ЧЕЛОВЕКО-МАШИННОГО
ПОИСКА ПОТРЕБИТЕЛЬСКИХ УПОМИНАНИЙ
Этап 1.
Программное
обеспечение
Crimson Hexagon
Этап 2.
Ученый в области
эпигенетики
Illumina
Этап 3.
Программное
обеспечение
Crimson Hexagon
Этап 4.
Результаты
Этап 5.
Рекомендации к действию
13. СОЗДАНИЕ ПЕРВИЧНЫХ МОНИТОРИНГОВ
США: epigenetics - количество документов 43 325 ед.
США: diet AND failure AND no results – количество найденных
документов 4 135 ед
РУНЕТ: эпигенетика - 853 ед.
РУНЕТ: диета AND нет результата – 31 ед.
ПРОЦЕДУРА «ФИЛЬТРА»
ТОП300 слов упоминаемости разделены на:
-1 – нерелевантные
0 – нейтральные
+1 – релевантные
ЭТАП 1.
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ
CRIMSON HEXAGON
ЭТАП 2.
УЧЕНЫЙ
14. ПРОЦЕДУРА «ФИЛЬТРА»
Epigenetic РФ – 0,44;
Epigenetic USA – 0,68
ПОСЛЕ «ФИЛЬТРА»
США: «epigenetics»
среднее значение 0,63
РУНЕТ: «эпигенетика» среднее
значение 0,32
1
2
Процедура «фильтра» После "фильтра"
0,63
0,68
0,32
0,44
Эпигенетика РФ
Epigenetic USA
СРЕДНИЕ ЗНАЧЕНИЯ
ТОП300 слов упоминаемости
16. Выборка документов после
релевантной фильтрации по РФ
составила - 891
Выборка документов после
релевантной фильтрации по
США составила - 43 331
(гипотеза «Плохой результат»)
Выборка по РФ составила – 31
персональный аккаунт
заинтересованных граждан
Выборка по США составила –
4 344 персональных аккаунтов
заинтересованных граждан
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
ЭПИГЕНЕТИКА
ДИЕТА
18. ПОДБОР ГРУППЫ УЧАСТНИКОВ ДЛЯ ТЕСТИРОВАНИЯ СЕРВИСА
США РФ
*среди 614 постов (14%) имеющих
идентифицированный пол
*среди 141 постов (3%) имеющих
идентифицированный возраст *среди 14 постов (45%) имеющих
идентифицированный пол
19. ЭПИГЕНЕТИКА.
Русский этап 1
История 1: Эпигенетика и антидепрессанты
21 сообщение по этой статье
Epigenetics modifications like DNA methylation
at some genes can be very stable, which could
explain why depression can be so persistent.
Antidepressants can inhibit DNA methylation
and this can be the mechanism of relieving
chronic depression
Топ площадок по упоминаемости в США*
Топ площадок по упоминаемости в РФ*
Сайт Всего постов
livejournal.com 70
club443.ru 57
youtube.com 30
semeistvo.by 18
detiangeli.ru 16
mail.ru 14
onliner.by 9
pcnews.ru 7
vk.com 7
ria-ami.ru 6
Сайт Всего постов
reddit.com 2436
tickerreport.com 396
4chan.org 383
americanbankingnews.co 381
amazon.com 300
yahoo.com 228
blogspot.com 222
biospace.com 220
watchlistnews.com 197
eurekalert.org 162
*Без учета Twitter и Google
ПОДБОР СПИСКА ПЛОЩАДОК
ДЛЯ АНОНСИРОВАНИЯ СЕРВИСА
20. KPI ДЛЯ ЗАМЕРА МЕДИЙНОЙ КАМПАНИИ
Позитив:
Позитив: Любовь (им сервиса)/Худей правильно
Позитив: Позитив: Реклама/
Цена/Удобство
Позитив: Позитив: Общее
Нейтральное: Желание узнать
о сервисе
Нейтральное: Желание
приобрести сервис
Негатив: Негатив: Общее
Нейтральное: Желание
использовать сервис
Негатив: Негатив: Онлайн
покупка
Негатив: Негатив: Содержание
сервис
*H&M: Internet to Purchase – Proportion of Posts (Opinion Analysis from 4/1/14 to 12/31/14)
Старт
кампании
х%
показателей
Финал
кампании
х%
показателей
21. КАК МЫ ЭТО СДЕЛАЛИ
Область
исследования1
Мониторинговое
ПО Crimson
Hexagon
Запуск
информационной
кампании
Рекомендации
+ медийные КРI
Запуск группы
добровольцев2
3
4
5
22. ДЛЯ КОГО МЫ ЭТО СДЕЛАЛИ
Эпигенетика входит
в ТОП 10 самых перспективных направлений по версии
MIT*
Сервис эпигенетики может быть интересен для B2B сектора:
sport entertainment (покупка и трансфер спортсменов),
страховые компании (расчет стоимости страховки для жизни),
organic food (подтверждение экологичности продуктов) и т.д.
23. ГДЕ ЭТО МОЖНО
ПРИМЕНЯТЬ
Методика подходит для
вывода на рынок новых
сервисов/продуктов, которые
не имеют четких ассоциаций
с выгодой для потребителя