SlideShare a Scribd company logo
1 of 15
Download to read offline
Make your data clever
cleverdata.ru | info@cleverdata.ru
Структура презентации
> Цель работ
> Ограничения
> Прикладные задачи
> Реализация
> Использование
> Возможности splunk> в области Data mining и Machine Learning
cleverdata.ru | info@cleverdata.ru
Цель работ
> Цель работ – определить пути расширения функциональных
возможностей splunk> для решения индивидуальных прикладных задач.
При этом:
1. использовать Splunk в качестве источника данных;
2. выводить результаты наших расчетов в интерфейс splunk>.
cleverdata.ru | info@cleverdata.ru
Прикладные задачи
1. Классификация клиентов в зависимости от параметров:
- время последнего посещения клиентом торговых точек ритейлера. Назовем этот параметр – R (Recency).
- частота покупок клиента в торговых точках ритейлера. Назовем этот параметр - F(Frequency).
Дано:
Имеется зависимость (закон распределения) времени последнего визита R(recency) от частоты покупок F(frequency).
В соответствии с данным законом распределения, клиенты разделены на три категории: "Перспективные", "Нормальные",
"Неперспективные".
Задача:
Необходимо определить категорию клиента на основании данных о времени его последнего визита R(recency) и частоты
покупок F(frequency) для тех клиентов, у которых категория не задана.
2. Классификация состояния платежного шлюза в зависимости от параметров: время суток (периодичность -
1 час), количество запросов в час.
Дано:
Имеется зависимость (закон распределения) количества запросов на платежный шлюз в час от времени суток (с
группировкой по часам).
В соответствии с данным законом распределения, состояние может быть: "Спокойное", "Нормальное", "Критическое".
Задача:
Необходимо определить состояние платежного шлюза на основании информации о времени суток и количестве запросов в
час для тех значений, у которых состояние неизвестно.
cleverdata.ru | info@cleverdata.ru
Реализация
> Подход к решению
> Настройка системного Python
> Настройка splunk>
> Разработка модулей Python
> Перезагрузка splunk>
[dtree]
type = python
filename = dtree.py
generating = false
streaming = false
retainsevents = false
cleverdata.ru | info@cleverdata.ru
Реализация
Модуль-обертка Ваш уникальный
алгоритм
cleverdata.ru | info@cleverdata.ru
Использование
cleverdata.ru | info@cleverdata.ru
Data mining и Machine Learning
Отрасль Пример
IT Прогноз объема интернет-трафика по дням недели.
IT Real-time анализ логов proxy-сервера и web-сервера на наличие определенных слов или выражений
для предотвращения SQL injections. Используется наивная байесовская классификация.
IT Прогнозирование нагрузки на Службу поддержки на основании активности клиентов (например,
смена/сброс пароля, запрос баланса и т.д.). Планирование активностей по привлечению
дополнительных ресурсов в пиковые периоды.
Банки Прогноз нагрузки на платежный шлюз банка (например, запросов в секунду) на основании
имеющейся статистики. Определение пиковых и адаптивных пороговых значений на основании
функционала Splunk по выявлению аномалий (anomaly detection).
Банки Real-time анализ ВСЕХ действий клиентов (в т.ч. потенциальных) на сайте банка/на странице с
кредитным калькулятором для принятия решения о выдаче кредита. Использование
дополнительных имеющихся атрибутов (предикторов).
Промышлен
ность
Определение вероятности снижения энергоэффективности оборудования (повышение потребляемой
мощности, снижение КПД) на основании характеристик его работы из логов управляющих систем,
информации с датчиков и сенсоров и выявленной статистики снижения энергоэффективности.
Проведение внеплановых замен/модернизаций оборудования на основании полученного прогноза.
cleverdata.ru | info@cleverdata.ru
Data mining и Machine Learning
Отрасль Пример
Маркетинг 1. Прогнозирование объема продаж.
2. Определение ассоциативных правил, приводящих к покупкам на сайте. Динамическое
формирование страниц сайта (контента страниц) для повышения конверсии.
Безопасность Определение транзакций клиентов, которые выполняются со скоростью, значительно
превышающую скорость других клиентов (средняя частота использования карты, идентификатора
клиента и т.д.). Данное поведение может быть идентифицировано как шаблон. Например,
использование интернет-ботов (bot) для перебора паролей/загрузки канала или планирование
DDoS атак. Используется функционал Splunk по выявлению аномалий (anomaly detection).
Безопасность Определение шаблонов аномальной передачи данных. Построение предиктивной модели,
которая будет определять такие шаблоны и уведомлять заинтересованных лиц, используя
механизм alert’ов.
Телеком Predict Customer Churn. Построение модели оттока клиентов.
cleverdata.ru | info@cleverdata.ru
> Большая библиотека команд и алгоритмов.
> Возможность использовать R и Python с помощью R Project App и SDK for Python.
> Набор дополнительных приложений: Machine Learning Toolkit and Showcase, Predict
App, Sentiment analysis App, Prelert.
> Богатые возможности визуализации (в т.ч. использование D3).
Анализ трендов: predict, trendline,
autoregress
Выявление аномалий и
сегментирование: anomalies,
cluster, kmeans
Data mining и Machine Learning
cleverdata.ru | info@cleverdata.ru
Команды и алгоритмы:
> корреляция;
> кластеризация (k means, cluster);
> ассоциативные правила;
> классификация и
прогнозирование (байесовская
классификация, регрессии, SVM);
> поиск аномалий;
> метод главных компонент (PCA).
Команда Описание
analyzefields Analyze numerical fields for their ability to predict another discrete field.
anomalies Computes an "unexpectedness" score for an event.
anomalousvalue Finds and summarizes irregular, or uncommon, search results.
cluster Clusters similar events together.
kmeans Performs k-means clustering on selected fields.
outlier Removes outlying numerical values.
rare Displays the least common values of a field.
contingency Builds a contingency table, a co-occurrence matrix, for the values of two fields.
correlate Calculates the correlation between different fields.
predict Enables you to use time series algorithms to predict future values of fields.
trendline Computes moving averages of fields.
x11 Enables you to determine the trend in your data by removing the seasonal pattern.
Data mining и Machine Learning
cleverdata.ru | info@cleverdata.ru
ML Toolkit and Showcase
> Линейная регрессия > Логистическая регрессия > Определение аномалий
> Кластеризация > Прогнозирование
cleverdata.ru | info@cleverdata.ru
Собственные приложения и визуализация с использованием D3
cleverdata.ru | info@cleverdata.ru
Спасибо!
Расширение функциональных возможностей Splunk – это просто
презентация Clever data конференция splunk октябрь 2016 v2

More Related Content

What's hot

Bios power bi о нас (RU)
Bios power bi о нас (RU)Bios power bi о нас (RU)
Bios power bi о нас (RU)Oleksandr18
 
IBM SPSS. Аналитика на службе бизнеса
IBM SPSS. Аналитика на службе бизнесаIBM SPSS. Аналитика на службе бизнеса
IBM SPSS. Аналитика на службе бизнесаКРОК
 
Software Analytics in frontend
Software Analytics in frontendSoftware Analytics in frontend
Software Analytics in frontendDenis Kolesnikov
 
Power BI для аналитики данных из 1С: практический опыт
Power BI для аналитики данных из 1С: практический опытPower BI для аналитики данных из 1С: практический опыт
Power BI для аналитики данных из 1С: практический опытMarina Payvina
 
Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»
Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»
Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»Marina Payvina
 
ATK QlikView for Retail - Krasnopolsky Andrey
ATK QlikView for Retail - Krasnopolsky AndreyATK QlikView for Retail - Krasnopolsky Andrey
ATK QlikView for Retail - Krasnopolsky AndreyMarina Payvina
 
Deductor Demand Planning
Deductor Demand PlanningDeductor Demand Planning
Deductor Demand PlanningLoginom
 
Опыт внедрения QlikView в ОАО «Фармстандарт» и ОАО «Отисифарм»
Опыт внедрения QlikView в ОАО «Фармстандарт» и ОАО «Отисифарм»Опыт внедрения QlikView в ОАО «Фармстандарт» и ОАО «Отисифарм»
Опыт внедрения QlikView в ОАО «Фармстандарт» и ОАО «Отисифарм»Marina Payvina
 
Новая жизнь Ваших даных с PowerBI
Новая жизнь Ваших даных с PowerBI Новая жизнь Ваших даных с PowerBI
Новая жизнь Ваших даных с PowerBI Marina Payvina
 
Опыт работы с Qlik в компании ГК Лудинг
Опыт работы с Qlik в компании ГК ЛудингОпыт работы с Qlik в компании ГК Лудинг
Опыт работы с Qlik в компании ГК ЛудингMarina Payvina
 
Путь ПрофитМед: Аналитика с QlikView и Qlik Sense
Путь ПрофитМед: Аналитика с QlikView и Qlik SenseПуть ПрофитМед: Аналитика с QlikView и Qlik Sense
Путь ПрофитМед: Аналитика с QlikView и Qlik SenseMarina Payvina
 
Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Marina Payvina
 
Анализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft biАнализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft biМаксим Войцеховский
 
Big data. Тренды и технологии. Использование в работе с клиентами.
Big data. Тренды и технологии. Использование в работе с клиентами.Big data. Тренды и технологии. Использование в работе с клиентами.
Big data. Тренды и технологии. Использование в работе с клиентами.CleverDATA
 
База знаний службы техподдержки
База знаний службы техподдержкиБаза знаний службы техподдержки
База знаний службы техподдержкиSergey Gorshkov
 
Qlik: новый подход к бизнес-аналитике фармацевтических компаний
Qlik: новый подход к бизнес-аналитике фармацевтических компанийQlik: новый подход к бизнес-аналитике фармацевтических компаний
Qlik: новый подход к бизнес-аналитике фармацевтических компанийMarina Payvina
 
QlikView for Retail, QlikTech, Георгий Нанеишвили
QlikView for Retail, QlikTech, Георгий НанеишвилиQlikView for Retail, QlikTech, Георгий Нанеишвили
QlikView for Retail, QlikTech, Георгий НанеишвилиMarina Payvina
 
Владислав Флакс — OWOX — IСBDA 2015
Владислав Флакс — OWOX — IСBDA 2015Владислав Флакс — OWOX — IСBDA 2015
Владислав Флакс — OWOX — IСBDA 2015rusbase
 
Qlik Sense в Zenden || Консультационная Группа АТК
Qlik Sense в Zenden || Консультационная Группа АТКQlik Sense в Zenden || Консультационная Группа АТК
Qlik Sense в Zenden || Консультационная Группа АТКMarina Payvina
 
генератор отчетов Calligraph
генератор отчетов Calligraphгенератор отчетов Calligraph
генератор отчетов CalligraphVladimir Losev
 

What's hot (20)

Bios power bi о нас (RU)
Bios power bi о нас (RU)Bios power bi о нас (RU)
Bios power bi о нас (RU)
 
IBM SPSS. Аналитика на службе бизнеса
IBM SPSS. Аналитика на службе бизнесаIBM SPSS. Аналитика на службе бизнеса
IBM SPSS. Аналитика на службе бизнеса
 
Software Analytics in frontend
Software Analytics in frontendSoftware Analytics in frontend
Software Analytics in frontend
 
Power BI для аналитики данных из 1С: практический опыт
Power BI для аналитики данных из 1С: практический опытPower BI для аналитики данных из 1С: практический опыт
Power BI для аналитики данных из 1С: практический опыт
 
Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»
Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»
Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»
 
ATK QlikView for Retail - Krasnopolsky Andrey
ATK QlikView for Retail - Krasnopolsky AndreyATK QlikView for Retail - Krasnopolsky Andrey
ATK QlikView for Retail - Krasnopolsky Andrey
 
Deductor Demand Planning
Deductor Demand PlanningDeductor Demand Planning
Deductor Demand Planning
 
Опыт внедрения QlikView в ОАО «Фармстандарт» и ОАО «Отисифарм»
Опыт внедрения QlikView в ОАО «Фармстандарт» и ОАО «Отисифарм»Опыт внедрения QlikView в ОАО «Фармстандарт» и ОАО «Отисифарм»
Опыт внедрения QlikView в ОАО «Фармстандарт» и ОАО «Отисифарм»
 
Новая жизнь Ваших даных с PowerBI
Новая жизнь Ваших даных с PowerBI Новая жизнь Ваших даных с PowerBI
Новая жизнь Ваших даных с PowerBI
 
Опыт работы с Qlik в компании ГК Лудинг
Опыт работы с Qlik в компании ГК ЛудингОпыт работы с Qlik в компании ГК Лудинг
Опыт работы с Qlik в компании ГК Лудинг
 
Путь ПрофитМед: Аналитика с QlikView и Qlik Sense
Путь ПрофитМед: Аналитика с QlikView и Qlik SenseПуть ПрофитМед: Аналитика с QlikView и Qlik Sense
Путь ПрофитМед: Аналитика с QlikView и Qlik Sense
 
Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?
 
Анализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft biАнализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft bi
 
Big data. Тренды и технологии. Использование в работе с клиентами.
Big data. Тренды и технологии. Использование в работе с клиентами.Big data. Тренды и технологии. Использование в работе с клиентами.
Big data. Тренды и технологии. Использование в работе с клиентами.
 
База знаний службы техподдержки
База знаний службы техподдержкиБаза знаний службы техподдержки
База знаний службы техподдержки
 
Qlik: новый подход к бизнес-аналитике фармацевтических компаний
Qlik: новый подход к бизнес-аналитике фармацевтических компанийQlik: новый подход к бизнес-аналитике фармацевтических компаний
Qlik: новый подход к бизнес-аналитике фармацевтических компаний
 
QlikView for Retail, QlikTech, Георгий Нанеишвили
QlikView for Retail, QlikTech, Георгий НанеишвилиQlikView for Retail, QlikTech, Георгий Нанеишвили
QlikView for Retail, QlikTech, Георгий Нанеишвили
 
Владислав Флакс — OWOX — IСBDA 2015
Владислав Флакс — OWOX — IСBDA 2015Владислав Флакс — OWOX — IСBDA 2015
Владислав Флакс — OWOX — IСBDA 2015
 
Qlik Sense в Zenden || Консультационная Группа АТК
Qlik Sense в Zenden || Консультационная Группа АТКQlik Sense в Zenden || Консультационная Группа АТК
Qlik Sense в Zenden || Консультационная Группа АТК
 
генератор отчетов Calligraph
генератор отчетов Calligraphгенератор отчетов Calligraph
генератор отчетов Calligraph
 

Viewers also liked

CleverDATA. Как же на самом деле заработать на данных
CleverDATA. Как же на самом деле заработать на данныхCleverDATA. Как же на самом деле заработать на данных
CleverDATA. Как же на самом деле заработать на данныхHybridRussia
 
Machine Learning + Analytics in Splunk
Machine Learning + Analytics in SplunkMachine Learning + Analytics in Splunk
Machine Learning + Analytics in SplunkSplunk
 
Splunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service IntelligenceSplunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service IntelligenceCleverDATA
 
SplunkLive! Warsaw 2016 - ING Bank
SplunkLive! Warsaw 2016 - ING BankSplunkLive! Warsaw 2016 - ING Bank
SplunkLive! Warsaw 2016 - ING BankSplunk
 
Cnews Forum 2016. Цифровые Двойники - Как повысить продажи не выходя из офиса.
Cnews Forum 2016. Цифровые Двойники - Как повысить продажи не выходя из офиса. Cnews Forum 2016. Цифровые Двойники - Как повысить продажи не выходя из офиса.
Cnews Forum 2016. Цифровые Двойники - Как повысить продажи не выходя из офиса. Den Reymer
 

Viewers also liked (7)

CleverDATA. Как же на самом деле заработать на данных
CleverDATA. Как же на самом деле заработать на данныхCleverDATA. Как же на самом деле заработать на данных
CleverDATA. Как же на самом деле заработать на данных
 
Machine Learning + Analytics in Splunk
Machine Learning + Analytics in SplunkMachine Learning + Analytics in Splunk
Machine Learning + Analytics in Splunk
 
Splunk sberbank cib
Splunk sberbank cibSplunk sberbank cib
Splunk sberbank cib
 
Splunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service IntelligenceSplunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service Intelligence
 
Tinkoff splunk 2016
Tinkoff splunk 2016Tinkoff splunk 2016
Tinkoff splunk 2016
 
SplunkLive! Warsaw 2016 - ING Bank
SplunkLive! Warsaw 2016 - ING BankSplunkLive! Warsaw 2016 - ING Bank
SplunkLive! Warsaw 2016 - ING Bank
 
Cnews Forum 2016. Цифровые Двойники - Как повысить продажи не выходя из офиса.
Cnews Forum 2016. Цифровые Двойники - Как повысить продажи не выходя из офиса. Cnews Forum 2016. Цифровые Двойники - Как повысить продажи не выходя из офиса.
Cnews Forum 2016. Цифровые Двойники - Как повысить продажи не выходя из офиса.
 

Similar to презентация Clever data конференция splunk октябрь 2016 v2

CleverDATA_Oracle Cloud BI Day 2015
CleverDATA_Oracle Cloud BI Day 2015CleverDATA_Oracle Cloud BI Day 2015
CleverDATA_Oracle Cloud BI Day 2015CleverDATA
 
Operational Analytics on Splunk
Operational Analytics on SplunkOperational Analytics on Splunk
Operational Analytics on SplunkCleverDATA
 
CXP Analyzer
CXP AnalyzerCXP Analyzer
CXP AnalyzerMag0s
 
Qlik view комплексное аналитическое retail решение v4,4- для сайта (без скр...
Qlik view   комплексное аналитическое retail решение v4,4- для сайта (без скр...Qlik view   комплексное аналитическое retail решение v4,4- для сайта (без скр...
Qlik view комплексное аналитическое retail решение v4,4- для сайта (без скр...Геннадий Красношлык
 
Мониторинг веб-проектов: штаб оперативного реагирования и аналитический центр
Мониторинг веб-проектов: штаб оперативного реагирования и аналитический центрМониторинг веб-проектов: штаб оперативного реагирования и аналитический центр
Мониторинг веб-проектов: штаб оперативного реагирования и аналитический центрsportgid
 
Прогнозная аналитика
Прогнозная аналитикаПрогнозная аналитика
Прогнозная аналитикаIgor Philipenko
 
Защищенная веб-аналитика для банков, телекомов, медицинских центров
Защищенная веб-аналитика для банков, телекомов, медицинских центровЗащищенная веб-аналитика для банков, телекомов, медицинских центров
Защищенная веб-аналитика для банков, телекомов, медицинских центровAndrew Fadeev
 
QlikView Conference Minsk 2014 A2 Consulting
QlikView Conference Minsk 2014 A2 ConsultingQlikView Conference Minsk 2014 A2 Consulting
QlikView Conference Minsk 2014 A2 Consultinga2consulting
 
Hl2008 Spy Log Architechture 169
Hl2008 Spy Log Architechture 169Hl2008 Spy Log Architechture 169
Hl2008 Spy Log Architechture 169Media Gorod
 
Cxp analyzer-mix-4
Cxp analyzer-mix-4Cxp analyzer-mix-4
Cxp analyzer-mix-4Mag0s
 
Как создать дата-платформу с нуля / Павел Тарасов (ЦИАН)
Как создать дата-платформу с нуля / Павел Тарасов (ЦИАН)Как создать дата-платформу с нуля / Павел Тарасов (ЦИАН)
Как создать дата-платформу с нуля / Павел Тарасов (ЦИАН)Ontico
 
венчурам презентация Calligraph
венчурам презентация Calligraphвенчурам презентация Calligraph
венчурам презентация CalligraphВладимир Лосев
 
New SpyLOG architechture (Highload 2008)
New SpyLOG architechture (Highload 2008)New SpyLOG architechture (Highload 2008)
New SpyLOG architechture (Highload 2008)Sergey Skvortsov
 
Семантическое ядро рунета
Семантическое ядро рунетаСемантическое ядро рунета
Семантическое ядро рунетаCEE-SEC(R)
 
Predictive models for Operational analytics
Predictive models for Operational analyticsPredictive models for Operational analytics
Predictive models for Operational analyticsCleverDATA
 
Сценарии и статистика (Юрий Грановский, лекция по веб-аналитике и AB-тестиров...
Сценарии и статистика (Юрий Грановский, лекция по веб-аналитике и AB-тестиров...Сценарии и статистика (Юрий Грановский, лекция по веб-аналитике и AB-тестиров...
Сценарии и статистика (Юрий Грановский, лекция по веб-аналитике и AB-тестиров...Yuryy Granovsky
 

Similar to презентация Clever data конференция splunk октябрь 2016 v2 (20)

Forum
ForumForum
Forum
 
CleverDATA_Oracle Cloud BI Day 2015
CleverDATA_Oracle Cloud BI Day 2015CleverDATA_Oracle Cloud BI Day 2015
CleverDATA_Oracle Cloud BI Day 2015
 
Presty
PrestyPresty
Presty
 
Принцип достаточности
Принцип достаточностиПринцип достаточности
Принцип достаточности
 
Operational Analytics on Splunk
Operational Analytics on SplunkOperational Analytics on Splunk
Operational Analytics on Splunk
 
CXP Analyzer
CXP AnalyzerCXP Analyzer
CXP Analyzer
 
Qlik view комплексное аналитическое retail решение v4,4- для сайта (без скр...
Qlik view   комплексное аналитическое retail решение v4,4- для сайта (без скр...Qlik view   комплексное аналитическое retail решение v4,4- для сайта (без скр...
Qlik view комплексное аналитическое retail решение v4,4- для сайта (без скр...
 
Мониторинг веб-проектов: штаб оперативного реагирования и аналитический центр
Мониторинг веб-проектов: штаб оперативного реагирования и аналитический центрМониторинг веб-проектов: штаб оперативного реагирования и аналитический центр
Мониторинг веб-проектов: штаб оперативного реагирования и аналитический центр
 
Прогнозная аналитика
Прогнозная аналитикаПрогнозная аналитика
Прогнозная аналитика
 
Защищенная веб-аналитика для банков, телекомов, медицинских центров
Защищенная веб-аналитика для банков, телекомов, медицинских центровЗащищенная веб-аналитика для банков, телекомов, медицинских центров
Защищенная веб-аналитика для банков, телекомов, медицинских центров
 
QlikView Conference Minsk 2014 A2 Consulting
QlikView Conference Minsk 2014 A2 ConsultingQlikView Conference Minsk 2014 A2 Consulting
QlikView Conference Minsk 2014 A2 Consulting
 
Hl2008 Spy Log Architechture 169
Hl2008 Spy Log Architechture 169Hl2008 Spy Log Architechture 169
Hl2008 Spy Log Architechture 169
 
Cxp analyzer-mix-4
Cxp analyzer-mix-4Cxp analyzer-mix-4
Cxp analyzer-mix-4
 
Как создать дата-платформу с нуля / Павел Тарасов (ЦИАН)
Как создать дата-платформу с нуля / Павел Тарасов (ЦИАН)Как создать дата-платформу с нуля / Павел Тарасов (ЦИАН)
Как создать дата-платформу с нуля / Павел Тарасов (ЦИАН)
 
венчурам презентация Calligraph
венчурам презентация Calligraphвенчурам презентация Calligraph
венчурам презентация Calligraph
 
New SpyLOG architechture (Highload 2008)
New SpyLOG architechture (Highload 2008)New SpyLOG architechture (Highload 2008)
New SpyLOG architechture (Highload 2008)
 
Семантическое ядро рунета
Семантическое ядро рунетаСемантическое ядро рунета
Семантическое ядро рунета
 
Predictive models for Operational analytics
Predictive models for Operational analyticsPredictive models for Operational analytics
Predictive models for Operational analytics
 
Сценарии и статистика (Юрий Грановский, лекция по веб-аналитике и AB-тестиров...
Сценарии и статистика (Юрий Грановский, лекция по веб-аналитике и AB-тестиров...Сценарии и статистика (Юрий Грановский, лекция по веб-аналитике и AB-тестиров...
Сценарии и статистика (Юрий Грановский, лекция по веб-аналитике и AB-тестиров...
 
Презентация Tibco spotfire
Презентация Tibco spotfireПрезентация Tibco spotfire
Презентация Tibco spotfire
 

More from Timur Bagirov

Splunk for NAC in Yandex
Splunk for NAC in YandexSplunk for NAC in Yandex
Splunk for NAC in YandexTimur Bagirov
 
Splunk in Rakuten: Splunk as a Service for all
Splunk in Rakuten: Splunk as a Service for allSplunk in Rakuten: Splunk as a Service for all
Splunk in Rakuten: Splunk as a Service for allTimur Bagirov
 
Qwasi Splunk and NCR Integration: Business Analytics
Qwasi Splunk and NCR Integration: Business AnalyticsQwasi Splunk and NCR Integration: Business Analytics
Qwasi Splunk and NCR Integration: Business AnalyticsTimur Bagirov
 
Splunk in Yoox: Security and Compliance
Splunk in Yoox: Security and ComplianceSplunk in Yoox: Security and Compliance
Splunk in Yoox: Security and ComplianceTimur Bagirov
 
Splunk in Target: Internet of Things (Robot Analytics)
Splunk in Target: Internet of Things (Robot Analytics)Splunk in Target: Internet of Things (Robot Analytics)
Splunk in Target: Internet of Things (Robot Analytics)Timur Bagirov
 
Splunk in Nordstrom: IT Operations
Splunk in Nordstrom: IT OperationsSplunk in Nordstrom: IT Operations
Splunk in Nordstrom: IT OperationsTimur Bagirov
 
Splunk in Otto: Business Analytics
Splunk in Otto: Business Analytics Splunk in Otto: Business Analytics
Splunk in Otto: Business Analytics Timur Bagirov
 
Splunk in Staples: IT Operations
Splunk in Staples: IT OperationsSplunk in Staples: IT Operations
Splunk in Staples: IT OperationsTimur Bagirov
 
Splunk in John Lewis: Business Analytics
Splunk in John Lewis: Business AnalyticsSplunk in John Lewis: Business Analytics
Splunk in John Lewis: Business AnalyticsTimur Bagirov
 
Splunk Check Point технологические партнеры
Splunk Check Point технологические партнерыSplunk Check Point технологические партнеры
Splunk Check Point технологические партнерыTimur Bagirov
 
Доступная безопасность: смесь инструментов с данными. Советы архитектора Oracle
Доступная безопасность: смесь инструментов с данными. Советы архитектора OracleДоступная безопасность: смесь инструментов с данными. Советы архитектора Oracle
Доступная безопасность: смесь инструментов с данными. Советы архитектора OracleTimur Bagirov
 
Немного о Splunk в Yota
Немного о Splunk в YotaНемного о Splunk в Yota
Немного о Splunk в YotaTimur Bagirov
 
Splunk live мегафон 2015 - v4
Splunk live мегафон 2015 - v4Splunk live мегафон 2015 - v4
Splunk live мегафон 2015 - v4Timur Bagirov
 
Splunk company overview april. 2015
Splunk company overview   april. 2015Splunk company overview   april. 2015
Splunk company overview april. 2015Timur Bagirov
 

More from Timur Bagirov (14)

Splunk for NAC in Yandex
Splunk for NAC in YandexSplunk for NAC in Yandex
Splunk for NAC in Yandex
 
Splunk in Rakuten: Splunk as a Service for all
Splunk in Rakuten: Splunk as a Service for allSplunk in Rakuten: Splunk as a Service for all
Splunk in Rakuten: Splunk as a Service for all
 
Qwasi Splunk and NCR Integration: Business Analytics
Qwasi Splunk and NCR Integration: Business AnalyticsQwasi Splunk and NCR Integration: Business Analytics
Qwasi Splunk and NCR Integration: Business Analytics
 
Splunk in Yoox: Security and Compliance
Splunk in Yoox: Security and ComplianceSplunk in Yoox: Security and Compliance
Splunk in Yoox: Security and Compliance
 
Splunk in Target: Internet of Things (Robot Analytics)
Splunk in Target: Internet of Things (Robot Analytics)Splunk in Target: Internet of Things (Robot Analytics)
Splunk in Target: Internet of Things (Robot Analytics)
 
Splunk in Nordstrom: IT Operations
Splunk in Nordstrom: IT OperationsSplunk in Nordstrom: IT Operations
Splunk in Nordstrom: IT Operations
 
Splunk in Otto: Business Analytics
Splunk in Otto: Business Analytics Splunk in Otto: Business Analytics
Splunk in Otto: Business Analytics
 
Splunk in Staples: IT Operations
Splunk in Staples: IT OperationsSplunk in Staples: IT Operations
Splunk in Staples: IT Operations
 
Splunk in John Lewis: Business Analytics
Splunk in John Lewis: Business AnalyticsSplunk in John Lewis: Business Analytics
Splunk in John Lewis: Business Analytics
 
Splunk Check Point технологические партнеры
Splunk Check Point технологические партнерыSplunk Check Point технологические партнеры
Splunk Check Point технологические партнеры
 
Доступная безопасность: смесь инструментов с данными. Советы архитектора Oracle
Доступная безопасность: смесь инструментов с данными. Советы архитектора OracleДоступная безопасность: смесь инструментов с данными. Советы архитектора Oracle
Доступная безопасность: смесь инструментов с данными. Советы архитектора Oracle
 
Немного о Splunk в Yota
Немного о Splunk в YotaНемного о Splunk в Yota
Немного о Splunk в Yota
 
Splunk live мегафон 2015 - v4
Splunk live мегафон 2015 - v4Splunk live мегафон 2015 - v4
Splunk live мегафон 2015 - v4
 
Splunk company overview april. 2015
Splunk company overview   april. 2015Splunk company overview   april. 2015
Splunk company overview april. 2015
 

презентация Clever data конференция splunk октябрь 2016 v2

  • 1. Make your data clever
  • 2. cleverdata.ru | info@cleverdata.ru Структура презентации > Цель работ > Ограничения > Прикладные задачи > Реализация > Использование > Возможности splunk> в области Data mining и Machine Learning
  • 3. cleverdata.ru | info@cleverdata.ru Цель работ > Цель работ – определить пути расширения функциональных возможностей splunk> для решения индивидуальных прикладных задач. При этом: 1. использовать Splunk в качестве источника данных; 2. выводить результаты наших расчетов в интерфейс splunk>.
  • 4. cleverdata.ru | info@cleverdata.ru Прикладные задачи 1. Классификация клиентов в зависимости от параметров: - время последнего посещения клиентом торговых точек ритейлера. Назовем этот параметр – R (Recency). - частота покупок клиента в торговых точках ритейлера. Назовем этот параметр - F(Frequency). Дано: Имеется зависимость (закон распределения) времени последнего визита R(recency) от частоты покупок F(frequency). В соответствии с данным законом распределения, клиенты разделены на три категории: "Перспективные", "Нормальные", "Неперспективные". Задача: Необходимо определить категорию клиента на основании данных о времени его последнего визита R(recency) и частоты покупок F(frequency) для тех клиентов, у которых категория не задана. 2. Классификация состояния платежного шлюза в зависимости от параметров: время суток (периодичность - 1 час), количество запросов в час. Дано: Имеется зависимость (закон распределения) количества запросов на платежный шлюз в час от времени суток (с группировкой по часам). В соответствии с данным законом распределения, состояние может быть: "Спокойное", "Нормальное", "Критическое". Задача: Необходимо определить состояние платежного шлюза на основании информации о времени суток и количестве запросов в час для тех значений, у которых состояние неизвестно.
  • 5. cleverdata.ru | info@cleverdata.ru Реализация > Подход к решению > Настройка системного Python > Настройка splunk> > Разработка модулей Python > Перезагрузка splunk> [dtree] type = python filename = dtree.py generating = false streaming = false retainsevents = false
  • 8. cleverdata.ru | info@cleverdata.ru Data mining и Machine Learning Отрасль Пример IT Прогноз объема интернет-трафика по дням недели. IT Real-time анализ логов proxy-сервера и web-сервера на наличие определенных слов или выражений для предотвращения SQL injections. Используется наивная байесовская классификация. IT Прогнозирование нагрузки на Службу поддержки на основании активности клиентов (например, смена/сброс пароля, запрос баланса и т.д.). Планирование активностей по привлечению дополнительных ресурсов в пиковые периоды. Банки Прогноз нагрузки на платежный шлюз банка (например, запросов в секунду) на основании имеющейся статистики. Определение пиковых и адаптивных пороговых значений на основании функционала Splunk по выявлению аномалий (anomaly detection). Банки Real-time анализ ВСЕХ действий клиентов (в т.ч. потенциальных) на сайте банка/на странице с кредитным калькулятором для принятия решения о выдаче кредита. Использование дополнительных имеющихся атрибутов (предикторов). Промышлен ность Определение вероятности снижения энергоэффективности оборудования (повышение потребляемой мощности, снижение КПД) на основании характеристик его работы из логов управляющих систем, информации с датчиков и сенсоров и выявленной статистики снижения энергоэффективности. Проведение внеплановых замен/модернизаций оборудования на основании полученного прогноза.
  • 9. cleverdata.ru | info@cleverdata.ru Data mining и Machine Learning Отрасль Пример Маркетинг 1. Прогнозирование объема продаж. 2. Определение ассоциативных правил, приводящих к покупкам на сайте. Динамическое формирование страниц сайта (контента страниц) для повышения конверсии. Безопасность Определение транзакций клиентов, которые выполняются со скоростью, значительно превышающую скорость других клиентов (средняя частота использования карты, идентификатора клиента и т.д.). Данное поведение может быть идентифицировано как шаблон. Например, использование интернет-ботов (bot) для перебора паролей/загрузки канала или планирование DDoS атак. Используется функционал Splunk по выявлению аномалий (anomaly detection). Безопасность Определение шаблонов аномальной передачи данных. Построение предиктивной модели, которая будет определять такие шаблоны и уведомлять заинтересованных лиц, используя механизм alert’ов. Телеком Predict Customer Churn. Построение модели оттока клиентов.
  • 10. cleverdata.ru | info@cleverdata.ru > Большая библиотека команд и алгоритмов. > Возможность использовать R и Python с помощью R Project App и SDK for Python. > Набор дополнительных приложений: Machine Learning Toolkit and Showcase, Predict App, Sentiment analysis App, Prelert. > Богатые возможности визуализации (в т.ч. использование D3). Анализ трендов: predict, trendline, autoregress Выявление аномалий и сегментирование: anomalies, cluster, kmeans Data mining и Machine Learning
  • 11. cleverdata.ru | info@cleverdata.ru Команды и алгоритмы: > корреляция; > кластеризация (k means, cluster); > ассоциативные правила; > классификация и прогнозирование (байесовская классификация, регрессии, SVM); > поиск аномалий; > метод главных компонент (PCA). Команда Описание analyzefields Analyze numerical fields for their ability to predict another discrete field. anomalies Computes an "unexpectedness" score for an event. anomalousvalue Finds and summarizes irregular, or uncommon, search results. cluster Clusters similar events together. kmeans Performs k-means clustering on selected fields. outlier Removes outlying numerical values. rare Displays the least common values of a field. contingency Builds a contingency table, a co-occurrence matrix, for the values of two fields. correlate Calculates the correlation between different fields. predict Enables you to use time series algorithms to predict future values of fields. trendline Computes moving averages of fields. x11 Enables you to determine the trend in your data by removing the seasonal pattern. Data mining и Machine Learning
  • 12. cleverdata.ru | info@cleverdata.ru ML Toolkit and Showcase > Линейная регрессия > Логистическая регрессия > Определение аномалий > Кластеризация > Прогнозирование
  • 13. cleverdata.ru | info@cleverdata.ru Собственные приложения и визуализация с использованием D3
  • 14. cleverdata.ru | info@cleverdata.ru Спасибо! Расширение функциональных возможностей Splunk – это просто