SlideShare a Scribd company logo
1 of 23
Download to read offline
Опыт внедрения Greenplum db
в Aviasales
Айнур Тимербаев
at@aviasales.ru
Проблема
Поиск решения
Архитектура
Инсталляция
Эксплуатация
Что имеем
Большое количество данных (3 TB)
Долгое построение отчетов
3 сервера (64 Ram x 1TB SSD)
Поиск решения
MPP архитектура
Адекватная стоимость/Open source
Простота работы и администрирования
Адекватный язык запросов
Наличие готовых BI инструментов
Open source
MPP architecture
Extension (not fork)
cstore_fdw + pg_shard
No DML
Limited joins
No CTE
Amazon dwh
PostgreSQL 8.2
Column store
MPP architecture
$13k per year (TB)
Open source
MPP architecture
Hybrid row/column store
PostgreSQL 8.2 (8.3)
PostgreSQL 8.2 (8.3)
8.3 Full text search (Apache SOLR)
8.4 Analytics functions (sum(baz) OVER (PARTITION BY foo))
8.4 CTE (WITH foo AS select * from bar)
9.5 GROUPING SETS/CUBE/ ROLLUP
9.6 parallel seq scan/aggregate (by design)
Fast
Very fast
Open source
Very specific SQL
Yandex ClickHouse
Horrible joins
Cant delete data(*)
Александр Зайцев. «Переезжаем на Yandex ClickHouse»
Tests
25M rows
0
50
100
150
200
1 week 1 month 3 month
Redshift Greenplum
Time in seconds (lower is better)
Time in seconds (lower is better)
0
17.5
35
52.5
70
Test 1 Test 2 Test 3
Yandex Clickhouse Greenplum
Архитектура
SQL
Master Node
Segment host Segment host
Segment host
Подробнее в блоге компании Тинькофф на Хабре
Beginners guide
Greenplum installation guide
10G interconnect
More disks (RAID 10)
swapoff
gpfdist — parallel file distribution program (more than 100GB)
s3 external tables (read/write/gzip)
COPY on master node (less than 100GB)
Don’t forget about VACUUM
Data loading
Data loading
No JSON type
pl/python + ujson
Don’t use JSON, please
Make columns from json fields (schema)
Default Monitoring
Greenplum command center
Basic charts and metrics
Query monitor
Historic data
Monitoring in Aviasales
CPU+RAM+IO+LOCKS and other PostgreSQL stuff
Resource queues
Spilling queries gp_toolkit.gp_workfile* view
Telegraf — collect metrics
Grafana dashboards (4.0 alerts)
5TB compressed data (14TB uncompressed)
No aggregates
Near realtime BI
Questions?
Айнур Тимербаев
at@aviasales.ru

More Related Content

Viewers also liked

как сделать свой кластер на postgresql 95
как сделать свой кластер на postgresql 95как сделать свой кластер на postgresql 95
как сделать свой кластер на postgresql 95Максим Селиверстов
 
3Com 3C16456B
3Com 3C16456B3Com 3C16456B
3Com 3C16456Bsavomir
 
Seo services in chandigarh
Seo services in chandigarhSeo services in chandigarh
Seo services in chandigarhSachin Kaushish
 
Frank Maene: pitching a business to private investors
Frank Maene: pitching a business to private investorsFrank Maene: pitching a business to private investors
Frank Maene: pitching a business to private investorsIAMCP MENTORING
 
If You Hate Assessment You're Doing it Wrong
If You Hate Assessment You're Doing it WrongIf You Hate Assessment You're Doing it Wrong
If You Hate Assessment You're Doing it WrongDean Shareski
 
131111使いやすさ評価 - ミニEVカーシェアリング「チョイモビ チョコハマ」
131111使いやすさ評価 - ミニEVカーシェアリング「チョイモビ チョコハマ」131111使いやすさ評価 - ミニEVカーシェアリング「チョイモビ チョコハマ」
131111使いやすさ評価 - ミニEVカーシェアリング「チョイモビ チョコハマ」Akihiro Moriyama
 
Assegnazione agevolata dei beni ai soci e trasformazioni agevolate in società...
Assegnazione agevolata dei beni ai soci e trasformazioni agevolate in società...Assegnazione agevolata dei beni ai soci e trasformazioni agevolate in società...
Assegnazione agevolata dei beni ai soci e trasformazioni agevolate in società...Simone Bucaioni
 
None More Black - the Dark Side of SEO
None More Black - the Dark Side of SEONone More Black - the Dark Side of SEO
None More Black - the Dark Side of SEORoberto Suggi Liverani
 
Gli ordini di protezione tra diritto civile e penale
Gli ordini di protezione tra diritto civile e penaleGli ordini di protezione tra diritto civile e penale
Gli ordini di protezione tra diritto civile e penaleIacopo Savi
 
Details Of Traffic Police Spot Fine in TamilNadu
Details Of Traffic Police Spot Fine in TamilNaduDetails Of Traffic Police Spot Fine in TamilNadu
Details Of Traffic Police Spot Fine in TamilNaduMohan Kumar
 

Viewers also liked (14)

как сделать свой кластер на postgresql 95
как сделать свой кластер на postgresql 95как сделать свой кластер на postgresql 95
как сделать свой кластер на postgresql 95
 
3Com 3C16456B
3Com 3C16456B3Com 3C16456B
3Com 3C16456B
 
Equity Research Report 20 March 2017 Ways2Capital
Equity Research Report 20 March 2017 Ways2CapitalEquity Research Report 20 March 2017 Ways2Capital
Equity Research Report 20 March 2017 Ways2Capital
 
Task 4 niche
Task 4 nicheTask 4 niche
Task 4 niche
 
Seo services in chandigarh
Seo services in chandigarhSeo services in chandigarh
Seo services in chandigarh
 
Ивентинг
ИвентингИвентинг
Ивентинг
 
Frank Maene: pitching a business to private investors
Frank Maene: pitching a business to private investorsFrank Maene: pitching a business to private investors
Frank Maene: pitching a business to private investors
 
Oferta y demanda
Oferta y demandaOferta y demanda
Oferta y demanda
 
If You Hate Assessment You're Doing it Wrong
If You Hate Assessment You're Doing it WrongIf You Hate Assessment You're Doing it Wrong
If You Hate Assessment You're Doing it Wrong
 
131111使いやすさ評価 - ミニEVカーシェアリング「チョイモビ チョコハマ」
131111使いやすさ評価 - ミニEVカーシェアリング「チョイモビ チョコハマ」131111使いやすさ評価 - ミニEVカーシェアリング「チョイモビ チョコハマ」
131111使いやすさ評価 - ミニEVカーシェアリング「チョイモビ チョコハマ」
 
Assegnazione agevolata dei beni ai soci e trasformazioni agevolate in società...
Assegnazione agevolata dei beni ai soci e trasformazioni agevolate in società...Assegnazione agevolata dei beni ai soci e trasformazioni agevolate in società...
Assegnazione agevolata dei beni ai soci e trasformazioni agevolate in società...
 
None More Black - the Dark Side of SEO
None More Black - the Dark Side of SEONone More Black - the Dark Side of SEO
None More Black - the Dark Side of SEO
 
Gli ordini di protezione tra diritto civile e penale
Gli ordini di protezione tra diritto civile e penaleGli ordini di protezione tra diritto civile e penale
Gli ordini di protezione tra diritto civile e penale
 
Details Of Traffic Police Spot Fine in TamilNadu
Details Of Traffic Police Spot Fine in TamilNaduDetails Of Traffic Police Spot Fine in TamilNadu
Details Of Traffic Police Spot Fine in TamilNadu
 

Similar to Опыт внедрения Greenplum в Aviasales.ru

Работа с Big Data
Работа с Big Data Работа с Big Data
Работа с Big Data MATLAB
 
Android Telegram S Optimizations
Android Telegram S OptimizationsAndroid Telegram S Optimizations
Android Telegram S OptimizationsStepan Korshakov
 
Денис Колошко, Пример нагруженной системы на базе продуктов Microsoft, Amazon...
Денис Колошко, Пример нагруженной системы на базе продуктов Microsoft, Amazon...Денис Колошко, Пример нагруженной системы на базе продуктов Microsoft, Amazon...
Денис Колошко, Пример нагруженной системы на базе продуктов Microsoft, Amazon...Tanya Denisyuk
 
2014.12.23 Александр Андреев, Parallels
2014.12.23 Александр Андреев, Parallels2014.12.23 Александр Андреев, Parallels
2014.12.23 Александр Андреев, ParallelsNikolay Samokhvalov
 
DB-Technologies-2017 Keynote (Strategy and tactics for db evaluation)
DB-Technologies-2017 Keynote (Strategy and tactics for db evaluation)DB-Technologies-2017 Keynote (Strategy and tactics for db evaluation)
DB-Technologies-2017 Keynote (Strategy and tactics for db evaluation)Andrei Nikolaenko
 
Android: Как написать приложение, которое не тормозит
Android: Как  написать приложение, которое не тормозитAndroid: Как  написать приложение, которое не тормозит
Android: Как написать приложение, которое не тормозитElena Kotina
 
Эксперименты с Postgres в Docker и облаках — оптимизация настроек и схемы ва...
 Эксперименты с Postgres в Docker и облаках — оптимизация настроек и схемы ва... Эксперименты с Postgres в Docker и облаках — оптимизация настроек и схемы ва...
Эксперименты с Postgres в Docker и облаках — оптимизация настроек и схемы ва...Nikolay Samokhvalov
 
Машины баз данных: концентрированное обозрение
Машины баз данных: концентрированное обозрениеМашины баз данных: концентрированное обозрение
Машины баз данных: концентрированное обозрениеAndrei Nikolaenko
 
XML Native Database на примере SednaXML
XML Native Database на примере SednaXMLXML Native Database на примере SednaXML
XML Native Database на примере SednaXMLSlach
 
phpConf 2010 Классификация систем хранения
phpConf 2010 Классификация систем храненияphpConf 2010 Классификация систем хранения
phpConf 2010 Классификация систем храненияSlach
 
20111002 information retrieval raskovalov_lecture3
20111002 information retrieval raskovalov_lecture320111002 information retrieval raskovalov_lecture3
20111002 information retrieval raskovalov_lecture3Computer Science Club
 
Hadoop -> Cascading -> Cascalog
Hadoop -> Cascading -> CascalogHadoop -> Cascading -> Cascalog
Hadoop -> Cascading -> CascalogAndrew Panfilov
 
Hadoop > cascading -> cascalog (short version)
Hadoop  > cascading -> cascalog (short version)Hadoop  > cascading -> cascalog (short version)
Hadoop > cascading -> cascalog (short version)Andrew Panfilov
 
Модернизация хранилища данных для использования передовой аналитики
Модернизация хранилища данных для использования передовой аналитикиМодернизация хранилища данных для использования передовой аналитики
Модернизация хранилища данных для использования передовой аналитикиElizaveta Alekseeva
 
Сервисы Azure для научных исследований
Сервисы Azure для научных исследованийСервисы Azure для научных исследований
Сервисы Azure для научных исследованийMicrosoft
 
Использование ленточных технологий для сокращения стоимости файловых хранилищ
Использование ленточных технологий для сокращения стоимости файловых хранилищИспользование ленточных технологий для сокращения стоимости файловых хранилищ
Использование ленточных технологий для сокращения стоимости файловых хранилищAlexander Reytman
 
High Load 2009 Dimaa Rus Ready 16 9
High Load 2009 Dimaa Rus Ready 16 9High Load 2009 Dimaa Rus Ready 16 9
High Load 2009 Dimaa Rus Ready 16 9HighLoad2009
 
12 HappyDev-lite-2014. Иван Погудин, Анатолий Никулин. Решение задач, связан...
12 HappyDev-lite-2014. Иван Погудин, Анатолий Никулин. Решение задач, связан...12 HappyDev-lite-2014. Иван Погудин, Анатолий Никулин. Решение задач, связан...
12 HappyDev-lite-2014. Иван Погудин, Анатолий Никулин. Решение задач, связан...HappyDev-lite
 

Similar to Опыт внедрения Greenplum в Aviasales.ru (20)

Работа с Big Data
Работа с Big Data Работа с Big Data
Работа с Big Data
 
Android Telegram S Optimizations
Android Telegram S OptimizationsAndroid Telegram S Optimizations
Android Telegram S Optimizations
 
Денис Колошко, Пример нагруженной системы на базе продуктов Microsoft, Amazon...
Денис Колошко, Пример нагруженной системы на базе продуктов Microsoft, Amazon...Денис Колошко, Пример нагруженной системы на базе продуктов Microsoft, Amazon...
Денис Колошко, Пример нагруженной системы на базе продуктов Microsoft, Amazon...
 
2014.12.23 Александр Андреев, Parallels
2014.12.23 Александр Андреев, Parallels2014.12.23 Александр Андреев, Parallels
2014.12.23 Александр Андреев, Parallels
 
DB-Technologies-2017 Keynote (Strategy and tactics for db evaluation)
DB-Technologies-2017 Keynote (Strategy and tactics for db evaluation)DB-Technologies-2017 Keynote (Strategy and tactics for db evaluation)
DB-Technologies-2017 Keynote (Strategy and tactics for db evaluation)
 
Android: Как написать приложение, которое не тормозит
Android: Как  написать приложение, которое не тормозитAndroid: Как  написать приложение, которое не тормозит
Android: Как написать приложение, которое не тормозит
 
Эксперименты с Postgres в Docker и облаках — оптимизация настроек и схемы ва...
 Эксперименты с Postgres в Docker и облаках — оптимизация настроек и схемы ва... Эксперименты с Postgres в Docker и облаках — оптимизация настроек и схемы ва...
Эксперименты с Postgres в Docker и облаках — оптимизация настроек и схемы ва...
 
Машины баз данных: концентрированное обозрение
Машины баз данных: концентрированное обозрениеМашины баз данных: концентрированное обозрение
Машины баз данных: концентрированное обозрение
 
XML Native Database на примере SednaXML
XML Native Database на примере SednaXMLXML Native Database на примере SednaXML
XML Native Database на примере SednaXML
 
phpConf 2010 Классификация систем хранения
phpConf 2010 Классификация систем храненияphpConf 2010 Классификация систем хранения
phpConf 2010 Классификация систем хранения
 
20111002 information retrieval raskovalov_lecture3
20111002 information retrieval raskovalov_lecture320111002 information retrieval raskovalov_lecture3
20111002 information retrieval raskovalov_lecture3
 
DSL без купюр
DSL без купюрDSL без купюр
DSL без купюр
 
Hadoop -> Cascading -> Cascalog
Hadoop -> Cascading -> CascalogHadoop -> Cascading -> Cascalog
Hadoop -> Cascading -> Cascalog
 
Hadoop > cascading -> cascalog (short version)
Hadoop  > cascading -> cascalog (short version)Hadoop  > cascading -> cascalog (short version)
Hadoop > cascading -> cascalog (short version)
 
Модернизация хранилища данных для использования передовой аналитики
Модернизация хранилища данных для использования передовой аналитикиМодернизация хранилища данных для использования передовой аналитики
Модернизация хранилища данных для использования передовой аналитики
 
Tarantool_qs
 Tarantool_qs Tarantool_qs
Tarantool_qs
 
Сервисы Azure для научных исследований
Сервисы Azure для научных исследованийСервисы Azure для научных исследований
Сервисы Azure для научных исследований
 
Использование ленточных технологий для сокращения стоимости файловых хранилищ
Использование ленточных технологий для сокращения стоимости файловых хранилищИспользование ленточных технологий для сокращения стоимости файловых хранилищ
Использование ленточных технологий для сокращения стоимости файловых хранилищ
 
High Load 2009 Dimaa Rus Ready 16 9
High Load 2009 Dimaa Rus Ready 16 9High Load 2009 Dimaa Rus Ready 16 9
High Load 2009 Dimaa Rus Ready 16 9
 
12 HappyDev-lite-2014. Иван Погудин, Анатолий Никулин. Решение задач, связан...
12 HappyDev-lite-2014. Иван Погудин, Анатолий Никулин. Решение задач, связан...12 HappyDev-lite-2014. Иван Погудин, Анатолий Никулин. Решение задач, связан...
12 HappyDev-lite-2014. Иван Погудин, Анатолий Никулин. Решение задач, связан...
 

Опыт внедрения Greenplum в Aviasales.ru