Опыт внедрения Greenplum в Aviasales.ru

•

3 likes•488 views

Максим Селиверстов

Доклад с pgconf2017

Technology

Опыт внедрения Greenplum db
в Aviasales
Айнур Тимербаев
at@aviasales.ru

Проблема
Поиск решения
Архитектура
Инсталляция
Эксплуатация

Что имеем
Большое количество данных (3 TB)
Долгое построение отчетов
3 сервера (64 Ram x 1TB SSD)

Поиск решения
MPP архитектура
Адекватная стоимость/Open source
Простота работы и администрирования
Адекватный язык запросов
Наличие готовых BI инструментов

Open source
MPP architecture
Extension (not fork)
cstore_fdw + pg_shard
No DML
Limited joins
No CTE

Amazon dwh
PostgreSQL 8.2
Column store
MPP architecture
$13k per year (TB)

Open source
MPP architecture
Hybrid row/column store
PostgreSQL 8.2 (8.3)
PostgreSQL 8.2 (8.3)

8.3 Full text search (Apache SOLR)
8.4 Analytics functions (sum(baz) OVER (PARTITION BY foo))
8.4 CTE (WITH foo AS select * from bar)
9.5 GROUPING SETS/CUBE/ ROLLUP
9.6 parallel seq scan/aggregate (by design)

Fast
Very fast
Open source
Very speciﬁc SQL
Yandex ClickHouse
Horrible joins
Cant delete data(*)
Александр Зайцев. «Переезжаем на Yandex ClickHouse»

0
50
100
150
200
1 week 1 month 3 month
Redshift Greenplum
Time in seconds (lower is better)

Time in seconds (lower is better)
0
17.5
35
52.5
70
Test 1 Test 2 Test 3
Yandex Clickhouse Greenplum

Архитектура
SQL
Master Node
Segment host Segment host
Segment host
Подробнее в блоге компании Тинькофф на Хабре

Beginners guide
Greenplum installation guide
10G interconnect
More disks (RAID 10)
swapoﬀ

gpfdist — parallel ﬁle distribution program (more than 100GB)
s3 external tables (read/write/gzip)
COPY on master node (less than 100GB)
Don’t forget about VACUUM
Data loading

Data loading
No JSON type
pl/python + ujson
Don’t use JSON, please
Make columns from json ﬁelds (schema)

Default Monitoring
Greenplum command center
Basic charts and metrics
Query monitor
Historic data

Monitoring in Aviasales
CPU+RAM+IO+LOCKS and other PostgreSQL stuﬀ
Resource queues
Spilling queries gp_toolkit.gp_workﬁle* view
Telegraf — collect metrics
Grafana dashboards (4.0 alerts)

5TB compressed data (14TB uncompressed)
No aggregates
Near realtime BI

Questions?
Айнур Тимербаев
at@aviasales.ru

Viewers also liked

как сделать свой кластер на postgresql 95Максим Селиверстов

3Com 3C16456Bsavomir

Equity Research Report 20 March 2017 Ways2CapitalWays2Capital | Investment Advisor

Task 4 nicheSimranpal Kandola

Seo services in chandigarhSachin Kaushish

ИвентингMaxim Shmatov

Frank Maene: pitching a business to private investorsIAMCP MENTORING

Oferta y demandagustavo torres perez

If You Hate Assessment You're Doing it WrongDean Shareski

131111使いやすさ評価 - ミニEVカーシェアリング「チョイモビチョコハマ」Akihiro Moriyama

Assegnazione agevolata dei beni ai soci e trasformazioni agevolate in società...Simone Bucaioni

None More Black - the Dark Side of SEORoberto Suggi Liverani

Gli ordini di protezione tra diritto civile e penaleIacopo Savi

Details Of Traffic Police Spot Fine in TamilNaduMohan Kumar

Viewers also liked (14)

как сделать свой кластер на postgresql 95

3Com 3C16456B

Equity Research Report 20 March 2017 Ways2Capital

Task 4 niche

Seo services in chandigarh

Ивентинг

Frank Maene: pitching a business to private investors

Oferta y demanda

If You Hate Assessment You're Doing it Wrong

131111使いやすさ評価 - ミニEVカーシェアリング「チョイモビチョコハマ」

Assegnazione agevolata dei beni ai soci e trasformazioni agevolate in società...

None More Black - the Dark Side of SEO

Gli ordini di protezione tra diritto civile e penale

Details Of Traffic Police Spot Fine in TamilNadu

Similar to Опыт внедрения Greenplum в Aviasales.ru

Работа с Big Data MATLAB

Android Telegram S OptimizationsStepan Korshakov

Денис Колошко, Пример нагруженной системы на базе продуктов Microsoft, Amazon...Tanya Denisyuk

2014.12.23 Александр Андреев, ParallelsNikolay Samokhvalov

DB-Technologies-2017 Keynote (Strategy and tactics for db evaluation)Andrei Nikolaenko

Android: Как написать приложение, которое не тормозитElena Kotina

Эксперименты с Postgres в Docker и облаках — оптимизация настроек и схемы ва...Nikolay Samokhvalov

Машины баз данных: концентрированное обозрениеAndrei Nikolaenko

XML Native Database на примере SednaXMLSlach

phpConf 2010 Классификация систем храненияSlach

20111002 information retrieval raskovalov_lecture3Computer Science Club

DSL без купюрMikhail Shcherbakov

Hadoop -> Cascading -> CascalogAndrew Panfilov

Hadoop > cascading -> cascalog (short version)Andrew Panfilov

Модернизация хранилища данных для использования передовой аналитикиElizaveta Alekseeva

Tarantool_qskuchinskaya

Сервисы Azure для научных исследованийMicrosoft

Использование ленточных технологий для сокращения стоимости файловых хранилищAlexander Reytman

High Load 2009 Dimaa Rus Ready 16 9HighLoad2009

12 HappyDev-lite-2014. Иван Погудин, Анатолий Никулин. Решение задач, связан...HappyDev-lite

Similar to Опыт внедрения Greenplum в Aviasales.ru (20)

Работа с Big Data

Android Telegram S Optimizations

Денис Колошко, Пример нагруженной системы на базе продуктов Microsoft, Amazon...

2014.12.23 Александр Андреев, Parallels

DB-Technologies-2017 Keynote (Strategy and tactics for db evaluation)

Android: Как написать приложение, которое не тормозит

Эксперименты с Postgres в Docker и облаках — оптимизация настроек и схемы ва...

Машины баз данных: концентрированное обозрение

XML Native Database на примере SednaXML

phpConf 2010 Классификация систем хранения

20111002 information retrieval raskovalov_lecture3

DSL без купюр

Hadoop -> Cascading -> Cascalog

Hadoop > cascading -> cascalog (short version)

Модернизация хранилища данных для использования передовой аналитики

Tarantool_qs

Сервисы Azure для научных исследований

Использование ленточных технологий для сокращения стоимости файловых хранилищ

High Load 2009 Dimaa Rus Ready 16 9

12 HappyDev-lite-2014. Иван Погудин, Анатолий Никулин. Решение задач, связан...

Опыт внедрения Greenplum в Aviasales.ru

1. Опыт внедрения Greenplum db в Aviasales Айнур Тимербаев at@aviasales.ru

2. Проблема Поиск решения Архитектура Инсталляция Эксплуатация

3. Что имеем Большое количество данных (3 TB) Долгое построение отчетов 3 сервера (64 Ram x 1TB SSD)

4. Поиск решения MPP архитектура Адекватная стоимость/Open source Простота работы и администрирования Адекватный язык запросов Наличие готовых BI инструментов

5. Open source MPP architecture Extension (not fork) cstore_fdw + pg_shard No DML Limited joins No CTE

6. Amazon dwh PostgreSQL 8.2 Column store MPP architecture $13k per year (TB)

7. Open source MPP architecture Hybrid row/column store PostgreSQL 8.2 (8.3) PostgreSQL 8.2 (8.3)

8. 8.3 Full text search (Apache SOLR) 8.4 Analytics functions (sum(baz) OVER (PARTITION BY foo)) 8.4 CTE (WITH foo AS select * from bar) 9.5 GROUPING SETS/CUBE/ ROLLUP 9.6 parallel seq scan/aggregate (by design)

9. Fast Very fast Open source Very speciﬁc SQL Yandex ClickHouse Horrible joins Cant delete data(*) Александр Зайцев. «Переезжаем на Yandex ClickHouse»

10. Tests 25M rows

11. 0 50 100 150 200 1 week 1 month 3 month Redshift Greenplum Time in seconds (lower is better)

12. Time in seconds (lower is better) 0 17.5 35 52.5 70 Test 1 Test 2 Test 3 Yandex Clickhouse Greenplum

13. Архитектура SQL Master Node Segment host Segment host Segment host Подробнее в блоге компании Тинькофф на Хабре

14. Beginners guide Greenplum installation guide 10G interconnect More disks (RAID 10) swapoﬀ

15. gpfdist — parallel ﬁle distribution program (more than 100GB) s3 external tables (read/write/gzip) COPY on master node (less than 100GB) Don’t forget about VACUUM Data loading

16. Data loading No JSON type pl/python + ujson Don’t use JSON, please Make columns from json ﬁelds (schema)

17. Default Monitoring Greenplum command center Basic charts and metrics Query monitor Historic data

18.

19. Monitoring in Aviasales CPU+RAM+IO+LOCKS and other PostgreSQL stuﬀ Resource queues Spilling queries gp_toolkit.gp_workﬁle* view Telegraf — collect metrics Grafana dashboards (4.0 alerts)

20.

21.

22. 5TB compressed data (14TB uncompressed) No aggregates Near realtime BI

23. Questions? Айнур Тимербаев at@aviasales.ru

Опыт внедрения Greenplum в Aviasales.ru

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (14)

Similar to Опыт внедрения Greenplum в Aviasales.ru

Similar to Опыт внедрения Greenplum в Aviasales.ru (20)

Опыт внедрения Greenplum в Aviasales.ru