Архитектура Apache HAWQ Highload++ 2015

Архитектура
HAWQ
Грищенко
Алексей

Кто я?
Enterprise Architect @ Pivotal
• 7 лет в задачах обработки данных
• 5 лет с MPP-системами
• 4 года с Hadoop
• HAWQ - с первой beta
• Отвечаю за архитектуру всех внедрений HAWQ и
Greenplum в EMEA
• Spark contributor
• http://0x0fff.com

О чем расскажу?
• Что такое HAWQ

• Зачем он нужен

• Из каких компонент он состоит

• Как он работает

• Пример выполнения запроса

• Пример выполнения запроса
• Альтернативные решения

Что такое
• Аналитический движок SQL-on-Hadoop

Что такое
• HAdoop With Queries

Что такое
Postgres Greenplu
m
HAWQ
2005
Fork
Postgres 8.0.2

Что такое
Postgres Greenplu
m
HAWQ
2005
Fork
Postgres 8.0.2
2009 Rebase
Postgres 8.2.15

Что такое
Postgres Greenplu
m
HAWQ
2005
Fork
Postgres 8.0.2
2009 Rebase
Postgres 8.2.15
2011 Fork
GPDB 4.2.0.0

Что такое
Postgres Greenplu
m
HAWQ
2005
Fork
Postgres 8.0.2
2009 Rebase
Postgres 8.2.15
2011 Fork
GPDB 4.2.0.0
2013
HAWQ 1.0.0.0

Что такое
Postgres Greenplu
m
HAWQ
2005
Fork
Postgres 8.0.2
2009 Rebase
Postgres 8.2.15
2011 Fork
GPDB 4.2.0.0
2013
HAWQ 1.0.0.0
HAWQ 2.0.0.0
Open Source
2015

HAWQ – это …
• 1’500’000 строк кода C и C++

HAWQ – это …
– Из которых 200’000 только в заголовочных
файлах

HAWQ – это …
файлах
• 180’000 строк кода Python

HAWQ – это …
файлах
• 60’000 строк кода Java

HAWQ – это …
файлах
• 23’000 строк Makefile’ов

HAWQ – это …
файлах
• 7’000 строк shell-скриптов

HAWQ – это …
файлах
• Более 50 корпоративных клиентов

HAWQ – это …
файлах
• Более 50 корпоративных клиентов
– Из них более 10 в EMEA

Apache HAWQ
• Apache HAWQ (incubating) с 09’2015
– http://hawq.incubator.apache.org
– https://github.com/apache/incubator-hawq
• Что находится в Open Source
– Исходники версии HAWQ 2.0 альфа
– Релиз HAWQ 2.0 бэта до конца 2015 года
– Релиз HAWQ 2.0 GA в начале 2016
• Сообщество еще только зарождается –
присоединяйтесь!

Зачем он нужен?
• Универсальный SQL-интерфейс к данным
Hadoop для BI с ANSI SQL-92, -99, -2003

– Пример из практики – запрос Cognos на 5000
строк с множеством оконных функций

• Универсальный инструмент для ad hoc
аналитики

аналитики
– Пример из практики – распарсить URL,
выдернув из него имя хоста и протокол

аналитики
• Хорошая производительность

аналитики
• Хорошая производительность
– Сколько раз данные будут скинуты на HDD для
выполнения SQL-запроса в Hive?

Кластер с HAWQ
Сервер 1
SNameNode
Сервер 4
ZK JM
NameNode
Сервер 3
ZK JM
Сервер 2
ZK JM
Сервер 6
Datanode
Сервер N
Datanode
Сервер 5
Datanode
interconnect
…

Сервер 1
SNameNode
Сервер 4
ZK JM
NameNode
Сервер 3
ZK JM
Сервер 2
ZK JM
Сервер 6
Datanode
Сервер N
Datanode
Сервер 5
Datanode
YARN NM YARN NM YARN NM
YARN RM
YARN App
Timeline
interconnect
…

HAWQ Master
Сервер 1
SNameNode
Сервер 4
ZK JM
NameNode
Сервер 3
ZK JM
HAWQ
Standby
Сервер 2
ZK JM
HAWQ Segment
Сервер 6
Datanode
HAWQ Segment
Сервер N
Datanode
HAWQ Segment
Сервер 5
Datanode
YARN RM
YARN App
Timeline
interconnect
…

Мастер Сервера
Сервер 1
SNameNode
Сервер 4
ZK JM
NameNode
Сервер 3
ZK JM
Сервер 2
ZK JM
HAWQ Segment
Сервер 6
Datanode
HAWQ Segment
Сервер N
Datanode
HAWQ Segment
Сервер 5
Datanode
YARN RM
YARN App
Timeline
interconnect
…
HAWQ Master
HAWQ
Standby

Мастер Сервера
HAWQ Master
Парсер
запросов
Оптимизатор
запросов
Глобальный
менеджер
ресурсов
Менеджер
транзакций
Диспетчер
процессов
Каталог
метаданных
HAWQ Standby Master
Парсер
запросов
запросов
Глобальный
менеджер
ресурсов
Менеджер
транзакций
Диспетчер
процессов
Каталог
метаданных
WAL
репл.

HAWQ Master
HAWQ
Standby
Сегменты
Сервер 1
SNameNode
Сервер 4
ZK JM
NameNode
Сервер 3
ZK JM
Сервер 2
ZK JM
Сервер 6
Datanode
Сервер N
Datanode
Сервер 5
Datanode
YARN RM
YARN App
Timeline
interconnect
HAWQ Segment HAWQ SegmentHAWQ Segment …

Сегменты
HAWQ Segment
Движок выполнения
запросов
libhdfs3
Расширения PXF
HDFS Datanode
Локальная ФС
Директория для
временных данных
Логи
YARN Node Manager

Метаданные
• Структура аналогична структуре каталога
Postgres

Postgres
• Статистика

Postgres
– Количество записей и страниц в таблице

Postgres
– Наиболее частые значения для каждого
поля

Postgres
поля
– Гистограмма для каждого числового поля

Postgres
поля
– Количество уникальных значений в поле

Postgres
поля
– Количество уникальных значений в поле
– Количество null значений в поле

Статистика
Без статистики
Join двух таблиц, сколько записей в результате?

 От 0 до бесконечности

Количество строк
Join двух таблиц по 1000 записей в каждой, сколько
записей в результате?

 От 0 до 1’000’000

Гистограммы и MCV
 От 0 до 1’000’000
Join двух таблиц по 1000 записей в каждой, с
известной кардинальностью, гистограммой
распределения, наиболее частыми значениями,
количеством null?

Гистограммы и MCV
 От 0 до 1’000’000
Join двух таблиц по 1000 записей в каждой, с
известной кардинальностью, гистограммой
распределения, наиболее частыми значениями,
количеством null?
 ~ От 500 до 1’500

• Информация о структуре таблицы
ID Name Num Price
1 Яблоко 10 50
2 Груша 20 80
3 Банан 40 40
4 Апельсин 25 50
5 Киви 5 120
6 Арбуз 20 30
7 Дыня 40 100
8 Ананас 35 90

– Поля распределения
ID Name Num Price
2 Груша 20 80
3 Банан 40 40
5 Киви 5 120
6 Арбуз 20 30
7 Дыня 40 100
hash(ID
)

– Количество hash bucket распределения
ID Name Num Price
2 Груша 20 80
3 Банан 40 40
5 Киви 5 120
6 Арбуз 20 30
7 Дыня 40 100
hash(ID
)
ID Name Num Price
2 Груша 20 80
3 Банан 40 40
5 Киви 5 120
6 Арбуз 20 30
7 Дыня 40 100

– Партиционирование (hash, list, range)
ID Name Num Price
2 Груша 20 80
3 Банан 40 40
5 Киви 5 120
6 Арбуз 20 30
7 Дыня 40 100
hash(ID
)
ID Name Num Price
2 Груша 20 80
3 Банан 40 40
5 Киви 5 120
6 Арбуз 20 30
7 Дыня 40 100

• Общие метаданные
– Пользователи и группы

– Права доступа к объектам

– Права доступа к объектам
• Хранимые процедуры
– PL/pgSQL, PL/Java, PL/Python, PL/Perl, PL/R

Оптимизатор Запросов
• Используется cost-based оптимизатор

• Выбрать можно один из двух

– Planner – модифицированный оптимизатор
Postgres

Postgres
– ORCA (Pivotal Query Optimizer) – разработан
специально для HAWQ

Postgres
• Хинты оптимизатора работают как в
Postgres

Postgres
Postgres
– Включить/отключить определенную операцию

Postgres
Postgres
– Включить/отключить определенную операцию
– Изменить веса базовых операций

Формат Хранения
Какой формат хранения данных является
наиболее оптимальным?

 Зависит от того, что является для вас
критерием оптимальности

– Минимальное потребление ресурсов CPU

– Минимальный объем занимаемого дискового пр-
ва

ва
– Минимальное время извлечения записи по
ключу

ва
– Минимальное время извлечения записи по
ключу
– Минимальное время извлечения подмножества
столбцов таблицы

• Построчное хранение
– «Обрезанный» формат postgres
• Без toast
• Без ctid, xmin, xmax, cmin, cmax

• Построчное хранение
– «Обрезанный» формат postgres
• Без toast
• Без ctid, xmin, xmax, cmin, cmax
– Сжатие
• Без сжатия
• Quicklz
• Zlib уровни 1 - 9

• Apache Parquet
– Поколоночное хранение блоков
последовательных строк (“row group”)

• Apache Parquet
– Сжатие
• Snappy
• Gzip уровни 1 – 9

• Apache Parquet
– Сжатие
• Snappy
• Gzip уровни 1 – 9
– Размер “row group” и страницы задается для
каждой таблицы отдельно

Разделение Ресурсов
• Два основных варианта

– Независимое разделение – HAWQ и YARN не
знают друг о друге

– YARN – HAWQ запрашивает выделение
ресурсов у менеджера ресурсов YARN

• Гибкая утилизация кластера
– Запрос может выполняться на части нод

– Запрос может иметь несколько потоков
исполнения на каждой из нод

– Запрос может иметь несколько потоков
исполнения на каждой из нод
– Желаемый параллелизм можно задать
вручную

• Пулы ресурсов (Resource Queue) задают

– Количество параллельных запросов

– Приоритет на использование CPU

– Лимит по памяти

– Лимит по ядрам CPU

– MIN/MAX потоков исполнения в целом по
системе

системе
– MIN/MAX потоков исполнения на каждой ноде

системе
– MIN/MAX потоков исполнения на каждой ноде
• Задаются для пользователя или группы

Внешние Данные
• PXF
– Фреймворк для доступа к внешним данным
– Легко расширяется, многие пишут свои
плагины
– Официальные плагины: CSV, SequenceFile,
Avro, Hive, HBase
– Open Source плагины: JSON, Accumulo,
Cassandra, JDBC, Redis, Pipe

Внешние Данные
• PXF
– Фреймворк для доступа к внешним данным
– Легко расширяется, многие пишут свои
плагины
– Официальные плагины: CSV, SequenceFile,
Avro, Hive, HBase
– Open Source плагины: JSON, Accumulo,
Cassandra, JDBC, Redis, Pipe
• HCatalog
– HAWQ видит таблицы из HCatalog как свои
внутренние таблицы

Жизненный Цикл Запроса
HAWQ Master
Менедж. тр-й
Парсер Опт. запросов
Диспетч. проц.
Менедж. рес-ов
NameNode
Сервер 1
Локальная директория
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RMДвижок
Ресурсы Подготовка Исполнение Результат ЗавершениеПлан

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
ScanBars
b
HashJoinb.name =s.bar
ScanSells
s
Filterb.city ='SanFrancisco'
Projects.beer, s.price
MotionGather
MotionRedist(b.name)

План
HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
Подготовка Исполнение Результат ЗавершениеРесурсы

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
Нужно 5 контейнеров
Каждый по 1 ядру
и 256 MB RAM
План Подготовка Исполнение Результат ЗавершениеРесурсы

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
и 256 MB RAM
Сервер 1: 2 контейнера
Сервер 2: 1 контейнер
Сервер N: 2 контейнера

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
и 256 MB RAM
QE QE QE QE QE

Ресурсы
HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
План Исполнение Результат ЗавершениеПодготовка

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
ScanBars
b
ScanSells
s
MotionGather
РесурсыПлан Исполнение Результат ЗавершениеПодготовка

Подготовка
HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
ScanBars
b
ScanSells
s
MotionGather
РесурсыПлан Результат ЗавершениеИсполнение

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
ScanBars
b
ScanSells
s
MotionGather
ПодготовкаРесурсыПлан Результат ЗавершениеИсполнение

Исполнение
HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
ScanBars
b
ScanSells
s
MotionGather
ПодготовкаРесурсыПлан ЗавершениеРезультат

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
ScanBars
b
ScanSells
s
MotionGather
ИсполнениеПодготовкаРесурсыПлан ЗавершениеРезультат

Результат
HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
ИсполнениеПодготовкаРесурсыПлан Завершение

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
Освобождаем
РезультатИсполнениеПодготовкаРесурсыПлан Завершение

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
Ок
Освобождаем
РезультатИсполнениеПодготовкаРесурсыПлан Завершение

Завершение
HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RMДвижок
РезультатИсполнениеПодготовкаРесурсыПлан

Скорость
• Данные не приземляются на диск без
необходимости

Скорость
• Данные не буферизируются на сегментах
без необходимости

Скорость
• Данные передаются между нодами по UDP

Скорость
• Хороший стоимостной оптимизатор запросов

Скорость
• Оптимальность кода на C++

Скорость
• Оптимальность кода на C++
• Гибкая настройка параллелизма

Альтернативы
Hive SparkSQL Impala HAWQ

ANSI SQL

ANSI SQL
Встроенные языки

ANSI SQL
Нагрузка на диски

ANSI SQL
Параллелизм

ANSI SQL
Дистрибутивы

ANSI SQL
Стабильность

ANSI SQL
Стабильность
Сообщество

Задачи
• Интеграция с AWS и S3

Задачи
• Интеграция с Mesos

Задачи
• Улучшение интеграции с Ambari

Задачи
• Интеграция с дистрибутивами Cloudera,
MapR, IBM

Задачи
• Интеграция с дистрибутивами Cloudera,
MapR, IBM
• Сделать самый быстрый и удобный движок
SQL-on-Hadoop

Заключение
• Современный движок SQL-on-Hadoop
• Для анализа структурированных данных
• Объединяет в себе лучшие качества
альтернативных решений
• Новичок среди open source
• Community на стадии зарождения
Присоединяйтесь!

Вопросы
Apache HAWQ
http://hawq.incubator.apache.org
dev@hawq.incubator.apache.org
user@hawq.incubator.apache.org
Связь со мной: http://0x0fff.com

Архитектура Apache HAWQ Highload++ 2015

Recommended

Recommended

More Related Content

What's hot

What's hot (6)

Viewers also liked

Viewers also liked (20)

Similar to Архитектура Apache HAWQ Highload++ 2015

Similar to Архитектура Apache HAWQ Highload++ 2015 (20)

Архитектура Apache HAWQ Highload++ 2015