2. Руководитель отдела аналитики в Netpeak
Чем я занимаюсь:
● Развиваю отдел аналитики в Netpeak
● Пишу расширения, пакеты для языка R
● Веду Telegram и YouTube канал R4marketing
● Преподаю на авторских онлайн курсах по
языку R
3. ❏ Что такое SQL, и почему я взял его за основу
❏ Что такое язык R
❏ Используем SQL внутри R
❏ Манипуляция данными в R с помощью пакета dplyr, на примерах с SQL
4.
5. SQL (англ. structured query language — «язык
структурированных запросов») — декларативный язык
программирования, применяемый для создания,
модификации и управления данными в реляционной базе
данных, управляемой соответствующей системой управления
базами данных.
Википедия
6. ★
Какие поля необходимо выбрать из таблицы
★
Из какой таблицы необходимо выбрать данные
★
По каким условиям необходимо отфильтровать данные
★
По полям необходимо сгруппировать данные
★
По каким полям необходимо отсортировать данные
7. R — язык программирования для статистической обработки
данных и работы с графикой, а также свободная программная
среда вычислений с открытым исходным кодом в рамках
проекта GNU. Язык создавался как аналогичный языку S,
разработанному в Bell Labs, и является его альтернативной
реализацией, хотя между языками есть существенные
отличия, но в большинстве своём код на языке S работает в
среде R.
Википедия
8. dplyr - это грамматика манипулирования данными,
предоставляющая согласованный набор глаголов, которые
помогут вам решить наиболее распространенные проблемы
манипулирования данными.
9.
10. Операция Операторы / Блоки SQL Глаголы dplyr
Выборка столбцов SELECT select(), mutate()
Фильтрация данных WHERE filter()
Группировка и агрегация GROUP BY + агрегаторы group_by() + summarise()
Сортировка ORDER BY arrange()
Объединение таблиц JOIN left_join(), right_join(), *_join()