Greenplum для инженеров данных и аналитиков данных

5 дней практического обучения аналитиков, дата-инженеров и администраторов баз данных: анализ Big Data, организация ETL/ELT-процессов, построение корпоративных озер и хранилищ данных с масштабируемой отказоустойчивой open-source СУБД Greenplum Database.

Курс даёт необходимые знания по эффективной и безопасной эксплуатации GreenPlum в качестве средства быстрой аналитики больших данных, а также основы многоуровневых Data Lake и КХД. Освоение каждой практической темы подкрепляется лабораторной работой. Выполнять лабораторные работы предлагаем на базе дистрибутива native Greenplum или Arenadata DB — выбор по желанию слушателя.

Соотношение теории к практике: 50/50.

Целевая аудитория

Курс по Greenplum ориентирован на следующие категории ИТ-специалистов:

  • инженер данных (Data Engineer);
  • аналитик больших данных (Data Analyst);
  • администратор больших данных (Big Data Administrator);
  • администратор баз данных (Database Administrator).

Практические курсы по Greenplum предназначены для дата-инженеров, администраторов, системных архитекторов, аналитиков и разработчиков, которые хотят получить практические навыки по эффективной организации ETL/ELT-процессов, а также построению корпоративных озер и хранилищ данных на базе MPP-СУБД Greenplum.

Предварительная подготовка

  • Знание базовых команд Linux (опыт работы с командной строкой, файловой системой, POSIX, текстовыми редакторами vi, nano)
  • Опыт работы с SQL

Программа курса

1. Основы Greenplum: Greenplum как реляционная MPP СУБД

  • Введение в Greenplum
  • Архитектура Greenplum
  • Партиционирование таблиц, индексы
  • Транзакции и блокировки
  • Оптимизация и планы запросов
  • Лабораторная работа

2. Внешние данные и код: Greenplum как агрегатор данных и исполнитель кода

  • Механизм внешних таблиц, протоколы, PXF
  • Загрузка данных в Greenplum
  • Механизм UDF
  • Работа с JSON, XML
  • Экосистема и дополнительные библиотеки
  • Лабораторная работа

3. Greenplum в современных хранилищах данных

  • Архитектура озера данных
  • ETL, ELT и подготовка данных
  • GPSS и интеграция Greenplum с Kafka и Nifi
  • Обработка данных из Greenplum с помощью Spark
  • Построение многоуровневого хранилища на Greenplum
  • Лабораторная работа

Документы об окончании курса

  • Сертификат Учебного центра Noventiq
  • Cертификат об обучении установленного образца

Certificate Noventiq Education Belarus сертификат об обучении установленного образца

Оставить отзыв

Информация о курсе

Вендор: Big Data School
Код курса: GPDE
Продолжительность: 5 дней / 24 ак. часа
Направление: Arenadata DB | Greenplum
Форма обучения:

под руководством инструктора

Все предложения
Записаться на курс

Название курса и комментарии*

Имя*

Фамилия*

Отчество*

Компания

Телефон*

Email*

Настоящим, в соответствии с ч.2.ст.18 Закона Республики Беларусь от 10.11.2008 N 455-З(ред. от 11.05.2016) "Об информации, информатизации и защите информации" и Законом Республики Беларусь от 7 мая 2021 г. № 99-З «О защите персональных данных», отправляя данную форму, вы подтверждаете свое согласие на сбор, обработку и хранение ООО «СофтЛайнБел» Ваших персональных данных. ООО «СофтЛайнБел» гарантирует конфиденциальность получаемой от Вас информации. Сбор, обработка и хранение персональных данных осуществляется в целях эффективного оказания услуг и исполнения договоров.

Отправляя данную форму я даю согласие на обработку моих персональных данных, а также подтверждаю, что я ознакомлен и согласен с условиями политики обработки персональных данных.