Эксплуатация Apache NIFI

3-хдневный практический курс по эксплуатации кластера Apache NiFi для дата-инженеров, проектирующих конвейеры потоковой обработки данных, и администраторов кластера Apache NiFi.

Цель курса: развернуть и настроить свой кластер Apache NiFi, спроектировать и запустить отказоустойчивый потоковой конвейер обработки данных из типовых и кастомных компонентов (процессоры, службы контроллера и пр.), включая интеграцию со сторонними системами (Kafka, веб-сервисы).

Онлайн-курс проходит в формате интерактивного семинара - в дистанционном режиме с вами занимается преподаватель — рассказывает теорию, дает практические задания и проверяет результаты выполнения. В качестве примеров рассматриваются кейсы из реального бизнеса, а также лучшие практики проектирования потоковых конвейеров и настройки отказоустойчивых высокопроизводительных кластеров.

Соотношение теории к практике: 50/50.

Аудитория

  • Инженеры данных, cистемные администраторы, системные архитекторы, разработчики Hadoop
  • Желающие получить практические навыки по установке, настройке и управлению потоками данными (Data pipeline) с использованием кластера Apache NiFi

Предварительная подготовка

  • Знание базовых команд Linux (опыт работы с командной строкой, файловой системой, POSIX, текстовыми редакторами vi, nano)
  • Начальный опыт работы с Hadoop или NiFi

Программа курса

1. Введение в Apache NiFi

  • Архитектура Hadoop Data Flow
  • Архитектура решения и ключевые концепции Apache NiFi: Принципы потоковой обработки данных
  • Data Lineage и Data Provenance (Data Provenance Events)
  • Функционал NiFi по управлению потоковой обработкой данных: гарантированная доставка, управление каналом (буферизация, pressure), QoS, версионность

2. Создание DataFlow

  • Создание dataflow: работа с атрибутами FlowFile, маршрутизация, source и sink
  • Репозитории FlowFile Repository, Content Repository, Provenance Repository. Анатомия FlowFile, процессоры и коннекторы
  • Мониторинг dataflow
  • Параметризация dataflow: переменные и параметры

3. Программная обработка FlowFile

  • Использование скриптов в NiFi: работа с атрибутами и данными FlowFile, программная маршрутизация FlowFile
  • Сбор данных в месте их производства с помощью Apache minifi

4. Работа с Records и Local State

  • Controlling service и работа с Records и State: формат FlowFile и его
    преобразование, State Manager и его использование
  • Reporting tasks и обработка результатов
  • Происхождение данных: анализ provenance и lineage
  • Apache NiFi Registry версионность и поддержка production deployment

5. Интеграция и масштабирование

  • Вертикальное и горизонтальное масштабирование и отказоустойчивость NiFi
  • Доступные расширения и готовые «из коробки» процессоры и коннекторы
  • Возможности интеграции кластера NiFi (consumer/provider) с Kafka
  • Интеграция Apache Kafka, NiFi
  • Типовые сценарии/схемы потоковой обработки данных
  • Процессорные группы (Remote Processor Group)

6. Задачи администрирование NiFi

  • Установка и настройка кластера Apache NiFi
  • Управление кластером NiFi
  • Оптимизация DataFlow
  • Инструменты мониторинга и уведомлений NiFi
  • Безопасность для Apache NiFi (SSL, Аутентификация LDAP)

Документы об окончании курса

  • Сертификат Учебного центра Noventiq
  • Cертификат об обучении установленного образца

Certificate Noventiq Education Belarus сертификат об обучении установленного образца

Оставить отзыв

Информация о курсе

Вендор: Big Data School
Код курса: NIFI3
Продолжительность: 3 дня / 24 ак. часа
Направление: Apache NiFi
Форма обучения:

под руководством инструктора

Все предложения
Записаться на курс

Название курса и комментарии*

Имя*

Фамилия*

Отчество*

Компания

Телефон*

Email*

Настоящим, в соответствии с ч.2.ст.18 Закона Республики Беларусь от 10.11.2008 N 455-З(ред. от 11.05.2016) "Об информации, информатизации и защите информации" и Законом Республики Беларусь от 7 мая 2021 г. № 99-З «О защите персональных данных», отправляя данную форму, вы подтверждаете свое согласие на сбор, обработку и хранение ООО «СофтЛайнБел» Ваших персональных данных. ООО «СофтЛайнБел» гарантирует конфиденциальность получаемой от Вас информации. Сбор, обработка и хранение персональных данных осуществляется в целях эффективного оказания услуг и исполнения договоров.

Отправляя данную форму я даю согласие на обработку моих персональных данных, а также подтверждаю, что я ознакомлен и согласен с условиями политики обработки персональных данных.