4-х дневный курс по работе с данными с помощью Trino, учитывая многообразие источников данных.
Trino — это массивно-параллельный распределенный колоночный SQL-движок для обработки больших данных из удаленных источников, прежде всего озер данных и КХД. Фокус на big data и аналитику определяет ключевые задачи оптимизатора Trino:
Цель курса - разобраться в программном продукте, понять его архитектуру и особенности, самостоятельно погонять запросы к данным, находящимся в разных источниках, научиться читать планы запросов и сопоставлять план с фактом в WEB UI.
Инструментальные средства: для практических занятий используются WEB интерфейс (Jupyter Lab).
Продолжительность: 16 ак. часов, 4 дня по 4 ак. часа (теория / практика).
Инженеры данных, аналитики, BI аналитики и архитекторы.
В результате обучения вы приобретете базовые знания и навыки, необходимые для эффективного использования Trino и работы с большими объемами данных, хранящимися в различных типах источников. Поймете архитектуру Trino, научитесь читать и оптимизировать запросы, мониторить процесс их исполнения с использованием WEB UI.
Запуск запросов бенчмарка TPC-DS, используя встроенный коннектор
Практика в федеративных запросах и работа с данными, хранящимися в разных источниках (S3, PostgreSQL)
Работа с потоковыми данными из Apache Kafka
Собираем все воедино: решаем финальную задачу.
2520 BYN
с учетом НДС 20%
под руководством инструктора