Архитектура данных

Курс для ИТ-архитекторов и специалистов по проектированию и разработке архитектуры данных (Big Data), планированию инфраструктуры озер данных (Data Lakes) и проектов Big Data в компаниях.

Данный курс содержит теоретический минимум, необходимый для эффективной прикладной работы с архитектурными моделями корпоративных репозиториев и их различными реализациями в виде реляционных хранилищ и NoSQL-сред на базе Hadoop и других технологий Big Data.

Сегодня любое предприятие управляется данными. Многие компании создают и активно используют корпоративные хранилища данных (КХД, DWH — Data WareHouse), куда стекается информация из множества источников: интернет, внутренние и внешние информационные системы, технологическое оборудование и т.д. Традиционные принципы проектирования таких озер данных не справляются с требованиями современного бизнеса: огромные объемы разноформатных файлов, высокая скорость доступа к информации, облачная инфраструктура, гибкие настройки многопользовательского доступа. Архитектурное проектирование системы, включая построение модели данных — это фундамент, без подготовки которого невозможно построение надежного озера данных, традиционного хранилища или аналитической системы.

Технологии Big Data ориентированы на эффективное, безопасное и непротиворечивое управление данными в масштабе всего предприятия. Большинство бизнесов в качестве одного из ключевых направлений своего развития называют Data Centric (дата-центричность). Ожидается, что разработка и внедрение проектов BigData, таких как озера данных (Data Lake), расширят возможности «традиционных » DWH. Однако, всегда ли эти ожидания оправдываются? Все ли зависит от выбранного технологического стека? Что можно сделать, чтобы избежать фиаско Big Data-проекта? Как внедрить технологии Big Data в production, не разрушая существующие КХД, а дополняя их новыми функциональными возможностями? Ответить на эти вопросы поможет наш курс «Архитектура данных».

Целевая аудитория

Теоретический курс "Архитектура данных" предназначен для ИТ-архитекторов, системных аналитиков и разработчиков, которым интересна тема проектирования моделей данных систем аналитического класса (озера и хранилища данных). Курс может быть также полезен руководителям Big Data-проектов и команд в области аналитики, а также специалистам направления Data Governance, ИТ-менеджерам и руководителям проектов по цифровизации.

Программа курса

День 1-2

Архитектура данных как часть реализации стратегии Data Centric на уровне предприятия.
Роль и задачи архитектора данных. Data Governance.

  • Data Driven подход. Успехи. Проблемы. Эволюция. Внедрение Data Lake: что может пойти не так?
  • Application Centric vs Data Centric. Когда, внедряя Big Data мы приближаемся к Data Centric, а когда отдаляемся?
  • Какие проблемы мы не можем решить на уровне Data Lake/DWH. Задачи Data Governance.
  • Корпоративная модель данных (EDM) как часть Data Governance
  • Архитектор данных. Роли и задачи.
  • Стандартизация работы с данными предприятия.
  • Внедрение практик культуры работы с данными. Задачи. Процессы. Сложности.

День 3-4

Основные подходы к проектированию моделей данных ключевых компонентов Big Data-решений.

  • Обобщенная схема архитектур -решений. Требования к компонентам и моделям данных.
  • Понятие модели данных. Виды моделей данных. Их назначение и особенности.
  • Реляционная модель данных. Нормализация и денормализация.
  • Классическая концептуальная модель «сущность-связь» и ее расширения.
  • Нотации и инструменты моделирования данных. Концептуальная, логическая и физическая модели данных.
  • Ключевое отличие к построению моделей данных аналитических систем — работа со временем. Поддержка истории изменений.
  • BEAM (Business Event Activity Modeling) — подход к проектированию моделей для аналитических задач
  • Design-паттерны проектирования моделей данных
  • Моделирования ядра. Подход Data Vault. Его преимущества и ограничения. Развитие подхода.

День 5-6

Основные подходы к проектированию моделей данных ключевых компонентов Big Data-решений. Метаданные. Эффективная загрузка данных.

  • Итеративное развитие модели данных ядра
  • Моделирование аналитических витрин. Подход Р. Кимбалла и его развитие.
  • Отраслевые примеры моделей данных.
  • Виды метаданных для аналитических систем.
  • Эффективное обновление данных. Управление загрузкой.
Оставить отзыв

Информация о курсе

3780 BYN

с учетом НДС 20%

Вендор: Big Data School
Код курса: ARMG
Продолжительность: 6 дней / 24 ак. часа
Направление: Аналитика и архитектура
Форма обучения:

под руководством инструктора

Записаться на курс

Название курса и комментарии*

Имя*

Фамилия*

Отчество*

Компания

Телефон*

Email*

Настоящим, в соответствии с ч.2.ст.18 Закона Республики Беларусь от 10.11.2008 N 455-З(ред. от 11.05.2016) "Об информации, информатизации и защите информации" и Законом Республики Беларусь от 7 мая 2021 г. № 99-З «О защите персональных данных», отправляя данную форму, вы подтверждаете свое согласие на сбор, обработку и хранение ООО «СофтЛайнБел» Ваших персональных данных. ООО «СофтЛайнБел» гарантирует конфиденциальность получаемой от Вас информации. Сбор, обработка и хранение персональных данных осуществляется в целях эффективного оказания услуг и исполнения договоров.

Отправляя данную форму я даю согласие на обработку моих персональных данных, а также подтверждаю, что я ознакомлен и согласен с условиями политики обработки персональных данных.