Б. Харенслак. Apache Airflow и конвейеры обработки данных
Конвейеры обработки данных управляют потоком данных с момента их первоначального сбора до консолидации, очистки, анализа, визуализации и многого другого. Apache Airflow предоставляет единую платформу, которую можно использовать для проектирования, реализации, мониторинга и обслуживания конвейеров. Простота пользовательского интерфейса, возможности plug-and-play и гибкие сценарии Python оптимизируют решение любых задач, касающихся управления данными. Эта книга научит вас создавать и сопровождать эффективные конвейеры обработки данных. Вы изучите наиболее распространенные модели их использования, особенности ориентированных ациклических графов (ОАГ), которые обеспечивают работу Airflow, а также способы их настройки в соответствии с потребностями вашего конвейера. Издание предназначено для специалистов по DevOps, обработке и хранению данных, машинному обучению, а также системных администраторов с навыками программирования на Python.
Издательство: ДМК Пресс
Год: 2021
Cтраниц: 502
Формат: pdf
Язык: русский
Скачать книгу (17,5 МБ):
Этот блок был удален по требованию правообладателя. Если вы считаете,
что это ошибка, обратитесь к Администратору.
gefexi 11/01/23 Просмотров: 757
0