DEV Community

Cover image for Масштабируем Apache Airflow: переводим архитектуру на Celery и Redis
Nick Komissarenko for BigDataSchool

Posted on

Масштабируем Apache Airflow: переводим архитектуру на Celery и Redis

Базовый запуск Airflow отлично подходит для старта. Но как только пайплайнов становится больше, встроенный LocalExecutor начинает откровенно захлебываться. Задачи встают в очередь, а один узел работает на пределе своих возможностей.

Во второй части нашего цикла мы разбираем, как перевести архитектуру на нормальные, распределенные рельсы. Добавляем в стек Celery для параллельного выполнения тасок и Redis в качестве быстрого брокера сообщений.

О чем говорим в новой статье:

  • Почему LocalExecutor становится тупиком при росте проекта.
  • Как правильно подружить Airflow с новыми компонентами.
  • Обновленный манифест Docker Compose для быстрого развертывания всего этого зоопарка.
  • Базовая настройка лимитов и управление ресурсами, чтобы воркеры не роняли сервер из-за нехватки памяти.

Материал содержит готовые конфиги. Их можно сразу забрать к себе на тестовый сервер или использовать как фундамент для настройки боевого окружения.

Полный разбор архитектуры и пошаговая инструкция ждут вас в блоге:
Урок 2. Архитектура для продакшена: учим Airflow работать в команде с Redis и Celery

Буду рад обсудить ваш опыт в комментариях. Особенно интересно узнать, с какими проблемами производительности вы сталкивались при масштабировании своих дата-пайплайнов.

Top comments (0)