Open3

Airflowのあれこれ

つ

まずはDockerで環境構築

version: "2.6.3"
- 実務に合わせる
- 最新は"2.8.0"

https://qiita.com/yuuman/items/a449bbe36710ad837df7#パターン4dockercompose起動--別インスタンス実行

以下のコンテナを立てる

- MySQL
  - Airflowのメタデータを保存する。DAGの設定、実行状況、ログなど。

- Webserver
  - AirflowのWeb UIを提供。このWebインターフェースを通じてDAGの管理、モニタリング、ログの確認などができる。MySQLデータベースに格納されたメタデータ

- Scheduler
  - DAGのスケジューリングとタスクの実行を管理。定義されたスケジュールに基づいてDAGをトリガーする。

- Worker
  - 実際のタスクを実行するためのコンテナ。Schedulerからタスクを受け取り、それらを実行する。今回はCeleryExecutorを使用。

- Redis
  - Executorがタスクのキューイングと実行状態の管理を行うためにRedisを使用。

- Flower
  - AirflowのCelery Executor用のモニタリングツール。タスクキューの状態、ワーカーの状態、実行中のタスクなどをリアルタイムで監視できる。
つ

ExecutorとWorkerがごっちゃになった

Executor

  • Workerへのタスクの割り当てを管理する役割を担う
  • 様々なタイプのExecutorが利用可能(LocalExecutor, SequentialExecutor, CeleryExecutor)

Worker

  • Executorから割り当てられたタスクを実際に実行するエンティティ
[ref]