Configurações do Apache Airflow com suporte
Observação
Esse recurso está em uma versão prévia. O Gerenciador de Orquestração de Fluxo de trabalho é desenvolvido com Apache Airflow.
No Gerenciador de Orquestração de Fluxo de Trabalho, as configurações do Apache Airflow podem ser integradas ao runtime da plataforma como pares chave-valor. Embora o airflow.cfg
não esteja diretamente acessível na interface do usuário, os usuários podem substituir essas configurações por meio da seção "Substituições de Configuração do Airflow" da interface do usuário, mantendo o acesso a outras configurações de airflow.cfg
. Os desenvolvedores têm a flexibilidade de substituir a maioria das configurações do Apache Airflow no Gerenciador de Orquestração de Fluxo de Trabalho, except for those explicitly outlined in a provided table
.
APLICA-SE A: Azure Data Factory Azure Synapse Analytics
Dica
Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange desde movimentação de dados até ciência de dados, análise em tempo real, business intelligence e relatórios. Saiba como iniciar uma avaliação gratuita!
Para obter mais informações sobre as configurações do Apache Airflow, consulte Referência de Configuração.
A tabela a seguir contém a lista de configurações que não dão suporte a substituições.
Configuração | Descrição | Valor padrão |
---|---|---|
AIRFLOW__CELERY__FLOWER_URL_PREFIX | A URL raiz para Flower. | "" |
AIRFLOW__CORE__DAGS_FOLDER | O caminho da pasta em que os pipelines do Airflow residem. | AIRFLOW_DAGS_FOLDER |
AIRFLOW__CORE__DONOT_PICKLE | Opta por desabilitar ou não os DAGs de seleção. | Falso |
AIRFLOW__CORE__ENABLE_XCOM_PICKLING | Opta por habilitar ou não a seleção para xcom. | Falso |
AIRFLOW__CORE__EXECUTOR | A classe executor que o Airflow deve usar. | CeleryExecutor |
AIRFLOW__CORE__FERNET_KEY | Chave secreta para salvar senhas de conexão no banco de dados. | AIRFLOW_FERNET_KEY |
AIRFLOW__CORE__DAGS_ARE_PAUSED_AT_CREATION | Os DAGs são pausados por padrão na criação? | Falso |
AIRFLOW__CORE__PLUGINS_FOLDER | Caminho para a pasta que contém plug-ins do Airflow. | AIRFLOW_PLUGINS_FOLDER |
AIRFLOW__LOGGING__BASE_LOG_FOLDER | A pasta em que o Airflow deve armazenar seus arquivos de log. | /opt/airflow/logs |
AIRFLOW__LOGGING__LOG_FILENAME_TEMPLATE | Formatação de como o Airflow gera nomes de arquivo ou caminhos para cada execução de tarefa. | {{ ti.dag_id }}/{{ ti.task_id }}/{{ ts }}/{{ try_number }}.log |
AIRFLOW__LOGGING__DAG_PROCESSOR_MANAGER_LOG_LOCATION | O caminho completo do arquivo de log dag_processor_manager . |
/opt/airflow/logs/dag_processor_manager/dag_processor_manager.log |
AIRFLOW__LOGGING__LOGGING_CONFIG_CLASS | A classe de configuração de log especifica a configuração de log. Essa classe precisa estar no caminho da classe Python. | log_config.LOGGING_CONFIG |
AIRFLOW__LOGGING__COLORED_LOG_FORMAT | Formato de log para quando os logs coloridos estiverem habilitados. | [%(asctime)s] {{%(filename)s:%(lineno)d}} %(levelname)s - %(message)s |
AIRFLOW__LOGGING__LOGGING_LEVEL | Nível de registro em log. | INFO |
AIRFLOW__METRICS__STATSD_ON | Habilita o envio de métricas para o StatsD. | Verdadeiro |
AIRFLOW__METRICS__STATSD_HOST | Nome do host do servidor StatsD. | geneva-services |
AIRFLOW__METRICS__STATSD_PORT | Número da porta do servidor StatsD. | 8125 |
AIRFLOW__METRICS__STATSD_PREFIX | Prefixo para todas as métricas do Airflow enviadas ao StatsD. | AirflowMetrics |
AIRFLOW__SCHEDULER__CHILD_PROCESS_LOG_DIRECTORY | Caminho do diretório em que o agendador de Airflow grava seus logs de processo filho. | /opt/airflow/logs/scheduler |
AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL | Com que frequência (em segundos) para verificar o diretório dos DAGs em busca de novos arquivos. Padrão: 5 minutos. | 5 |
AIRFLOW__WEBSERVER__BASE_URL | A URL base do seu site porque o Airflow não consegue adivinhar qual domínio ou cname você está usando. Essa URL é usada em emails automatizados que o Airflow envia para apontar links para o servidor Web correto. | https://localhost:8080 |
AIRFLOW__WEBSERVER__COOKIE_SAMESITE | Define a política samesite no cookie de sessão. | Nenhum |
AIRFLOW__WEBSERVER__COOKIE_SECURE | Define o sinalizador seguro no cookie de sessão. | Verdadeiro |
AIRFLOW__WEBSERVER__EXPOSE_CONFIG | Expõe o arquivo de configuração no servidor Web. | Falso |
AIRFLOW__WEBSERVER__AUTHENTICATE | Autentica o usuário para entrar na interface do usuário do Airflow. | Verdadeiro |
AIRFLOW__WEBSERVER__AUTH_BACKEND | airflow.api.auth.backend.basic_auth | |
AIRFLOW__WEBSERVER__RELOAD_ON_PLUGIN_CHANGE | Se definido como True, o Airflow rastreará arquivos no diretório plugins_folder . Quando detectar alterações, recarregue o gunicorn. |
Verdadeiro |
AIRFLOW__WEBSERVER__SECRET_KEY | Chave secreta usada para executar seu aplicativo flask. | AIRFLOW_FERNET_KEY |
AIRFLOW__API__AUTH_BACKEND | Lista separada por vírgulas de back-ends de autenticação para autenticar usuários da API. | airflow.api.auth.backend.basic_auth |
AIRFLOW__API__ENABLE_EXPERIMENTAL_API | Verdadeiro |