Compartilhar via


Configurações do Apache Airflow com suporte

Observação

Esse recurso está em uma versão prévia. O Gerenciador de Orquestração de Fluxo de trabalho é desenvolvido com Apache Airflow.

No Gerenciador de Orquestração de Fluxo de Trabalho, as configurações do Apache Airflow podem ser integradas ao runtime da plataforma como pares chave-valor. Embora o airflow.cfg não esteja diretamente acessível na interface do usuário, os usuários podem substituir essas configurações por meio da seção "Substituições de Configuração do Airflow" da interface do usuário, mantendo o acesso a outras configurações de airflow.cfg. Os desenvolvedores têm a flexibilidade de substituir a maioria das configurações do Apache Airflow no Gerenciador de Orquestração de Fluxo de Trabalho, except for those explicitly outlined in a provided table.

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Dica

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange desde movimentação de dados até ciência de dados, análise em tempo real, business intelligence e relatórios. Saiba como iniciar uma avaliação gratuita!

Para obter mais informações sobre as configurações do Apache Airflow, consulte Referência de Configuração.

A tabela a seguir contém a lista de configurações que não dão suporte a substituições.

Configuração Descrição Valor padrão
AIRFLOW__CELERY__FLOWER_URL_PREFIX A URL raiz para Flower. ""
AIRFLOW__CORE__DAGS_FOLDER O caminho da pasta em que os pipelines do Airflow residem. AIRFLOW_DAGS_FOLDER
AIRFLOW__CORE__DONOT_PICKLE Opta por desabilitar ou não os DAGs de seleção. Falso
AIRFLOW__CORE__ENABLE_XCOM_PICKLING Opta por habilitar ou não a seleção para xcom. Falso
AIRFLOW__CORE__EXECUTOR A classe executor que o Airflow deve usar. CeleryExecutor
AIRFLOW__CORE__FERNET_KEY Chave secreta para salvar senhas de conexão no banco de dados. AIRFLOW_FERNET_KEY
AIRFLOW__CORE__DAGS_ARE_PAUSED_AT_CREATION Os DAGs são pausados por padrão na criação? Falso
AIRFLOW__CORE__PLUGINS_FOLDER Caminho para a pasta que contém plug-ins do Airflow. AIRFLOW_PLUGINS_FOLDER
AIRFLOW__LOGGING__BASE_LOG_FOLDER A pasta em que o Airflow deve armazenar seus arquivos de log. /opt/airflow/logs
AIRFLOW__LOGGING__LOG_FILENAME_TEMPLATE Formatação de como o Airflow gera nomes de arquivo ou caminhos para cada execução de tarefa. {{ ti.dag_id }}/{{ ti.task_id }}/{{ ts }}/{{ try_number }}.log
AIRFLOW__LOGGING__DAG_PROCESSOR_MANAGER_LOG_LOCATION O caminho completo do arquivo de log dag_processor_manager. /opt/airflow/logs/dag_processor_manager/dag_processor_manager.log
AIRFLOW__LOGGING__LOGGING_CONFIG_CLASS A classe de configuração de log especifica a configuração de log. Essa classe precisa estar no caminho da classe Python. log_config.LOGGING_CONFIG
AIRFLOW__LOGGING__COLORED_LOG_FORMAT Formato de log para quando os logs coloridos estiverem habilitados. [%(asctime)s] {{%(filename)s:%(lineno)d}} %(levelname)s - %(message)s
AIRFLOW__LOGGING__LOGGING_LEVEL Nível de registro em log. INFO
AIRFLOW__METRICS__STATSD_ON Habilita o envio de métricas para o StatsD. Verdadeiro
AIRFLOW__METRICS__STATSD_HOST Nome do host do servidor StatsD. geneva-services
AIRFLOW__METRICS__STATSD_PORT Número da porta do servidor StatsD. 8125
AIRFLOW__METRICS__STATSD_PREFIX Prefixo para todas as métricas do Airflow enviadas ao StatsD. AirflowMetrics
AIRFLOW__SCHEDULER__CHILD_PROCESS_LOG_DIRECTORY Caminho do diretório em que o agendador de Airflow grava seus logs de processo filho. /opt/airflow/logs/scheduler
AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL Com que frequência (em segundos) para verificar o diretório dos DAGs em busca de novos arquivos. Padrão: 5 minutos. 5
AIRFLOW__WEBSERVER__BASE_URL A URL base do seu site porque o Airflow não consegue adivinhar qual domínio ou cname você está usando. Essa URL é usada em emails automatizados que o Airflow envia para apontar links para o servidor Web correto. https://localhost:8080
AIRFLOW__WEBSERVER__COOKIE_SAMESITE Define a política samesite no cookie de sessão. Nenhum
AIRFLOW__WEBSERVER__COOKIE_SECURE Define o sinalizador seguro no cookie de sessão. Verdadeiro
AIRFLOW__WEBSERVER__EXPOSE_CONFIG Expõe o arquivo de configuração no servidor Web. Falso
AIRFLOW__WEBSERVER__AUTHENTICATE Autentica o usuário para entrar na interface do usuário do Airflow. Verdadeiro
AIRFLOW__WEBSERVER__AUTH_BACKEND airflow.api.auth.backend.basic_auth
AIRFLOW__WEBSERVER__RELOAD_ON_PLUGIN_CHANGE Se definido como True, o Airflow rastreará arquivos no diretório plugins_folder. Quando detectar alterações, recarregue o gunicorn. Verdadeiro
AIRFLOW__WEBSERVER__SECRET_KEY Chave secreta usada para executar seu aplicativo flask. AIRFLOW_FERNET_KEY
AIRFLOW__API__AUTH_BACKEND Lista separada por vírgulas de back-ends de autenticação para autenticar usuários da API. airflow.api.auth.backend.basic_auth
AIRFLOW__API__ENABLE_EXPERIMENTAL_API Verdadeiro