Identificar cargas de trabalho do Azure Databricks

Concluído

O Azure Databricks oferece recursos para várias cargas de trabalho, incluindo Machine Learning e Large Language Models (LLM), Ciência de Dados, Engenharia de Dados, BI e Data Warehousing e Processamento de Streaming.

Engenharia de Dados

O Azure Databricks fornece recursos para cientistas e engenheiros de dados que precisam colaborar em tarefas complexas de processamento de dados. Ele fornece um ambiente integrado com o Apache Spark para processamento de big data em um data lakehouse e suporta várias linguagens, incluindo Python, R, Scala e SQL. A plataforma facilita a exploração, visualização e desenvolvimento de pipelines de dados.

Diagrama da tela de ingestão de dados Databricks & fontes de dados.

Machine Learning

O Azure Databricks dá suporte à criação, treinamento e implantação de modelos de aprendizado de máquina em escala. Ele inclui MLflow, uma plataforma de código aberto para gerenciar o ciclo de vida do ML, incluindo experimentação, reprodutibilidade e implantação. Ele também suporta várias estruturas de ML, como TensorFlow, PyTorch e Scikit-learn, tornando-o versátil para diferentes tarefas de ML.

Diagrama da tela Databricks Machine Learning.

SQL

Os analistas de dados que interagem principalmente com dados por meio do SQL podem usar armazéns SQL no Azure Databricks. O portal do Azure Databricks fornece um editor SQL familiar, painéis e ferramentas de visualização automática para analisar e visualizar dados diretamente no Azure Databricks. Essa carga de trabalho é ideal para executar consultas ad-hoc rápidas e criar relatórios a partir de grandes conjuntos de dados.

Diagrama da tela do Editor DatabricksSQL.