Identificar cargas de trabalho do Azure Databricks

Concluído

O Azure Databricks oferece recursos para diversas cargas de trabalho, incluindo aprendizado de máquina e modelos de linguagem grande (LLM), Ciência de Dados, engenharia de dados, BI e armazenamento de dados e processamento de streaming.

Engenharia e ciência de dados

Essa carga de trabalho foi projetada para cientistas e engenheiros de dados que precisam colaborar em tarefas complexas de processamento de dados. Ele fornece um ambiente integrado com Apache Spark para processamento de big data em um data lakehouse e oferece suporte a várias linguagens, incluindo Python, R, Scala e SQL. A plataforma facilita a exploração, visualização e desenvolvimento de pipelines de dados.

Diagrama da tela de ingestão de dados e fontes de dados do Databricks.

Machine Learning

A carga de trabalho de Machine Learning no Azure Databricks é otimizada para construir, treinar e implantar modelos de machine learning em escala. Inclui MLflow, uma plataforma de código aberto para gerenciar o ciclo de vida de ML, incluindo experimentação, reprodutibilidade e implantação. Ele também oferece suporte a várias estruturas de ML, como TensorFlow, PyTorch e Scikit-learn, tornando-o versátil para diferentes tarefas de ML.

Diagrama da tela do Databricks Machine Learning.

SQL

A carga de trabalho SQL é voltada para analistas de dados que interagem principalmente com dados por meio de SQL. Ele fornece um editor SQL familiar, painéis e ferramentas de visualização automática para analisar e visualizar dados diretamente no Azure Databricks. Essa carga de trabalho é ideal para executar consultas ad hoc rápidas e criar relatórios a partir de grandes conjuntos de dados.

Diagrama da tela do Editor SQL do Databricks.