Identificar cargas de trabalho do Azure Databricks
O Azure Databricks oferece recursos para várias cargas de trabalho, incluindo Machine Learning e Large Language Models (LLM), Ciência de Dados, Engenharia de Dados, BI e Data Warehousing e Processamento de Streaming.
Engenharia de Dados
O Azure Databricks fornece recursos para cientistas e engenheiros de dados que precisam colaborar em tarefas complexas de processamento de dados. Ele fornece um ambiente integrado com o Apache Spark para processamento de big data em um data lakehouse e suporta várias linguagens, incluindo Python, R, Scala e SQL. A plataforma facilita a exploração, visualização e desenvolvimento de pipelines de dados.
Machine Learning
O Azure Databricks dá suporte à criação, treinamento e implantação de modelos de aprendizado de máquina em escala. Ele inclui MLflow, uma plataforma de código aberto para gerenciar o ciclo de vida do ML, incluindo experimentação, reprodutibilidade e implantação. Ele também suporta várias estruturas de ML, como TensorFlow, PyTorch e Scikit-learn, tornando-o versátil para diferentes tarefas de ML.
SQL
Os analistas de dados que interagem principalmente com dados por meio do SQL podem usar armazéns SQL no Azure Databricks. O portal do Azure Databricks fornece um editor SQL familiar, painéis e ferramentas de visualização automática para analisar e visualizar dados diretamente no Azure Databricks. Essa carga de trabalho é ideal para executar consultas ad-hoc rápidas e criar relatórios a partir de grandes conjuntos de dados.