Identificar cargas de trabalho do Azure Databricks
O Azure Databricks oferece recursos para diversas cargas de trabalho, incluindo aprendizado de máquina e modelos de linguagem grande (LLM), Ciência de Dados, engenharia de dados, BI e armazenamento de dados e processamento de streaming.
Engenharia e ciência de dados
Essa carga de trabalho foi projetada para cientistas e engenheiros de dados que precisam colaborar em tarefas complexas de processamento de dados. Ele fornece um ambiente integrado com Apache Spark para processamento de big data em um data lakehouse e oferece suporte a várias linguagens, incluindo Python, R, Scala e SQL. A plataforma facilita a exploração, visualização e desenvolvimento de pipelines de dados.
Machine Learning
A carga de trabalho de Machine Learning no Azure Databricks é otimizada para construir, treinar e implantar modelos de machine learning em escala. Inclui MLflow, uma plataforma de código aberto para gerenciar o ciclo de vida de ML, incluindo experimentação, reprodutibilidade e implantação. Ele também oferece suporte a várias estruturas de ML, como TensorFlow, PyTorch e Scikit-learn, tornando-o versátil para diferentes tarefas de ML.
SQL
A carga de trabalho SQL é voltada para analistas de dados que interagem principalmente com dados por meio de SQL. Ele fornece um editor SQL familiar, painéis e ferramentas de visualização automática para analisar e visualizar dados diretamente no Azure Databricks. Essa carga de trabalho é ideal para executar consultas ad hoc rápidas e criar relatórios a partir de grandes conjuntos de dados.