Поделиться через


Инженерия данных с использованием Databricks

Databricks предоставляет широкий набор функций проектирования данных, которые включают надежную среду для совместной работы среди специалистов по обработке и анализу данных, инженеров и аналитиков. В центре этого конвейера приема и преобразования данных. Чтобы обеспечить простую инженерию наиболее эффективных конвейеров, Databricks предлагает структурированную потоковую передачу и DLT. См. стриминг в Azure Databricks и Что такое DLT?.

Общие сведения о том, почему добавочная потоковая обработка данных, предоставляемых структурированной потоковой передачей и DLT, является лучшим вариантом для конвейеров данных, см. в статье Создание простых, эффективных и низкой задержки конвейеров данных.

Дополнительные ресурсы по инженерии данных

Databricks предоставляет функции для задач проектирования данных для многих дополнительных сценариев:

  • Ноутбуки Databricks — популярный инструмент для совместной работы.
  • Организуйте и управляйте своими рабочими процессами с помощью заданий Databricks.
  • Ознакомьтесь с Databricks Mosaic AI, если вы проектируете решения машинного обучения.

Заметка

Если вы работаете с sql-запросами и инструментами бизнес-аналитики, ознакомьтесь с Databricks SQL.

Сведения о том, как начать работу, и ознакомительную информацию см. в статье Начало работы с Azure Databricks и Что такое Azure Databricks?.

Имя Используйте это, если вы хотите...
DLT Узнайте, как создавать конвейеры данных для приема и преобразования с помощью Databricks DLT.
Структурированное потоковое вещание Узнайте о стриминге, инкрементных и рабочих нагрузках в режиме реального времени на базе Structured Streaming в Databricks.