Реализация решения машинного обучения с помощью Azure Databricks
Вкратце
-
Level
-
Skill
-
Продукт
Azure Databricks — это облачная платформа для аналитики данных и машинного обучения. Специалисты по обработке и анализу данных и инженеры машинного обучения могут использовать Azure Databricks для реализации решений машинного обучения в большом масштабе.
Предварительные требования
В этой схеме обучения предполагается, что у вас есть опыт использования Python для изучения данных, а также обучения моделей машинного обучения с помощью популярных платформ с открытым кодом, таких как Scikit-Learn, PyTorch и TensorFlow. Прежде чем начинать эту схему обучения, рекомендуется пройти схему обучения Создание моделей машинного обучения.
Код достижения
Вы хотите запросить код достижения?
Модули, включенные в эту схему обучения
Azure Databricks — это облачная служба, которая предоставляет масштабируемую платформу для аналитики данных с помощью Apache Spark.
Платформа Azure Databricks основана на Apache Spark и позволяет инженерам и аналитикам запускать задания Spark для преобразования, анализа и визуализации данных в большом масштабе.
Машинное обучение предполагает использование данных для обучения прогнозной модели. Azure Databricks поддерживает несколько часто используемых платформ машинного обучения, которые можно использовать для обучения моделей.
MLflow — это платформа открытый код для управления жизненным циклом машинного обучения, который изначально поддерживается в Azure Databricks.
Настройка гиперпараметров является важной частью машинного обучения. В Azure Databricks можно использовать библиотеку Hyperopt для автоматической оптимизации гиперпараметров.
AutoML в Azure Databricks упрощает процесс создания эффективной модели машинного обучения для данных.
Глубокое обучение использует нейронные сети для обучения высокоэффективных моделей машинного обучения для сложного прогнозирования, компьютерного зрения, обработки естественного языка и других рабочих нагрузок ИИ.
Машинное обучение позволяет принимать решения на основе данных и автоматизации, но развертывание моделей в рабочей среде для аналитики в режиме реального времени сложно. Azure Databricks упрощает этот процесс, предоставляя единую платформу для создания, обучения и развертывания моделей машинного обучения в масштабе, обеспечивая совместную работу между специалистами по обработке и анализу данных и инженерами.