Поделиться через


Руководство: комплексные модели машинного обучения в Azure Databricks

В реальности машинное обучение происходит бессистемно. Источники данных содержат отсутствующие значения, включают избыточные строки или могут не помещаться в памяти. Конструирование признаков часто требует опыта в предметной области и может быть утомительным. Моделирование очень часто находится на стыке областей обработки и анализа данных и системной инженерии, а также требует не только знания алгоритмов, но и архитектуры компьютеров и распределенных систем.

Azure Databricks упрощает этот процесс. В следующей 10-минутной учебной записной книжке приведен пример построения моделей машинного обучения на основе табличных данных.

Вы можете импортировать эту записную книжку и запустить ее самостоятельно или скопировать фрагменты кода и идеи для собственного использования.

Записная книжка

Если рабочая область включена для каталога Unity, используйте эту версию записной книжки:

Использование scikit-learn с интеграцией MLflow в Databricks (каталог Unity)

Получить записную книжку

Если рабочая область не включена для каталога Unity, используйте эту версию записной книжки:

Использование scikit-learn с интеграцией MLflow в Databricks

Получить записную книжку