Руководство: комплексные модели машинного обучения в Azure Databricks
В реальности машинное обучение происходит бессистемно. Источники данных содержат отсутствующие значения, включают избыточные строки или могут не помещаться в памяти. Конструирование признаков часто требует опыта в предметной области и может быть утомительным. Моделирование очень часто находится на стыке областей обработки и анализа данных и системной инженерии, а также требует не только знания алгоритмов, но и архитектуры компьютеров и распределенных систем.
Azure Databricks упрощает этот процесс. В следующей 10-минутной учебной записной книжке приведен пример построения моделей машинного обучения на основе табличных данных.
Вы можете импортировать эту записную книжку и запустить ее самостоятельно или скопировать фрагменты кода и идеи для собственного использования.
Записная книжка
Если рабочая область включена для каталога Unity, используйте эту версию записной книжки:
Использование scikit-learn с интеграцией MLflow в Databricks (каталог Unity)
Если рабочая область не включена для каталога Unity, используйте эту версию записной книжки: