Службы машинного обучения в управляемом экземпляре SQL Azure
Службы машинного обучения — это функция Управляемого экземпляра SQL Azure, которая обеспечивает машинное обучение в базе данных, поддерживающее скрипты Python и R. Эта функция включает в себя пакеты Python и R Майкрософт для высокопроизводительной прогнозной аналитики и машинного обучения. Реляционные данные можно использовать в сценариях с помощью хранимых процедур, скрипта T-SQL, содержащего инструкции Python или R, или кода Python или R, содержащего T-SQL.
Что такое Службы машинного обучения?
Службы машинного обучения в Управляемом экземпляре SQL Azure можно использовать для запуска скриптов R или Python в базе данных. С их помощью можно подготавливать и очищать данные, выполнять проектирование признаков, а также обучать, оценивать и развертывать модели машинного обучения в базе данных. Этот компонент выполняет скрипты там, где хранятся данные, и устраняет необходимость перемещения данных по сети на другой сервер.
Используйте Службы машинного обучения с поддержкой R/Python в Управляемом экземпляре SQL Azure:
Выполнение скриптов R и Python для подготовки данных и обработки данных общего назначения. Теперь вы можете перенести сценарии R или Python в Управляемый экземпляр SQL Azure, где хранятся ваши данные, вместо того, чтобы перемещать данные на другой сервер для выполнения скриптов R и Python. Вы можете избежать перемещения данных и сопутствующих проблем, связанных с задержкой, безопасностью и соответствием.
Обучение моделей машинного обучения в базе данных. Вы можете обучить модели с помощью любых алгоритмов с открытым кодом. Вы можете легко масштабировать обучение по всему набору данных, не полагаясь на образцы наборов данных, извлеченных из базы.
Развертывание моделей и скриптов в рабочей среде в хранимых процедурах. Скрипты и обученные модели можно просто внедрить в хранимые процедуры T-SQL. Приложения, подключающиеся к Управляемому экземпляру SQL Azure, могут воспользоваться преимуществами прогнозов и средств искусственного интеллекта в этих моделях, просто вызвав хранимую процедуру. Можно также использовать собственную функцию T-SQL PREDICT, чтобы включить модели для быстрой оценки в сценариях оценки в реальном времени с высокой степенью параллелизма.
Базовые распределения Python и R включены в Службы машинного обучения. Вы можете установить и использовать платформы и пакеты с открытым исходным кодом, такие как PyTorch, TensorFlow и scikit-learn, в дополнение к пакетам Microsoft revoscalepy и microsoftml для Python и RevoScaleR, MicrosoftML, OLAP и sqlrutils для R.
Включение Служб машинного обучения
Вы можете включить Службы машинного обучения в Управляемом экземпляре SQL Azure, включив расширяемость с помощью следующих команд SQL (Управляемый экземпляр SQL перезапустится и будет недоступен в течение нескольких секунд):
sp_configure 'external scripts enabled', 1;
RECONFIGURE WITH OVERRIDE;
Дополнительные сведения о влиянии этой команды на ресурсы Управляемого экземпляра SQL см. в разделе Управление ресурсами.
Включение Служб машинного обучения в группе отработки отказа
В группе отработки отказа системные базы данных не реплицируются на дополнительный экземпляр (дополнительные сведения см. в разделе Ограничения групп отработки отказа).
Если Управляемый экземпляр SQL, который вы используете, является частью группы отработки отказа, выполните следующие действия:
Выполните команды
sp_configure
иRECONFIGURE
на каждом экземпляре группы отработки отказа, чтобы включить Службы машинного обучения.Установите библиотеки R/Python в пользовательской базе данных, а не в
master
базе данных.
Следующие шаги
- См. общие сведения об основных различиях для Служб машинного обучения SQL Server.
- Сведения об использовании Python в Службах машинного обучения приведены в статье Выполнение скриптов Python.
- Использование R в Службах машинного обучения описано в статье Выполнение скриптов R.
- Дополнительные сведения о применении машинного обучения на других платформах SQL доступны в документации по машинному обучению SQL.