Экспорт Базу данных SQL Azure
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
в этой статье описывается использование параметра export to База данных SQL Azure в модуле export Data в Машинное обучение Studio (классическая модель). этот параметр полезен, если вы хотите экспортировать данные из эксперимента машинного обучения в База данных SQL Azure или Azure SQL Data Warehouse.
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
экспорт в базу данных SQL полезен во многих сценариях машинного обучения. например, может потребоваться хранить промежуточные результаты, сохранять оценки или сохранять таблицы сконструированных функций. несмотря на то, что хранение данных в База данных SQL Azure или Azure SQL Data Warehouse может оказаться более дорогим, чем использование таблиц или больших двоичных объектов в Azure, плата за транзакции для баз данных SQL не взимается. Более того, хранилище базы данных идеально подходит для быстрого создания меньших объемов часто используемых данных, обмена данными между экспериментами, а также для создания отчетов по результатам, прогнозам и метрикам.
С другой стороны, могут существовать ограничения на объем данных, которые можно хранить в базе данных, в зависимости от типа подписки. Следует также рассмотреть возможность использования базы данных и учетной записи, которая находится в том же регионе, что и Рабочая область машинного обучения.
Чтобы экспортировать данные, укажите имя экземпляра и имя базы данных, где хранятся данные, и запустите модуль, используя учетную запись с разрешениями на запись. Необходимо также указать имя таблицы и связать столбцы из эксперимента со столбцами в таблице.
экспорт данных в База данных SQL Azure
Добавьте модуль Export Data (экспорт данных ) в эксперимент в студии (классическая модель). Этот модуль можно найти в категории входные и выходные данные .
Подключение экспортировать данные в модуль, который создает данные, которые необходимо экспортировать.
в качестве назначения данныхвыберите База данных SQL Azure. этот параметр также поддерживает Azure SQL Data Warehouse.
укажите имя сервера и базы данных в База данных SQL Azure или Azure SQL Data Warehouse.
Имя сервера базы данных: введите имя сервера, созданное Azure. Как правило, оно представлено в виде
<generated_identifier>.database.windows.net
.Имя базы данных: введите имя существующей базы данных на сервере, который вы только что указали. Модулю экспорта данных не удается создать базу данных.
Имя учетной записи пользователя сервера: введите имя пользователя для учетной записи, имеющей разрешения на доступ к базе данных.
Пароль учетной записи пользователя сервера: укажите пароль для указанной учетной записи пользователя.
Укажите столбцы для экспорта и, если необходимо переименовать столбцы.
Список сохраняемых столбцов с разделителями-запятыми: введите имена столбцов из эксперимента, который требуется записать в базу данных.
Имя таблицы данных: введите имя таблицы для хранения данных.
для База данных SQL Azure, если таблица не существует, создается новая таблица.
для Azure SQL Data Warehouse таблица должна уже существовать и иметь правильную схему, поэтому обязательно создайте ее заранее.
Список столбцов DataTable с разделителями-запятыми: введите имена столбцов, которые должны отображаться в целевой таблице.
для База данных SQL Azure можно изменить имена столбцов, но необходимо сохранить столбцы в том же порядке, в котором были указаны столбцы для экспорта, в списке сохраняемых столбцов с разделителями-запятыми.
для Azure SQL Data Warehouse имена столбцов должны совпадать с именами, которые уже находятся в схеме целевой таблицы.
число строк, записываемых на операцию SQL Azure: этот параметр указывает, сколько строк должно быть записано в целевую таблицу в каждом пакете.
по умолчанию установлено значение 50, то есть размер пакета по умолчанию для База данных SQL Azure. Однако при наличии большого количества строк для записи следует увеличить это значение.
для Azure SQL Data Warehouse рекомендуется присвоить этому параметру значение 1. при использовании большего размера пакета размер строки команды, отправленной в Azure SQL Data Warehouse, может превысить допустимую длину строки, что приведет к ошибке.
Использовать кэшированные результаты: Выберите этот параметр, чтобы не записывать новые результаты при каждом запуске эксперимента. Если другие изменения параметров модуля отсутствуют, эксперимент записывает данные только при первом запуске модуля. Однако новая запись всегда выполняется, если какие-либо параметры были изменены в данных экспорта , что привело бы к изменению результатов.
Запустите эксперимент.
Примеры
Примеры использования модуля Export Data см. в Коллекция решений ии Azure:
Прогноз розничной торговли, шаг 1 из 6 — Предварительная обработка данных. шаблон прогнозирования розничной торговли иллюстрирует задачу машинного обучения на основе данных, хранящихся в Azure sqldb. в нем демонстрируются полезные методики, такие как использование базы данных Azure SQL для передачи наборов данных между экспериментами в разных учетных записях, сохранение и объединение прогнозов, а также создание базы данных Azure SQL только для машинного обучения.
создание и развертывание модели машинного обучения с помощью SQL Server на виртуальной машине azure. в этой статье рассматривается использование базы данных SQL Server, размещенной на виртуальной машине azure, в качестве источника для хранения обучающих данных и прогнозов. В нем также показано, как можно использовать реляционную базу данных для проектирования признаков и выбора компонентов.
использование ML Azure с Azure SQL Data Warehouse: демонстрируется использование данных из Azure SQL Data Warehouse для построения модели кластеризации.
использование Машинное обучение с SQL Data Warehouse: демонстрируется создание модели регрессии для прогнозирования цен с использованием данных в Azure SQL Data Warehouse.
Технические примечания
В этом разделе содержатся сведения и советы относительно реализации, а также ответы на часто задаваемые вопросы.
Часто задаваемые вопросы
Использование базы данных в другом географическом регионе
если База данных SQL Azure или SQL Data Warehouse находятся в другом регионе из учетной записи машинного обучения, запись может выполняться медленнее.
Кроме того, вы платите за входящий и исходящий данные подписки, если узел вычислений находится в регионе, отличном от региона учетной записи хранения.
Почему некоторые символы в выходных данных отображаются неправильно
Машинное обучение поддерживает кодировку UTF-8. Если в строковых столбцах в базе данных используется другая кодировка, символы могут быть сохранены неправильно.
кроме того, Машинное обучение не может выводить такие типы данных, как money
.
Параметры модуля
Имя | Диапазон | Тип | По умолчанию | Описание |
---|---|---|---|---|
Источник данных | Список | Источник данных или приемник | хранилище BLOB-объектов Azure | источником данных может быть HTTP, FTP, anonymous HTTPS или FTPS, файл в хранилище BLOB-объектов azure, таблица Azure, База данных SQL Azure или Azure SQL Data Warehouse, таблица Hive или конечная точка OData. |
Имя сервера базы данных | any | Строка | нет | |
Имя базы данных | any | Строка | нет | |
Имя учетной записи пользователя сервера | any | Строка | нет | |
Пароль учетной записи пользователя сервера | нет | |||
Список сохраняемых столбцов с разделителями-запятыми | нет | |||
Имя таблицы данных | any | Строка | нет | |
Список столбцов таблицы данных с разделителями-запятыми | Строка | Строка | нет | Строка |
Количество строк, записываемых за одну операцию SQL Azure | Строка | Целое число | 50 | Строка |
Использование кэшированных результатов | True или false | Логическое | FALSE | Модуль выполняется только в том случае, если не существует допустимого кэша. в противном случае используйте кэшированные данные из предыдущих выполнений. |
Исключения
Исключение | Описание |
---|---|
Ошибка 0027 | Исключение возникает, если два объекта должны быть одинакового размера, но это не так. |
Ошибка 0003 | Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты. |
Ошибка 0029 | Исключение возникает при передаче недопустимого универсального кода ресурса. |
Ошибка 0030 | Исключение возникает, когда не удается скачать файл. |
Ошибка 0002 | Исключение возникает, если один или несколько параметров не удалось проанализировать или преобразовать из заданного типа в необходимый для целевого метода тип. |
Ошибка 0009 | Исключение возникает, если имя учетной записи хранилища Azure или имя контейнера указаны неверно. |
Ошибка 0048 | Исключение возникает, когда не удается открыть файл. |
Ошибка 0015 | Исключение возникает, если произошел сбой подключения к базе данных. |
Ошибка 0046 | Исключение возникает, если не удается создать каталог по указанному пути. |
Ошибка 0049 | Исключение возникает, когда не удается проанализировать файл. |
список ошибок, относящихся к модулям студии (классическая версия), см. в разделе Машинное обучение коды ошибок.
список исключений API см. в разделе Машинное обучение REST API коды ошибок.
См. также раздел
Импорт данных
Экспорт данных
Экспорт данных в хранилище BLOB-объектов Azure
Экспорт в запрос Hive
Экспорт в таблицу Azure