Поделиться через


Экспорт Базу данных SQL Azure

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

в этой статье описывается использование параметра export to База данных SQL Azure в модуле export Data в Машинное обучение Studio (классическая модель). этот параметр полезен, если вы хотите экспортировать данные из эксперимента машинного обучения в База данных SQL Azure или Azure SQL Data Warehouse.

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

экспорт в базу данных SQL полезен во многих сценариях машинного обучения. например, может потребоваться хранить промежуточные результаты, сохранять оценки или сохранять таблицы сконструированных функций. несмотря на то, что хранение данных в База данных SQL Azure или Azure SQL Data Warehouse может оказаться более дорогим, чем использование таблиц или больших двоичных объектов в Azure, плата за транзакции для баз данных SQL не взимается. Более того, хранилище базы данных идеально подходит для быстрого создания меньших объемов часто используемых данных, обмена данными между экспериментами, а также для создания отчетов по результатам, прогнозам и метрикам.

С другой стороны, могут существовать ограничения на объем данных, которые можно хранить в базе данных, в зависимости от типа подписки. Следует также рассмотреть возможность использования базы данных и учетной записи, которая находится в том же регионе, что и Рабочая область машинного обучения.

Чтобы экспортировать данные, укажите имя экземпляра и имя базы данных, где хранятся данные, и запустите модуль, используя учетную запись с разрешениями на запись. Необходимо также указать имя таблицы и связать столбцы из эксперимента со столбцами в таблице.

экспорт данных в База данных SQL Azure

  1. Добавьте модуль Export Data (экспорт данных ) в эксперимент в студии (классическая модель). Этот модуль можно найти в категории входные и выходные данные .

  2. Подключение экспортировать данные в модуль, который создает данные, которые необходимо экспортировать.

  3. в качестве назначения данныхвыберите База данных SQL Azure. этот параметр также поддерживает Azure SQL Data Warehouse.

  4. укажите имя сервера и базы данных в База данных SQL Azure или Azure SQL Data Warehouse.

    Имя сервера базы данных: введите имя сервера, созданное Azure. Как правило, оно представлено в виде <generated_identifier>.database.windows.net.

    Имя базы данных: введите имя существующей базы данных на сервере, который вы только что указали. Модулю экспорта данных не удается создать базу данных.

    Имя учетной записи пользователя сервера: введите имя пользователя для учетной записи, имеющей разрешения на доступ к базе данных.

    Пароль учетной записи пользователя сервера: укажите пароль для указанной учетной записи пользователя.

  5. Укажите столбцы для экспорта и, если необходимо переименовать столбцы.

    Список сохраняемых столбцов с разделителями-запятыми: введите имена столбцов из эксперимента, который требуется записать в базу данных.

    Имя таблицы данных: введите имя таблицы для хранения данных.

    для База данных SQL Azure, если таблица не существует, создается новая таблица.

    для Azure SQL Data Warehouse таблица должна уже существовать и иметь правильную схему, поэтому обязательно создайте ее заранее.

    Список столбцов DataTable с разделителями-запятыми: введите имена столбцов, которые должны отображаться в целевой таблице.

    для База данных SQL Azure можно изменить имена столбцов, но необходимо сохранить столбцы в том же порядке, в котором были указаны столбцы для экспорта, в списке сохраняемых столбцов с разделителями-запятыми.

    для Azure SQL Data Warehouse имена столбцов должны совпадать с именами, которые уже находятся в схеме целевой таблицы.

  6. число строк, записываемых на операцию SQL Azure: этот параметр указывает, сколько строк должно быть записано в целевую таблицу в каждом пакете.

    по умолчанию установлено значение 50, то есть размер пакета по умолчанию для База данных SQL Azure. Однако при наличии большого количества строк для записи следует увеличить это значение.

    для Azure SQL Data Warehouse рекомендуется присвоить этому параметру значение 1. при использовании большего размера пакета размер строки команды, отправленной в Azure SQL Data Warehouse, может превысить допустимую длину строки, что приведет к ошибке.

  7. Использовать кэшированные результаты: Выберите этот параметр, чтобы не записывать новые результаты при каждом запуске эксперимента. Если другие изменения параметров модуля отсутствуют, эксперимент записывает данные только при первом запуске модуля. Однако новая запись всегда выполняется, если какие-либо параметры были изменены в данных экспорта , что привело бы к изменению результатов.

  8. Запустите эксперимент.

Примеры

Примеры использования модуля Export Data см. в Коллекция решений ии Azure:

Технические примечания

В этом разделе содержатся сведения и советы относительно реализации, а также ответы на часто задаваемые вопросы.

Часто задаваемые вопросы

Использование базы данных в другом географическом регионе

если База данных SQL Azure или SQL Data Warehouse находятся в другом регионе из учетной записи машинного обучения, запись может выполняться медленнее.

Кроме того, вы платите за входящий и исходящий данные подписки, если узел вычислений находится в регионе, отличном от региона учетной записи хранения.

Почему некоторые символы в выходных данных отображаются неправильно

Машинное обучение поддерживает кодировку UTF-8. Если в строковых столбцах в базе данных используется другая кодировка, символы могут быть сохранены неправильно.

кроме того, Машинное обучение не может выводить такие типы данных, как money .

Параметры модуля

Имя Диапазон Тип По умолчанию Описание
Источник данных Список Источник данных или приемник хранилище BLOB-объектов Azure источником данных может быть HTTP, FTP, anonymous HTTPS или FTPS, файл в хранилище BLOB-объектов azure, таблица Azure, База данных SQL Azure или Azure SQL Data Warehouse, таблица Hive или конечная точка OData.
Имя сервера базы данных any Строка нет
Имя базы данных any Строка нет
Имя учетной записи пользователя сервера any Строка нет
Пароль учетной записи пользователя сервера нет
Список сохраняемых столбцов с разделителями-запятыми нет
Имя таблицы данных any Строка нет
Список столбцов таблицы данных с разделителями-запятыми Строка Строка нет Строка
Количество строк, записываемых за одну операцию SQL Azure Строка Целое число 50 Строка
Использование кэшированных результатов True или false Логическое FALSE Модуль выполняется только в том случае, если не существует допустимого кэша. в противном случае используйте кэшированные данные из предыдущих выполнений.

Исключения

Исключение Описание
Ошибка 0027 Исключение возникает, если два объекта должны быть одинакового размера, но это не так.
Ошибка 0003 Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты.
Ошибка 0029 Исключение возникает при передаче недопустимого универсального кода ресурса.
Ошибка 0030 Исключение возникает, когда не удается скачать файл.
Ошибка 0002 Исключение возникает, если один или несколько параметров не удалось проанализировать или преобразовать из заданного типа в необходимый для целевого метода тип.
Ошибка 0009 Исключение возникает, если имя учетной записи хранилища Azure или имя контейнера указаны неверно.
Ошибка 0048 Исключение возникает, когда не удается открыть файл.
Ошибка 0015 Исключение возникает, если произошел сбой подключения к базе данных.
Ошибка 0046 Исключение возникает, если не удается создать каталог по указанному пути.
Ошибка 0049 Исключение возникает, когда не удается проанализировать файл.

список ошибок, относящихся к модулям студии (классическая версия), см. в разделе Машинное обучение коды ошибок.

список исключений API см. в разделе Машинное обучение REST API коды ошибок.

См. также раздел

Импорт данных
Экспорт данных
Экспорт данных в хранилище BLOB-объектов Azure
Экспорт в запрос Hive
Экспорт в таблицу Azure