Общие сведения о URI

Завершено

Данные можно хранить на локальном устройстве или где-то в облаке. Где бы вы ни хранили данные, вы хотите получить доступ к данным при обучении моделей машинного обучения. Чтобы найти и получить доступ к данным в Машинное обучение Azure, можно использовать универсальные идентификаторы ресурсов (URI).

Общие сведения о URI

Универсальный код ресурса (URI) ссылается на расположение данных. Чтобы Машинное обучение Azure подключиться к данным, необходимо префиксировать универсальный код ресурса (URI) с соответствующим протоколом. Существует три распространенных протокола при работе с данными в контексте Машинное обучение Azure:

Схема различных типов протоколов, которые Машинное обучение Azure используются для подключения к внешним источникам данных.

  • http(s): используется для общедоступных или частных хранилищ данных в Хранилище BLOB-объектов Azure или общедоступном расположении http(s).
  • abfs(s): используется для хранилищ данных в Azure Data Lake Storage 2-го поколения.
  • azureml: используется для данных, хранящихся в хранилище данных.

Например, вы можете создать Хранилище BLOB-объектов Azure в Azure. Для хранения данных создайте контейнер с именем training-data. В контейнере создается папка datastore-path. В папке хранится CSV-файл diabetes.csv.

Снимок экрана: данные, хранящиеся в Хранилище BLOB-объектов Azure.

Если вы хотите получить доступ к данным из рабочей области Машинное обучение Azure, можно использовать путь к папке или файлу напрямую. Если вы хотите подключиться к папке или файлу напрямую, можно использовать http(s) протокол. Если для контейнера задано частное значение, необходимо предоставить некоторую проверку подлинности, чтобы получить доступ к данным, например подписанный URL-адрес (SAS).

При создании хранилища данных в Машинное обучение Azure вы сохраните сведения о подключении и проверке подлинности в рабочей области. Затем для доступа к данным в контейнере можно использовать azureml протокол.

Совет

Хранилище данных — это ссылка на существующую учетную запись хранения в Azure. Поэтому при обращении к данным, хранящимся в хранилище данных, вы можете ссылаться на данные, хранящиеся в Хранилище BLOB-объектов Azure или Azure Data Lake Storage. Однако, если вы ссылаетесь на хранилище данных, вам не потребуется пройти проверку подлинности в качестве сведений о подключении, хранящихся в хранилище данных, будет использоваться Машинное обучение Azure.

Рекомендуется избежать конфиденциальных данных в коде, таких как сведения о проверке подлинности. Поэтому по возможности следует работать с хранилищами данных и ресурсами данных в Машинное обучение Azure. Однако во время экспериментов в записных книжках может потребоваться подключиться непосредственно к расположению хранилища, чтобы избежать ненужных затрат.