Общие сведения о URI
Данные можно хранить на локальном устройстве или где-то в облаке. Где бы вы ни хранили данные, вы хотите получить доступ к данным при обучении моделей машинного обучения. Чтобы найти и получить доступ к данным в Машинное обучение Azure, можно использовать универсальные идентификаторы ресурсов (URI).
Общие сведения о URI
Универсальный код ресурса (URI) ссылается на расположение данных. Чтобы Машинное обучение Azure подключиться к данным, необходимо префиксировать универсальный код ресурса (URI) с соответствующим протоколом. Существует три распространенных протокола при работе с данными в контексте Машинное обучение Azure:
-
http(s)
: используется для общедоступных или частных хранилищ данных в Хранилище BLOB-объектов Azure или общедоступном расположении http(s). -
abfs(s)
: используется для хранилищ данных в Azure Data Lake Storage 2-го поколения. -
azureml
: используется для данных, хранящихся в хранилище данных.
Например, вы можете создать Хранилище BLOB-объектов Azure в Azure. Для хранения данных создайте контейнер с именем training-data
. В контейнере создается папка datastore-path
. В папке хранится CSV-файл diabetes.csv
.
Если вы хотите получить доступ к данным из рабочей области Машинное обучение Azure, можно использовать путь к папке или файлу напрямую. Если вы хотите подключиться к папке или файлу напрямую, можно использовать http(s)
протокол. Если для контейнера задано частное значение, необходимо предоставить некоторую проверку подлинности, чтобы получить доступ к данным, например подписанный URL-адрес (SAS).
При создании хранилища данных в Машинное обучение Azure вы сохраните сведения о подключении и проверке подлинности в рабочей области. Затем для доступа к данным в контейнере можно использовать azureml
протокол.
Совет
Хранилище данных — это ссылка на существующую учетную запись хранения в Azure. Поэтому при обращении к данным, хранящимся в хранилище данных, вы можете ссылаться на данные, хранящиеся в Хранилище BLOB-объектов Azure или Azure Data Lake Storage. Однако, если вы ссылаетесь на хранилище данных, вам не потребуется пройти проверку подлинности в качестве сведений о подключении, хранящихся в хранилище данных, будет использоваться Машинное обучение Azure.
Рекомендуется избежать конфиденциальных данных в коде, таких как сведения о проверке подлинности. Поэтому по возможности следует работать с хранилищами данных и ресурсами данных в Машинное обучение Azure. Однако во время экспериментов в записных книжках может потребоваться подключиться непосредственно к расположению хранилища, чтобы избежать ненужных затрат.