Поделиться через


Схема YAML в Azure Data Lake 2-го поколения с интерфейсом командной строки (версия 2)

ОБЛАСТЬ ПРИМЕНЕНИЯ: расширение машинного обучения Azure CLI версии 2 (текущее)

Исходная схема JSON можно найти на этом ресурсе.

Примечание.

Синтаксис YAML, описанный в этом документе, основан на схеме JSON для последней версии расширения ML CLI (версия 2). Этот синтаксис гарантированно работает только с последней версией расширения ML CLI (версия 2). Схемы для старых версий расширений можно найти по адресу https://azuremlschemasprod.azureedge.net/.

Синтаксис YAML

Ключ Тип Описание Допустимые значения Default value
$schema строка Схема YAML. Если вы используете расширение Машинное обучение Azure Visual Studio Code для создания ФАЙЛА YAML, можно вызвать завершение схемы и ресурсов, если вы включаете $schema в начало файла.
type строка Обязательный. Тип хранилища данных. azure_data_lake_gen2
name строка Обязательный. Имя хранилища данных.
description строка Описание хранилища данных.
tags объект Словарь тегов хранилища данных.
account_name строка Обязательный. Имя учетной записи хранения Azure.
filesystem строка Обязательный. Имя файловой системы. Родительский каталог, содержащий файлы и папки, эквивалентный контейнеру хранилища блога Azure.
endpoint строка Суффикс конечной точки службы хранилища, используемый для создания URL-адреса конечной точки учетной записи хранения. Он объединяет имя учетной записи хранения и endpoint. Пример URL-адреса учетной записи хранения: https://<storage-account-name>.dfs.core.windows.net. core.windows.net
protocol строка Протокол для подключения к файловой системе. https, abfss https
credentials объект Учетные данные субъекта-службы для подключения к учетной записи хранения Azure. Секреты учетных данных хранятся в хранилище ключей рабочей области.
credentials.tenant_id строка Идентификатор клиента субъекта-службы. Обязателен, если указан ключ credentials.
credentials.client_id строка Идентификатор клиента субъекта-службы. Обязателен, если указан ключ credentials.
credentials.client_secret строка Секрет клиента субъекта-службы. Обязателен, если указан ключ credentials.
credentials.resource_url строка URL-адрес ресурса, указывающий операции, которые будут выполняться в учетной записи Azure Data Lake Storage 2-го поколения. https://storage.azure.com/
credentials.authority_url строка URL-адрес центра, используемый для проверки подлинности пользователя. https://login.microsoftonline.com

Замечания

Команду az ml datastore можно использовать для управления хранилищами данных для Машинного обучения Azure.

Примеры

Примеры доступны в репозитории примеров GitHub. Ниже приведено несколько примеров:

YAML: доступ на основе удостоверений

$schema: https://azuremlschemas.azureedge.net/latest/azureDataLakeGen2.schema.json
name: adls_gen2_credless_example
type: azure_data_lake_gen2
description: Credential-less datastore pointing to an Azure Data Lake Storage Gen2.
account_name: mytestdatalakegen2
filesystem: my-gen2-container

YAML: идентификатор арендатора, идентификатор арендатора, секрет арендатора

$schema: https://azuremlschemas.azureedge.net/latest/azureDataLakeGen2.schema.json
name: adls_gen2_example
type: azure_data_lake_gen2
description: Datastore pointing to an Azure Data Lake Storage Gen2.
account_name: mytestdatalakegen2
filesystem: my-gen2-container
credentials:
  tenant_id: XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX
  client_id: XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX
  client_secret: XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Следующие шаги