Dela via


Skapa datalager

GÄLLER FÖR:Azure CLI ml extension v2 (current)Python SDK azure-ai-ml v2 (aktuell)

I den här artikeln får du lära dig hur du ansluter till Azure-datalagringstjänster med Azure Machine Learning-datalager.

Förutsättningar

Kommentar

Machine Learning-datalager skapar inte de underliggande lagringskontoresurserna. I stället länkar de ett befintligt lagringskonto för Machine Learning-användning. Machine Learning-datalager krävs inte. Om du har åtkomst till underliggande data kan du använda lagrings-URI:er direkt.

Skapa ett Azure Blob-datalager

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Skapa ett Azure Data Lake Storage Gen2-datalager

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Skapa ett Azure Files-datalager

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Skapa ett Azure Data Lake Storage Gen1-datalager

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Skapa ett OneLake-datalager (Microsoft Fabric) (förhandsversion)

I det här avsnittet beskrivs olika alternativ för att skapa ett OneLake-datalager. OneLake-datalagringen är en del av Microsoft Fabric. Just nu stöder Machine Learning anslutning till Microsoft Fabric Lakehouse-artefakter i mappen "Files" som innehåller mappar eller filer och Amazon S3-genvägar. Mer information om lakehouses finns i Vad är ett sjöhus i Microsoft Fabric?.

Skapande av OneLake-datalager kräver följande information från din Microsoft Fabric-instans:

  • Slutpunkt
  • Arbetsytans GUID
  • Artefakt-GUID

Följande skärmbilder beskriver hämtningen av dessa nödvändiga informationsresurser från din Microsoft Fabric-instans.

Skärmbild som visar hur du klickar på artefaktegenskaper för Microsoft Fabric-arbetsytefakt i Microsoft Fabric-användargränssnittet.

Du hittar sedan "Endpoint", "Workspace GUID" och "Artifact GUID" i "URL" och "ABFS path" från sidan Egenskaper:

  • URL-format: https://{your_one_lake_endpoint}/{your_one_lake_workspace_guid}/{your_one_lake_artifact_guid}/Files
  • ABFS-sökvägsformat: abfss://{your_one_lake_workspace_guid}@{your_one_lake_endpoint}/{your_one_lake_artifact_guid}/Files

Skärmbild som visar URL och ABFS-sökväg för en OneLake-artefakt i Microsoft Fabric-användargränssnittet.

Skapa ett OneLake-datalager

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX", #{your_one_lake_workspace_guid}
    endpoint="msit-onelake.dfs.fabric.microsoft.com" #{your_one_lake_endpoint}
    artifact = OneLakeArtifact(
        name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX/Files", #{your_one_lake_artifact_guid}/Files
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Nästa steg