Azure Machine Learning-resources identificeren
Resources in Azure Machine Learning verwijzen naar de infrastructuur die u nodig hebt om een machine learning-werkstroom uit te voeren. In het ideale gevallen wilt u dat iemand als beheerder de resources maakt en beheert.
De resources in Azure Machine Learning zijn onder andere:
- De werkruimte
- Rekenresources
- Gegevensarchieven
De werkruimte maken en beheren
De werkruimte is de resource op het hoogste niveau voor Azure Machine Learning. Gegevenswetenschappers hebben toegang nodig tot de werkruimte om modellen te trainen en bij te houden en om de modellen te implementeren op eindpunten.
U wilt echter voorzichtig zijn met wie volledige toegang heeft tot de werkruimte. Naast verwijzingen naar rekenresources en gegevensarchieven vindt u alle logboeken, metrische gegevens, uitvoer, modellen en momentopnamen van uw code in de werkruimte.
Compute-resources maken en beheren
Een van de belangrijkste resources die u nodig hebt bij het trainen of implementeren van een model is berekening. Er zijn vijf typen rekenkracht in de Azure Machine Learning-werkruimte:
- Rekeninstanties: vergelijkbaar met een virtuele machine in de cloud, beheerd door de werkruimte. Ideaal om te gebruiken als een ontwikkelomgeving om notebooks (Jupyter) uit te voeren.
- Rekenclusters: clusters op aanvraag van CPU- of GPU-rekenknooppunten in de cloud, beheerd door de werkruimte. Ideaal om te gebruiken voor productieworkloads, omdat ze automatisch naar uw behoeften worden geschaald.
- Kubernetes-clusters: hiermee kunt u een AKS-cluster (Azure Kubernetes Service) maken of koppelen. Ideaal voor het implementeren van getrainde machine learning-modellen in productiescenario's.
- Gekoppelde berekeningen: hiermee kunt u andere Azure-rekenresources koppelen aan de werkruimte, zoals Azure Databricks of Synapse Spark-pools.
- Serverloze berekening: een volledig beheerde, on-demand berekening die u kunt gebruiken voor trainingstaken.
Notitie
Omdat Azure Machine Learning serverloze berekeningen voor u maakt en beheert, wordt deze niet weergegeven op de rekenpagina in de studio. Meer informatie over het gebruik van serverloze berekeningen voor modeltraining
Hoewel compute de belangrijkste resource is bij het werken met machine learning-workloads, kan dit ook de meest kostenintensieve zijn. Daarom is het raadzaam alleen beheerders toe te staan rekenresources te maken en te beheren. Gegevenswetenschappers mogen geen berekeningen bewerken, maar gebruiken alleen de beschikbare rekenkracht om hun workloads uit te voeren.
Gegevensarchieven maken en beheren
In de werkruimte worden geen gegevens zelf opgeslagen. In plaats daarvan worden alle gegevens opgeslagen in gegevensarchieven, die verwijzen naar Azure-gegevensservices. De verbindingsgegevens met een gegevensservice die een gegevensarchief vertegenwoordigt, worden opgeslagen in Azure Key Vault.
Wanneer een werkruimte wordt gemaakt, wordt er een Azure Storage-account gemaakt en automatisch verbonden met de werkruimte. Als gevolg hiervan hebt u vier gegevensarchieven die al zijn toegevoegd aan uw werkruimte:
workspaceartifactstore
: Maakt verbinding met deazureml
container van het Azure Storage-account dat is gemaakt met de werkruimte. Wordt gebruikt voor het opslaan van reken- en experimentlogboeken bij het uitvoeren van taken.workspaceworkingdirectory
: Maakt verbinding met de bestandsshare van het Azure Storage-account dat is gemaakt met de werkruimte die wordt gebruikt door de sectie Notebooks van de studio. Wanneer u bestanden of mappen uploadt voor toegang vanuit een rekenproces, worden de bestanden of mappen geĆ¼pload naar deze bestandsshare.workspaceblobstore
: maakt verbinding met de Blob Storage van het Azure Storage-account dat is gemaakt met de werkruimte. Met name deazureml-blobstore-...
container. Ingesteld als het standaardgegevensarchief, wat betekent dat wanneer u een gegevensasset maakt en gegevens uploadt, u de gegevens in deze container opslaat.workspacefilestore
: Maakt verbinding met de bestandsshare van het Azure Storage-account dat is gemaakt met de werkruimte. Met name deazureml-filestore-...
bestandsshare.
Daarnaast kunt u gegevensarchieven maken om verbinding te maken met andere Azure-gegevensservices. Meestal maken uw gegevensarchieven verbinding met een Azure Storage-account of Azure Data Lake Storage (Gen2), omdat deze gegevensservices het vaakst worden gebruikt in data science-projecten.