Skapa en delad pool med Datavetenskap virtuella datorer
I den här artikeln får du lära dig hur du skapar en delad pool med Datavetenskap virtuella datorer (DSVM:er) för ett team. Användning av en delad pool ger viktiga fördelar:
- Bättre resursutnyttjande
- Enklare delning och samarbete
- Effektivare hantering av DSVM-resurser
Du kan använda många metoder och tekniker för att skapa en pool med DSVM:er. Den här artikeln fokuserar på pooler för interaktiva virtuella datorer (VM). En alternativ hanterad beräkningsinfrastruktur omfattar Azure Machine Learning Compute. Mer information finns i Skapa beräkningskluster.
Interaktiv VM-pool
En pool med interaktiv virtuell dator, som delas av ett helt AI/data science-team, ger användarna ett sätt att logga in på en tillgänglig DSVM-instans, i stället för att ha en dedikerad instans för varje uppsättning användare. Den här metoden ger bättre tillgänglighet och effektivare resursanvändning.
Använd teknik för vm-skalningsuppsättningar i Azure för att skapa en interaktiv VM-pool. Använd skalningsuppsättningar för att skapa och hantera en grupp med identiska, belastningsutjämnings- och autoskalningsdatorer.
Användaren loggar in på HUVUDpoolens IP- eller DNS-adress. Skalningsuppsättningen dirigerar automatiskt sessionen till en tillgänglig DSVM i skalningsuppsättningen. Eftersom användarna vill ha en konsekvent och välbekant miljö, oavsett vilken virtuell dator de loggar in på, monterar alla instanser av den virtuella datorn i skalningsuppsättningen en delad nätverksenhet. Detta liknar en Azure Files-resurs eller en NFS-resurs (Network File System). Användarens delade arbetsyta lagras normalt på det delade filarkivet som monterats på var och en av instanserna.
Du hittar en Azure Resource Manager-exempelmall som skapar en skalningsuppsättning med Ubuntu DSVM-instanser på GitHub. Samma plats är värd för ett exempel på parameterfilen för Azure Resource Manager-mallen.
Ange värden för parameterfilen i Azure CLI för att skapa skalningsuppsättningen från Azure Resource Manager-mallen:
az group create --name [[NAME OF RESOURCE GROUP]] --location [[ Data center. For eg: "West US 2"]
az deployment group create --resource-group [[NAME OF RESOURCE GROUP ABOVE]] --template-uri https://raw.githubusercontent.com/Azure/DataScienceVM/master/Scripts/CreateDSVM/Ubuntu/dsvm-vmss-cluster.json --parameters @[[PARAMETER JSON FILE]]
Dessa kommandon förutsätter att du har:
- En kopia av parameterfilen med de värden som angetts för din instans av skalningsuppsättningen
- Antalet VM-instanser
- Pekare till Azure Files-resursen
- Autentiseringsuppgifter för lagringskontot som ska monteras på varje virtuell dator
Kommandona refererar lokalt till parameterfilen. Du kan också skicka parametrar infogade eller fråga efter dem i skriptet.
Föregående mall aktiverar SSH- och JupyterHub-porten från klientdelsskalningsuppsättningen till serverdelspoolen för Ubuntu DSVM:er. Som användare loggar du in på den virtuella datorn på ett säkert gränssnitt (SSH) eller på JupyterHub på vanligt sätt. Eftersom de virtuella datorinstanserna kan skalas upp eller ned dynamiskt måste alla tillstånd sparas i den monterade Azure Files-resursen. Du kan använda samma metod för att skapa en pool med Windows DSVM:er.
Skriptet som monterar Azure Files-resursen är också tillgängligt på Azure DataScienceVM-lagringsplatsen i GitHub. Skriptet monterar Azure Files-resursen vid den angivna monteringspunkten i parameterfilen. Skriptet skapar även mjuka länkar till den monterade enheten i den första användarens hemkatalog. En användarspecifik notebook-katalog i Azure Files-resursen $HOME/notebooks/remote
är mjukt länkad till katalogen, så att användarna kan komma åt, köra och spara sina Jupyter-notebook-filer. Du kan använda samma konvention när du skapar fler användare på den virtuella datorn för att peka varje användares Jupyter-arbetsyta till Azure Files-resursen.
Vm-skalningsuppsättningar stöder automatisk skalning. Du kan ange regler för när du ska skapa fler instanser och när instanser ska skalas ned. Du kan till exempel skala ned till noll instanser för att spara på kostnaderna för maskinvaruanvändning i molnet när de virtuella datorerna inte används alls. Dokumentationssidorna för vm-skalningsuppsättningar innehåller detaljerade steg för automatisk skalning.