Een lab instellen om gegevenswetenschap te leren met Python en Jupyter Notebooks
Belangrijk
Azure Lab Services wordt op 28 juni 2027 buiten gebruik gesteld. Zie de handleiding voor buitengebruikstelling voor meer informatie.
In dit artikel wordt beschreven hoe u een virtuele sjabloonmachine (VM) instelt in Azure Lab Services met hulpprogramma's waarmee leerlingen/studenten Jupyter Notebooks kunnen gebruiken. U leert ook hoe labgebruikers verbinding kunnen maken met notebooks op hun virtuele machines.
Jupyter Notebooks is een opensource-project waarmee u eenvoudig rtf-tekst en uitvoerbare Python-broncode kunt combineren op één canvas, ook wel een notebook genoemd. Voer een notebook uit om een lineaire record van invoer en uitvoer te maken. Deze uitvoer kan bestaan uit tekst, tabellen met informatie, spreidingsdiagrammen en meer.
Notitie
Dit artikel verwijst naar functies die beschikbaar zijn in labplannen, waardoor labaccounts zijn vervangen.
Vereisten
- Als u dit lab wilt instellen, hebt u toegang nodig tot een Azure-abonnement. Neem contact op met de beheerder van uw organisatie om te zien of u toegang krijgt tot een bestaand Azure-abonnement. Als u geen Azure-abonnement hebt, maakt u een gratis account voordat u begint.
Instellingen voor labplannen configureren
Nadat u een Azure-abonnement hebt, kunt u een labplan maken in Azure Lab Services. Zie quickstart: Resources instellen om labs te maken voor meer informatie over het maken van een nieuw labplan. U kunt ook een bestaand labplan gebruiken.
In dit lab wordt een van de Datawetenschap vm-installatiekopieën gebruikt als basis-VM-installatiekopieën. Deze installatiekopieën zijn beschikbaar in Azure Marketplace. Met deze optie kunnen labmakers de installatiekopieën vervolgens selecteren als basisinstallatiekopieën voor hun lab. U moet deze installatiekopieën inschakelen in uw labplan.
Volg deze stappen om deze Azure Marketplace-installatiekopieën in te schakelen die beschikbaar zijn voor labmakers.
Selecteer een van de volgende Azure Marketplace-installatiekopieën, afhankelijk van de vereisten van uw besturingssysteem:
- Datawetenschap Virtuele machine – Windows Server 2019/Windows Server 2022
- Datawetenschap Virtuele machine – Ubuntu 20.04
U kunt ook een aangepaste VM-installatiekopieën maken:
De Datawetenschap VM-installatiekopieën in Azure Marketplace zijn al geconfigureerd met Jupyter Notebooks. Deze afbeeldingen bevatten ook andere ontwikkel- en modelleringsprogramma's voor gegevenswetenschap. Als u deze extra hulpprogramma's niet nodig hebt en een lichtgewicht installatie wilt met alleen Jupyter-notebooks, maakt u een aangepaste VM-installatiekopie. Zie JupyterHub installeren in Azure voor een voorbeeld.
Nadat u de aangepaste installatiekopieën hebt gemaakt, uploadt u de afbeelding naar een rekengalerie om deze te gebruiken met Azure Lab Services. Meer informatie over het gebruik van de rekengalerie in Azure Lab Services.
Een lab maken
Maak een lab voor uw labplan:
Zie Zelfstudie: Een lab instellen voor instructies voor het maken van een lab. Geef de volgende labinstellingen op:
Labinstellingen Weergegeven als Grootte van de virtuele machine Selecteer Small of Medium voor een basisinstallatie voor toegang tot Jupyter Notebooks. Selecteer Alternatieve kleine GPU (Compute) voor rekenintensieve en netwerkintensieve toepassingen die worden gebruikt in klassen Kunstmatige intelligentie en Deep Learning. Installatiekopieën van virtuele machines Kies Datawetenschap Virtuele machine – Windows Server 2019, Datawetenschap Virtual Machine – Windows Server 2022 of Datawetenschap Virtual Machine – Ubuntu. Instellingen voor virtuele sjablonen Selecteer Virtuele machine gebruiken zonder aanpassingen. Wanneer u een lab met de grootte Alternatieve kleine GPU (Compute) maakt, installeert u GPU-stuurprogramma's.
Met dit proces worden recente NVIDIA-stuurprogramma's en de CUDA-toolkit (Compute Unified Device Architecture) geïnstalleerd, die u moet inschakelen voor high-performance computing met de GPU. Zie Een lab instellen met virtuele GPU-machines voor meer informatie.
Configuratie van sjablooncomputer
Nadat u een lab hebt gemaakt, maakt u een sjabloon-VM die is gebaseerd op de grootte en installatiekopieën van de virtuele machine die u kiest. Configureer de sjabloon-VM met alles wat u aan uw leerlingen/studenten wilt bieden voor deze klas. Zie Een sjabloon maken en beheren in Azure Lab Services voor meer informatie.
De Datawetenschap VM-installatiekopieën worden geleverd met veel data science-frameworks en -hulpprogramma's die vereist zijn voor dit type klasse. De afbeeldingen zijn bijvoorbeeld:
- Jupyter Notebooks: een webtoepassing waarmee gegevenswetenschappers onbewerkte gegevens kunnen uitvoeren, berekeningen kunnen uitvoeren en de resultaten in dezelfde omgeving kunnen bekijken. Deze wordt lokaal uitgevoerd in de sjabloon-VM.
- Visual Studio Code: een geïntegreerde ontwikkelomgeving (IDE) die een uitgebreide interactieve ervaring biedt bij het schrijven en testen van een notebook. Zie Werken met Jupyter Notebooks in Visual Studio Code voor meer informatie.
De Datawetenschap Virtual Machine – Ubuntu-installatiekopie is ingericht met X2Go-server, zodat labgebruikers een grafische bureaubladervaring kunnen gebruiken.
Hulpprogramma's inschakelen voor het gebruik van GPU's
Als u de grootte alternatieve kleine GPU (Compute) gebruikt, raden we u aan te controleren of de Datawetenschap frameworks en bibliotheken juist zijn ingesteld voor het gebruik van GPU's. Mogelijk moet u een andere versie van de NVIDIA-stuurprogramma's en de CUDA-toolkit installeren. Als u de GPU's wilt configureren, raadpleegt u de documentatie van het framework of de bibliotheek.
Als u bijvoorbeeld wilt valideren dat TensorFlow gebruikmaakt van de GPU, maakt u verbinding met de sjabloon-VM en voert u de volgende Python-TensorFlow-code uit in Jupyter Notebooks:
import tensorflow as tf
from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())
Als de uitvoer van deze code eruitziet als het volgende resultaat, gebruikt TensorFlow de GPU niet:
[name: "/device:CPU:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}
incarnation: 15833696144144374634
]
Als u verdergaat met dit voorbeeld, raadpleegt u TensorFlow GPU-ondersteuning voor richtlijnen. Richtlijnen voor TensorFlow hebben betrekking op:
- Vereiste versie van de NVIDIA-stuurprogramma's
- Vereiste versie van de CUDA Toolkit
- Instructies voor het installeren van NVIDIA CUDA Deep Neural Network-bibliotheek (cudDNN)
Nadat u de stappen van TensorFlow hebt gevolgd om de GPU te configureren, ziet u, wanneer u de testcode opnieuw uitvoert, resultaten die vergelijkbaar zijn met de volgende uitvoer.
[name: "/device:CPU:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}
incarnation: 15833696144144374634
, name: "/device:GPU:0"
device_type: "GPU"
memory_limit: 11154792128
locality {
bus_id: 1
links {
}
}
incarnation: 2659412736190423786
physical_device_desc: "device: 0, name: NVIDIA Tesla K80, pci bus id: 0001:00:00.0, compute capability: 3.7"
]
Notebooks opgeven voor de klasse
De volgende taak is om labgebruikers notebooks te bieden die u wilt gebruiken. U kunt notebooks lokaal opslaan op de sjabloon-VM, zodat elke labgebruiker een eigen kopie heeft.
Als u voorbeeldnotebooks van Azure Machine Learning wilt gebruiken, raadpleegt u hoe u een omgeving configureert met Jupyter Notebooks.
De sjabloonmachine publiceren
Als u de lab-VM beschikbaar wilt maken voor labgebruikers, publiceert u de sjabloon. De lab-VM heeft alle lokale hulpprogramma's en notebooks die u eerder hebt geconfigureerd.
Verbinding maken met Jupyter Notebooks
In de volgende secties ziet u verschillende manieren waarop labgebruikers verbinding kunnen maken met Jupyter Notebooks op de lab-VM.
Jupyter Notebooks gebruiken op de lab-VM
Labgebruikers kunnen vanaf hun lokale computer verbinding maken met de lab-VM en vervolgens Jupyter Notebooks in de lab-VM gebruiken.
Als u een virtuele Windows-testomgeving gebruikt, kunnen labgebruikers via extern bureaublad (RDP) verbinding maken met hun lab-VM's. Zie voor meer informatie hoe u verbinding maakt met een Windows-lab-VM.
Als u een op Linux gebaseerde lab-VM gebruikt, kunnen labgebruikers verbinding maken met hun lab-VM's via SSH of met behulp van X2Go. Zie voor meer informatie hoe u verbinding maakt met een virtuele Linux-testomgeving.
SSH-tunnel naar Jupyter-server op de VM
Voor op Linux gebaseerde labs kunt u ook rechtstreeks vanaf uw lokale computer verbinding maken met de Jupyter-server in de lab-VM. Met het SSH-protocol kunt u port forwarding tussen de lokale computer en een externe server inschakelen. Dit is de lab-VM van de gebruiker. Een toepassing die wordt uitgevoerd op een bepaalde poort op de server, wordt getunneld naar de toewijzingspoort op de lokale computer.
Volg deze stappen om een SSH-tunnel te configureren tussen de lokale machine van een gebruiker en de Jupyter-server op de lab-VM:
Ga naar de website van Azure Lab Services.
Controleer of de op Linux gebaseerde lab-VM wordt uitgevoerd.
Selecteer het verbindingspictogram >Verbinding maken via SSH om de opdracht SSH-verbinding op te halen.
De opdracht SSH-verbinding ziet er als volgt uit:
ssh -p 12345 student@ml-lab-00000000-0000-0000-0000-000000000000.eastus2.cloudapp.azure.com
Meer informatie over het maken van verbinding met een Virtuele Linux-machine.
Start op uw lokale computer een terminal of opdrachtprompt en kopieer de SSH-verbindingsreeks ernaartoe. Voeg vervolgens toe
-L 8888:localhost:8888
aan de opdrachtreeks, waarmee de tunnel tussen de poorten wordt gemaakt.De laatste opdracht moet eruitzien als in het volgende voorbeeld.
ssh –L 8888:localhost:8888 -p 12345 student@ml-lab-00000000-0000-0000-0000-000000000000.eastus.cloudapp.azure.com
Druk op Enter om de opdracht uit te voeren.
Geef desgevraagd het wachtwoord van de lab-VM op om verbinding te maken met de lab-VM.
Wanneer u verbinding maakt met de VIRTUELE machine, start u de Jupyter-server met behulp van deze opdracht:
jupyter notebook
De opdracht voert een URL uit voor de Jupyter-server in de terminal. De URL moet er als volgt uitzien:
http://localhost:8888/?token=8c09ecfc93e6a8cbedf9c66dffdae19670a64acc1d37
Als u verbinding wilt maken met uw Jupyter Notebook en eraan wilt werken, plakt u deze URL in een browser op uw lokale computer.
Notitie
Visual Studio Code maakt ook een geweldige Jupyter Notebook-bewerkingservaring mogelijk. U kunt de instructies volgen voor het maken van verbinding met een externe Jupyter-server en dezelfde URL uit de vorige stap gebruiken om verbinding te maken vanuit VS Code in plaats van vanuit de browser.
Gerelateerde inhoud
In dit artikel hebt u geleerd hoe u een lab maakt voor een Jupyter Notebooks-klasse en hoe gebruikers verbinding kunnen maken met hun notebooks op de vm van het lab. U kunt een vergelijkbare installatie gebruiken voor andere machine learning-klassen.
De sjabloonafbeelding kan nu worden gepubliceerd naar het lab. Zie De sjabloon-VM publiceren voor meer informatie.
Zie de volgende artikelen tijdens het instellen van uw lab: