Gegevenswetenschap met een virtuele Windows-Datawetenschap-machine

Artikel
09/01/2024

De Windows Datawetenschap Virtual Machine (DSVM) is een krachtige ontwikkelomgeving voor gegevenswetenschap die ondersteuning biedt voor gegevensverkennings- en modelleringstaken. De omgeving wordt vooraf samengesteld en vooraf verpakt met verschillende populaire hulpprogramma's voor gegevensanalyse waarmee u eenvoudig uw analyse kunt starten voor on-premises, cloud- of hybride implementaties.

De DSVM werkt nauw samen met Azure-services. Het kan gegevens lezen en verwerken die al zijn opgeslagen in Azure, in Azure Synapse (voorheen SQL DW), Azure Data Lake, Azure Storage of Azure Cosmos DB. Het kan ook profiteren van andere analysehulpprogramma's, zoals Azure Machine Learning.

In dit artikel leert u hoe u uw DSVM gebruikt om gegevenswetenschaptaken te verwerken en om te communiceren met andere Azure-services. Dit is een voorbeeld van taken die de DSVM kan omvatten:

Gebruik een Jupyter Notebook om te experimenteren met uw gegevens in een browser, met behulp van Python 2, Python 3 en Microsoft R. (Microsoft R is een bedrijfsklare versie van R die is ontworpen voor hoge prestaties.)
Verken gegevens en ontwikkel modellen lokaal op de DSVM met behulp van Microsoft Machine Learning Server en Python.
Beheer uw Azure-resources met behulp van Azure Portal of PowerShell.
Breid uw opslagruimte uit en deel grootschalige gegevenssets/code in uw hele team, met een Azure Files-share als koppelbaar station op uw DSVM.
Deel code met uw team met GitHub. Open uw opslagplaats met de vooraf geïnstalleerde Git-clients: Git Bash en Git GUI.
Toegang tot Azure-gegevens- en analyseservices:
- Azure Blob Storage
- Azure Cosmos DB
- Azure Synapse (voorheen SQL DW)
- Azure SQL-database
Bouw rapporten en een dashboard met het Power BI Desktop-exemplaar ( vooraf geïnstalleerd op de DSVM ) en implementeer ze in de cloud.
Installeer meer hulpprogramma's op uw virtuele machine.

Notitie

Aanvullende gebruikskosten zijn van toepassing op veel van de services voor gegevensopslag en analyse die in dit artikel worden vermeld. Bezoek de pagina met prijzen van Azure voor meer informatie.

Vereisten

Een Azure-abonnement. Als u nog geen abonnement op Azure hebt, maak dan een gratis account aan voordat u begint.
Een ingerichte DSVM in Azure Portal. Ga naar de resource Een virtuele machine maken voor meer informatie.

Notitie

Het wordt aanbevolen de Azure Az PowerShell-module te gebruiken om te communiceren met Azure. Zie Azure PowerShell installeren om aan de slag te gaan. Raadpleeg Azure PowerShell migreren van AzureRM naar Az om te leren hoe u naar de Azure PowerShell-module migreert.

Jupyter-notebooks gebruiken

Jupyter Notebook biedt een browsergebaseerde IDE voor gegevensverkenning en -modellering. U kunt Python 2, Python 3 of R gebruiken in een Jupyter Notebook.

Als u het Jupyter Notebook wilt starten, selecteert u het Jupyter Notebook-pictogram in het menu Start of op het bureaublad. In de DSVM-opdrachtprompt kunt u ook de opdracht jupyter notebook uitvoeren vanuit de map die als host fungeert voor bestaande notebooks of waar u nieuwe notebooks wilt maken.

Nadat u Jupyter hebt gestart, gaat u naar de /notebooks map. Deze map host voorbeeldnotebooks die vooraf zijn verpakt in de DSVM. U kunt:

Selecteer het notebook om de code weer te geven.
Selecteer Shift+Enter om elke cel uit te voeren.
Selecteer Celuitvoering> om het hele notebook uit te voeren.
Een nieuw notitieblok maken; selecteer het Jupyter-pictogram (linkerbovenhoek), selecteer de knop Nieuw en kies vervolgens de notebooktaal (ook wel kernels genoemd).

Notitie

Op dit moment worden Python 2.7-, Python 3.6-, R-, Julia- en PySpark-kernels in Jupyter ondersteund. De R-kernel ondersteunt programmeren in zowel opensource R als Microsoft R. In het notebook kunt u uw gegevens verkennen, uw model bouwen en dat model testen met uw keuze aan bibliotheken.

Gegevens verkennen en modellen ontwikkelen met Microsoft Machine Learning Server

Notitie

Ondersteuning voor de zelfstandige machine learning-server is beëindigd op 1 juli 2021. We hebben het verwijderd uit de DSVM-installatiekopieën na 30 juni 2021. Bestaande implementaties hebben nog steeds toegang tot de software, maar de ondersteuning is beëindigd na 1 juli 2021.

U kunt R en Python rechtstreeks op de DSVM gebruiken voor uw gegevensanalyse.

Voor R kunt u R Tools voor Visual Studio gebruiken. Microsoft biedt naast de opensource CRAN R-resource ook andere bibliotheken. Deze bibliotheken maken zowel schaalbare analyses als de mogelijkheid om gegevensmassa's te analyseren die de geheugengrootte van parallelle gesegmenteerde analyse overschrijden.

Voor Python kunt u een IDE gebruiken, bijvoorbeeld Visual Studio Community Edition, waarop de PYTHON Tools for Visual Studio -extensie (PTVS) vooraf is geïnstalleerd. Standaard is alleen Python 3.6, de conda-hoofdomgeving, geconfigureerd op PTVS. Anaconda Python 2.7 inschakelen:

Maak aangepaste omgevingen voor elke versie. Selecteer Python>Tools Python-omgevingen> en selecteer vervolgens + Aangepast in Visual Studio Community Edition.
Geef een beschrijving op en stel het pad voor het omgevingsvoorvoegsel in als c:\anaconda\envs\python2 voor Anaconda Python 2.7.
Selecteer Automatisch detecteren>toepassen om de omgeving op te slaan.

Ga naar de PTVS-documentatieresource voor meer informatie over het maken van Python-omgevingen.

U kunt nu een nieuw Python-project maken. Selecteer Bestand>nieuw>project>Python en selecteer het type Python-toepassing dat u wilt bouwen. U kunt de Python-omgeving voor het huidige project instellen op de gewenste versie (Python 2.7 of 3.6) door met de rechtermuisknop op Python-omgevingen te klikken en vervolgens Python-omgevingen toevoegen/verwijderen te selecteren. Raadpleeg de productdocumentatie voor meer informatie over het werken met PTVS.

Azure-resources beheren

Met de DSVM kunt u uw analyseoplossing lokaal bouwen op de virtuele machine. Hiermee hebt u ook toegang tot services op het Azure-cloudplatform. Azure biedt verschillende services, waaronder compute, opslag, gegevensanalyse en meer, die u kunt beheren en openen vanuit uw DSVM.

U hebt twee beschikbare opties voor het beheren van uw Azure-abonnement en cloudresources:

Ga naar Azure Portal in uw browser.
Gebruik PowerShell-scripts. Voer Azure PowerShell uit vanuit een snelkoppeling op het bureaublad of vanuit het menu Start . Ga naar de documentatieresource van Microsoft Azure PowerShell voor meer informatie.

Opslag uitbreiden met behulp van gedeelde bestandssystemen

Gegevenswetenschappers kunnen grote gegevenssets, code of andere resources binnen het team delen. De DSVM heeft ongeveer 45 GB aan beschikbare ruimte. Als u uw opslag wilt uitbreiden, kunt u Azure Files gebruiken en deze koppelen aan een of meer DSVM-exemplaren of openen met een REST API. U kunt ook Azure Portal gebruiken of Azure PowerShell gebruiken om extra toegewezen gegevensschijven toe te voegen.

Notitie

De maximale ruimte op een Azure-bestandsshare is 5 TB. Elk bestand heeft een maximale grootte van 1 TB.

Met dit Azure PowerShell-script maakt u een Azure Files-share:

# Authenticate to Azure.
Connect-AzAccount
# Select your subscription
Get-AzSubscription –SubscriptionName "<your subscription name>" | Select-AzSubscription
# Create a new resource group.
New-AzResourceGroup -Name <dsvmdatarg>
# Create a new storage account. You can reuse existing storage account if you want.
New-AzStorageAccount -Name <mydatadisk> -ResourceGroupName <dsvmdatarg> -Location "<Azure Data Center Name For eg. South Central US>" -Type "Standard_LRS"
# Set your current working storage account
Set-AzCurrentStorageAccount –ResourceGroupName "<dsvmdatarg>" –StorageAccountName <mydatadisk>

# Create an Azure Files share
$s = New-AzStorageShare <<teamsharename>>
# Create a directory under the file share. You can give it any name
New-AzStorageDirectory -Share $s -Path <directory name>
# List the share to confirm that everything worked
Get-AzStorageFile -Share $s

U kunt een Azure Files-share koppelen op elke virtuele machine in Azure. We raden u aan om de VIRTUELE machine en het opslagaccount in hetzelfde Azure-datacenter te plaatsen om latentie- en gegevensoverdrachtskosten te voorkomen. Met deze Azure PowerShell-opdrachten koppelt u het station op de DSVM:

# Get the storage key of the storage account that has the Azure Files share from the Azure portal. Store it securely on the VM to avoid being prompted in the next command.
cmdkey /add:<<mydatadisk>>.file.core.windows.net /user:<<mydatadisk>> /pass:<storage key>

# Mount the Azure Files share as drive Z on the VM. You can choose another drive letter if you want.
net use z:  \\<mydatadisk>.file.core.windows.net\<<teamsharename>>

U hebt toegang tot dit station, net zoals elk normaal station op de virtuele machine.

De GitHub-codeopslagplaats host codevoorbeelden en codebronnen voor veel hulpprogramma's die de ontwikkelaarscommunity deelt. Git wordt gebruikt als technologie om versies van de codebestanden bij te houden en op te slaan. GitHub fungeert ook als platform om uw eigen opslagplaats te maken. Uw eigen opslagplaats kan de gedeelde code en documentatie van uw team opslaan, versiebeheer implementeren en toegangsmachtigingen beheren voor belanghebbenden die code willen weergeven en bijdragen. GitHub ondersteunt samenwerking binnen uw team, het gebruik van code die is ontwikkeld door de community en bijdragen van code terug aan de community. Ga naar de Help-pagina's van GitHub voor meer informatie over Git.

De DSVM wordt geladen met clienthulpprogramma's op de opdrachtregel en in de GUI voor toegang tot de GitHub-opslagplaats. Het git Bash-opdrachtregelprogramma werkt met Git en GitHub. Visual Studio is geïnstalleerd op de DSVM en heeft de Git-extensies. Zowel het startmenu als het bureaublad hebben pictogrammen voor deze hulpprogramma's.

Gebruik de git clone opdracht om code te downloaden uit een GitHub-opslagplaats. Als u de data science-opslagplaats wilt downloaden die door Microsoft is gepubliceerd in de huidige map, voert u bijvoorbeeld deze opdracht uit in Git Bash:

git clone https://github.com/Azure/DataScienceVM.git

Visual Studio kan dezelfde kloonbewerking verwerken. In deze schermopname ziet u hoe u toegang hebt tot Git- en GitHub-hulpprogramma's in Visual Studio:

U kunt werken met beschikbare github.com resources in uw GitHub-opslagplaats. Ga naar de GitHub-cheatsheet-resource voor meer informatie.

Toegang tot Azure-gegevens- en analyseservices

Azure Blob Storage

Azure Blob Storage is een betrouwbare, voordelige cloudopslagservice voor zowel grote als kleine gegevensresources. In deze sectie wordt beschreven hoe u gegevens verplaatst naar Blob Storage en hoe u toegang krijgt tot gegevens die zijn opgeslagen in een Azure-blob.

Vereisten

Een Azure Blob Storage-account dat is gemaakt in Azure Portal.
Controleer of het azcopy-opdrachtregelprogramma vooraf is geïnstalleerd met deze opdracht:

C:\Program Files (x86)\Microsoft SDKs\Azure\AzCopy\azcopy.exe

De directory die als host fungeert azcopy.exe zich al in de omgevingsvariabele PATH bevindt, zodat u het volledige opdrachtpad niet kunt typen wanneer u dit hulpprogramma uitvoert. Lees de AzCopy-documentatie voor meer informatie over het hulpprogramma AzCopy.
Start het hulpprogramma Azure Storage Explorer. U kunt deze downloaden op de webpagina van Storage Explorer.

Gegevens verplaatsen van een VIRTUELE machine naar een Azure-blob: AzCopy

Als u gegevens wilt verplaatsen tussen uw lokale bestanden en Blob Storage, kunt u AzCopy gebruiken op de opdrachtregel of in PowerShell:

AzCopy /Source:C:\myfolder /Dest:https://<mystorageaccount>.blob.core.windows.net/<mycontainer> /DestKey:<storage account key> /Pattern:abc.txt

Vervang C:\myfolder door het mappad dat als host fungeert voor uw bestand
Mystorageaccount vervangen door de naam van uw Blob Storage-account
Mijncontainer vervangen door de containernaam
Opslagaccountsleutel vervangen door uw Blob Storage-toegangssleutel

U vindt uw opslagaccountreferenties in Azure Portal.

Voer de AzCopy-opdracht uit in PowerShell of vanaf een opdrachtprompt. Dit zijn voorbeelden van AzCopy-opdrachten:

# Copy *.sql from a local machine to an Azure blob
"C:\Program Files (x86)\Microsoft SDKs\Azure\AzCopy\azcopy" /Source:"c:\Aaqs\Data Science Scripts" /Dest:https://[ENTER STORAGE ACCOUNT].blob.core.windows.net/[ENTER CONTAINER] /DestKey:[ENTER STORAGE KEY] /S /Pattern:*.sql

# Copy back all files from an Azure blob container to a local machine

"C:\Program Files (x86)\Microsoft SDKs\Azure\AzCopy\azcopy" /Dest:"c:\Aaqs\Data Science Scripts\temp" /Source:https://[ENTER STORAGE ACCOUNT].blob.core.windows.net/[ENTER CONTAINER] /SourceKey:[ENTER STORAGE KEY] /S

Nadat u de AzCopy-opdracht hebt uitgevoerd om het bestand naar een Azure-blob te kopiëren, wordt het bestand weergegeven in Azure Storage Explorer.

Gegevens verplaatsen van een VIRTUELE machine naar een Azure-blob: Azure Storage Explorer

U kunt ook gegevens uploaden vanuit het lokale bestand op uw VIRTUELE machine met Azure Storage Explorer:

Als u gegevens wilt uploaden naar een container, selecteert u de doelcontainer en selecteert u de knop Uploaden .
Selecteer rechts van het vak Bestanden het beletselteken (...), selecteer een of meer bestanden die u wilt uploaden vanuit het bestandssysteem en selecteer Uploaden om de bestanden te uploaden.

Gegevens lezen uit een Azure-blob: Python ODBC

De BlobService-bibliotheek kan gegevens rechtstreeks lezen vanuit een blob in een Jupyter Notebook of in een Python-programma. Importeer eerst de vereiste pakketten:

import pandas as pd
from pandas import Series, DataFrame
import numpy as np
import matplotlib.pyplot as plt
from time import time
import pyodbc
import os
from azure.storage.blob import BlobService
import tables
import time
import zipfile
import random

Sluit de referenties van uw Blob Storage-account aan en lees gegevens uit de blob:

CONTAINERNAME = 'xxx'
STORAGEACCOUNTNAME = 'xxxx'
STORAGEACCOUNTKEY = 'xxxxxxxxxxxxxxxx'
BLOBNAME = 'nyctaxidataset/nyctaxitrip/trip_data_1.csv'
localfilename = 'trip_data_1.csv'
LOCALDIRECTORY = os.getcwd()
LOCALFILE =  os.path.join(LOCALDIRECTORY, localfilename)

#download from blob
t1 = time.time()
blob_service = BlobService(account_name=STORAGEACCOUNTNAME,account_key=STORAGEACCOUNTKEY)
blob_service.get_blob_to_path(CONTAINERNAME,BLOBNAME,LOCALFILE)
t2 = time.time()
print(("It takes %s seconds to download "+BLOBNAME) % (t2 - t1))

#unzip downloaded files if needed
#with zipfile.ZipFile(ZIPPEDLOCALFILE, "r") as z:
#    z.extractall(LOCALDIRECTORY)

df1 = pd.read_csv(LOCALFILE, header=0)
df1.columns = ['medallion','hack_license','vendor_id','rate_code','store_and_fwd_flag','pickup_datetime','dropoff_datetime','passenger_count','trip_time_in_secs','trip_distance','pickup_longitude','pickup_latitude','dropoff_longitude','dropoff_latitude']
print 'the size of the data is: %d rows and  %d columns' % df1.shape

De gegevens worden gelezen als een gegevensframe:

Azure Synapse Analytics en databases

Azure Synapse Analytics is een elastisch datawarehouse als een service, met een SQL Server-ervaring van bedrijfsklasse. In deze resource wordt beschreven hoe u Azure Synapse Analytics inricht. Nadat u Azure Synapse Analytics hebt ingericht, wordt in dit scenario uitgelegd hoe u het uploaden, verkennen en modelleren van gegevens kunt afhandelen met behulp van gegevens in Azure Synapse Analytics.

Azure Cosmos DB

Azure Cosmos DB is een NoSQL-database in de cloud. Het kan bijvoorbeeld JSON-documenten verwerken en de documenten opslaan en er query's op uitvoeren. In deze voorbeeldstappen ziet u hoe u vanuit de DSVM toegang hebt tot Azure Cosmos DB:

De Python SDK van Azure Cosmos DB is al geïnstalleerd op de DSVM. Als u deze wilt bijwerken, voert u deze uit pip install pydocumentdb --upgrade vanaf een opdrachtprompt.
Maak een Azure Cosmos DB-account en -database vanuit Azure Portal.
Download het Azure Cosmos DB-hulpprogramma voor gegevensmigratie vanuit het Microsoft Downloadcentrum en pak het uit naar een map van uw keuze.
Importeer de JSON-gegevens (vulkaangegevens) die zijn opgeslagen in een openbare blob in Azure Cosmos DB met de volgende opdrachtparameters naar het migratiehulpprogramma. (Gebruik dtui.exe uit de map waarin u het Azure Cosmos DB-hulpprogramma voor gegevensmigratie hebt geïnstalleerd.) Voer de bron- en doellocatie in met deze parameters:

/s:JsonFile /s.Files:https://data.humdata.org/dataset/a60ac839-920d-435a-bf7d-25855602699d/resource/7234d067-2d74-449a-9c61-22ae6d98d928/download/volcano.json /t:DocumentDBBulk /t.ConnectionString:AccountEndpoint=https://[DocDBAccountName].documents.azure.com:443/;AccountKey=[[KEY];Database=volcano /t.Collection:volcano1

Nadat u de gegevens hebt geïmporteerd, kunt u naar Jupyter gaan en het notebook met de titel DocumentDBSample openen. Deze bevat Python-code voor toegang tot Azure Cosmos DB en verwerkt enkele eenvoudige query's. Ga naar de documentatiepagina van de Azure Cosmos DB-service voor meer informatie over Azure Cosmos DB.

Power BI-rapporten en -dashboards gebruiken

U kunt het Volcano JSON-bestand visualiseren dat wordt beschreven in het voorgaande Azure Cosmos DB-voorbeeld in Power BI Desktop, voor visuele inzichten in de gegevens zelf. Dit Power BI-artikel bevat gedetailleerde stappen. Dit zijn de stappen op hoog niveau:

Open Power BI Desktop en selecteer Gegevens ophalen. Geef deze URL op: https://cahandson.blob.core.windows.net/samples/volcano.json.
De JSON-records, geïmporteerd als een lijst, moeten zichtbaar worden. Converteer de lijst naar een tabel, zodat Power BI ermee kan werken.
Selecteer het pictogram Uitvouwen (pijl) om de kolommen uit te vouwen.
De locatie is een recordveld . Vouw de record uit en selecteer alleen de coördinaten. Coördinaat is een lijstkolom.
Voeg een nieuwe kolom toe om de lijstcoördinaatkolom te converteren naar een door komma's gescheiden LatLong-kolom . Gebruik de formule Text.From([coordinates]{1})&","&Text.From([coordinates]{0}) om de twee elementen in het coördinaatlijstveld samen te voegen.
Converteer de kolom Hoogte naar decimaal en selecteer de knoppen Sluiten en Toepassen .

U kunt de volgende code gebruiken als alternatief voor de voorgaande stappen. Het script schrijft de stappen uit die in de Geavanceerde editor in Power BI worden gebruikt om de gegevenstransformaties in een querytaal te schrijven:

let
    Source = Json.Document(Web.Contents("https://cahandson.blob.core.windows.net/samples/volcano.json")),
    #"Converted to Table" = Table.FromList(Source, Splitter.SplitByNothing(), null, null, ExtraValues.Error),
    #"Expanded Column1" = Table.ExpandRecordColumn(#"Converted to Table", "Column1", {"Volcano Name", "Country", "Region", "Location", "Elevation", "Type", "Status", "Last Known Eruption", "id"}, {"Volcano Name", "Country", "Region", "Location", "Elevation", "Type", "Status", "Last Known Eruption", "id"}),
    #"Expanded Location" = Table.ExpandRecordColumn(#"Expanded Column1", "Location", {"coordinates"}, {"coordinates"}),
    #"Added Custom" = Table.AddColumn(#"Expanded Location", "LatLong", each Text.From([coordinates]{1})&","&Text.From([coordinates]{0})),
    #"Changed Type" = Table.TransformColumnTypes(#"Added Custom",{{"Elevation", type number}})
in
    #"Changed Type"

U hebt nu de gegevens in uw Power BI-gegevensmodel. Uw Power BI Desktop-exemplaar moet er als volgt uitzien:

U kunt beginnen met het bouwen van rapporten en visualisaties met het gegevensmodel. In dit Power BI-artikel wordt uitgelegd hoe u een rapport maakt.

De DSVM dynamisch schalen

U kunt de DSVM omhoog en omlaag schalen om te voldoen aan de behoeften van uw project. Als u de VIRTUELE machine niet 's avonds of in het weekend hoeft te gebruiken, kunt u de VIRTUELE machine afsluiten vanuit Azure Portal.

Notitie

Er worden rekenkosten in rekening gebracht als u alleen de afsluitknop voor het besturingssysteem op de VIRTUELE machine gebruikt. In plaats daarvan moet u de toewijzing van uw DSVM ongedaan maken met behulp van Azure Portal of Cloud Shell.

Voor een grootschalig analyseproject hebt u mogelijk meer CPU-, geheugen- of schijfcapaciteit nodig. Als dit het geval is, kunt u VM's met verschillende aantallen CPU-kernen, geheugencapaciteit, schijftypen (inclusief ssd-stations) en GPU-exemplaren vinden voor deep learning die voldoen aan uw reken- en budgetbehoeften. Op de pagina met prijzen voor Azure Virtual Machines ziet u de volledige lijst met VM's, samen met de rekenprijzen per uur.

Meer hulpprogramma's toevoegen

De DSVM biedt vooraf gedefinieerde hulpprogramma's die kunnen voldoen aan veel algemene behoeften voor gegevensanalyse. Ze besparen tijd omdat u uw omgevingen niet afzonderlijk hoeft te installeren en te configureren. Ze besparen u ook geld, omdat u alleen betaalt voor resources die u gebruikt.

U kunt andere Azure-gegevens- en analyseservices gebruiken die in dit artikel zijn geprofileerd om uw analyseomgeving te verbeteren. In sommige gevallen hebt u mogelijk andere hulpprogramma's nodig, waaronder specifieke eigen partnerhulpprogramma's. U hebt volledige beheerderstoegang op de virtuele machine om de hulpprogramma's te installeren die u nodig hebt. U kunt ook andere pakketten installeren in Python en R die niet vooraf zijn geïnstalleerd. Voor Python kunt u dit gebruiken conda of pip. Voor R kunt u in de R-console gebruiken of de IDE gebruiken install.packages() en Pakketten>installeren selecteren.

Deep Learning

Naast de op frameworks gebaseerde voorbeelden kunt u een set uitgebreide overzichten krijgen die zijn gevalideerd op de DSVM. Met deze scenario's kunt u snel aan de slag met de ontwikkeling van deep learning-toepassingen in afbeeldings- en tekst-/taalanalysedomeinen.

Neurale netwerken uitvoeren in verschillende frameworks: in dit scenario ziet u hoe u code van het ene framework naar het andere migreert. Ook ziet u hoe u modellen en runtimeprestaties vergelijkt tussen frameworks.
Een handleiding voor het bouwen van een end-to-end oplossing voor het detecteren van producten in afbeeldingen: Met de techniek voor afbeeldingsdetectie kunnen objecten in afbeeldingen worden gevonden en geclassificeerd. Deze technologie heeft het potentieel om enorme beloningen te bieden in veel echte zakelijke domeinen. Retailers kunnen deze techniek bijvoorbeeld gebruiken om een product te identificeren dat een klant heeft opgehaald uit de plank. Deze informatie helpt winkels bij het beheren van productvoorraad.
Deep Learning voor audio: deze zelfstudie laat zien hoe u een deep learning-model traint voor audiogebeurtenisdetectie op de gegevensset met stedelijke geluiden. Het biedt ook een overzicht van het werken met audiogegevens.
Classificatie van tekstdocumenten: In dit scenario ziet u hoe u twee neurale netwerkarchitecturen bouwt en traint: Hierarchical Attention Network en LSTM -netwerk (Long Short Term Memory). Deze neurale netwerken gebruiken de Keras-API voor deep learning om tekstdocumenten te classificeren.

Samenvatting

In dit artikel worden enkele van de dingen beschreven die u kunt doen op de virtuele machine van Microsoft Datawetenschap. Er zijn nog veel meer dingen die u kunt doen om de DSVM een effectieve analyseomgeving te maken.

Delen via

Gegevenswetenschap met een virtuele Windows-Datawetenschap-machine

Vereisten

Jupyter-notebooks gebruiken

Gegevens verkennen en modellen ontwikkelen met Microsoft Machine Learning Server

Azure-resources beheren

Opslag uitbreiden met behulp van gedeelde bestandssystemen

Toegang tot Azure-gegevens- en analyseservices

Azure Blob Storage

Vereisten

Gegevens verplaatsen van een VIRTUELE machine naar een Azure-blob: AzCopy

Gegevens verplaatsen van een VIRTUELE machine naar een Azure-blob: Azure Storage Explorer

Gegevens lezen uit een Azure-blob: Python ODBC

Azure Synapse Analytics en databases

Azure Cosmos DB

Power BI-rapporten en -dashboards gebruiken

De DSVM dynamisch schalen

Meer hulpprogramma's toevoegen

Deep Learning

Samenvatting

Feedback

Aanvullende resources

Delen via

Gegevenswetenschap met een virtuele Windows-Datawetenschap-machine

Vereisten

Jupyter-notebooks gebruiken

Gegevens verkennen en modellen ontwikkelen met Microsoft Machine Learning Server

Azure-resources beheren

Opslag uitbreiden met behulp van gedeelde bestandssystemen

Code delen in GitHub

Toegang tot Azure-gegevens- en analyseservices

Azure Blob Storage

Vereisten

Gegevens verplaatsen van een VIRTUELE machine naar een Azure-blob: AzCopy

Gegevens verplaatsen van een VIRTUELE machine naar een Azure-blob: Azure Storage Explorer

Gegevens lezen uit een Azure-blob: Python ODBC

Azure Synapse Analytics en databases

Azure Cosmos DB

Power BI-rapporten en -dashboards gebruiken

De DSVM dynamisch schalen

Meer hulpprogramma's toevoegen

Deep Learning

Samenvatting

Feedback

Aanvullende resources