Felsöka VM-distribution i Azure Stack Edge Pro GPU
GÄLLER FÖR: Azure Stack Edge Pro – GPUAzure Stack Edge Pro 2Azure Stack Edge Pro RAzure Stack Edge Mini R
Den här artikeln beskriver hur du felsöker vanliga fel när du distribuerar virtuella datorer på en Azure Stack Edge Pro GPU-enhet. Artikeln innehåller vägledning för att undersöka de vanligaste problemen som orsakar tidsgränser för vm-etablering och problem när nätverksgränssnittet och den virtuella datorn skapas.
Om du vill diagnostisera eventuella vm-etableringsfel granskar du gästloggarna för den misslyckade virtuella datorn. Anvisningar för hur du samlar in vm-gästloggar och inkluderar dem i ett supportpaket finns i Samla in gästloggar för virtuella datorer på Azure Stack Edge Pro.
Vägledning om problem som förhindrar lyckad uppladdning av en virtuell datoravbildning före distributionen av den virtuella datorn finns i Felsöka uppladdningar av virtuella datorer i Azure Stack Edge Pro GPU.
Tidsgräns för etablering av virtuella datorer
Det här avsnittet innehåller felsökning för de vanligaste orsakerna till tidsgränsen för etablering av virtuella datorer.
När tidsgränsen för VM-etablering överskrids visas följande fel:
Följande problem är de främsta orsakerna till tidsgränser för vm-etablering:
- IP-adressen som du har tilldelat den virtuella datorn används redan. Läs mer
- Den vm-avbildning som du använde för att distribuera den virtuella datorn var inte korrekt förberedd. Läs mer
- Det gick inte att nå standardgatewayen och DNS-servern från den virtuella gästdatorn. Läs mer
- Under en
cloud init
installationcloud init
kördes inte eller så uppstod det problem när den kördes. (Endast virtuella Linux-datorer) Lära sig mer - För en virtuell Linux-dator som distribueras med en anpassad VM-avbildning är etableringsflaggor i filen /etc/waagent.conf inte korrekta. (Endast virtuella Linux-datorer) Lära sig mer
- Primärt nätverksgränssnitt kopplat till en SRIOV-aktiverad virtuell växel Läs mer
IP-adress som tilldelats den virtuella datorn används redan
Felbeskrivning: Den virtuella datorn tilldelades en statisk IP-adress som redan används och det gick inte att etablera den virtuella datorn. Det här felet inträffar när IP-adressen används i undernätet där den virtuella datorn distribueras. När du distribuerar en virtuell dator via Azure Portal söker processen efter en befintlig IP-adress på enheten, men kan inte kontrollera IP-adresserna för andra tjänster eller virtuella datorer som också kan finnas i undernätet.
Föreslagen lösning: Använd en statisk IP-adress som inte används eller använd en dynamisk IP-adress som tillhandahålls av DHCP-servern.
Så här söker du efter en duplicerad IP-adress:
Kör följande
ping
kommandon och Test-NetConnection-kommandon (tnc
) från alla installationer i samma nätverk:ping <IP address> tnc <IP address> tnc <IP address> -CommonTCPPort “RDP”
Om du får ett svar används redan den IP-adress som du har tilldelat till den nya virtuella datorn.
VM-avbildningen är inte korrekt förberedd
Felbeskrivning: Om du vill förbereda en VM-avbildning för användning på en Azure Stack Edge Pro GPU-enhet måste du följa ett specifikt arbetsflöde. Du måste skapa en virtuell gen1-dator i Azure, anpassa den virtuella datorn, generalisera den virtuella hårddisken och sedan ladda ned den virtuella hårddisken för den virtuella datorn. Den förberedda avbildningen måste vara en VHD för gen1 med filnamnstillägget "vhd" och den fasta typen.
En översikt över kraven finns i Skapa anpassade VM-avbildningar för en Azure Stack Edge Pro GPU-enhet. Vägledning om hur du löser problem med vm-avbildningar finns i Felsöka uppladdningar av virtuella datorer i Azure Stack Edge Pro GPU.
Föreslagen lösning: Slutför arbetsflödet för att förbereda vm-avbildningen. Vägledning finns i någon av följande artiklar:
- Anpassade arbetsflöden för VM-avbildning för virtuella Windows- och Linux-datorer
- Förbereda en generaliserad avbildning från en virtuell Windows-hårddisk
- Förbereda en generaliserad avbildning med hjälp av en ISO
- Använda en specialiserad avbildning för att distribuera virtuella datorer
Gateway, DNS-servern kunde inte nås från den virtuella gästdatorn
Felbeskrivning: Om standardgatewayen och DNS-servern inte kan nås under distributionen av virtuella datorer överskrider etableringen av virtuella datorer tidsgränsen och distributionen av den virtuella datorn misslyckas.
Föreslagen lösning: Kontrollera att standardgatewayen och DNS-servern kan nås från den virtuella datorn. Upprepa sedan distributionen av den virtuella datorn.
Gör följande för att kontrollera att standardgatewayen och DNS-servern kan nås från den virtuella datorn:
Kör följande kommandon:
ping <default gateway IP address> ping <DNS server IP address>
Om du vill ta reda på IP-adresserna för standardgatewayen och DNS-servrarna går du till det lokala användargränssnittet för enheten. Välj den port som du är intresserad av och visa nätverksinställningarna.
cloud init
problem (virtuella Linux-datorer)
Felbeskrivning: cloud init
kördes inte, eller så uppstod det problem när cloud init
det kördes. cloud-init
används för att anpassa en virtuell Linux-dator när den virtuella datorn startas för första gången. Mer information finns i stöd för cloud-init för virtuella datorer i Azure.
Föreslagna lösningar: Så här hittar du problem som uppstod när cloud init
den kördes:
cloud init
Sök efter fel i följande loggfiler:- /var/log/cloud-init-output.log
- /var/log/cloud-init.log
- /var/log/waagent/log
Gör så här om du vill söka efter några av de vanligaste problemen som förhindrar cloud init
att det körs korrekt:
Kontrollera att vm-avbildningen är baserad på
cloud init
. Kör följande kommando:cloud-init --version
Kommandot bör returnera cloud init-versionsnumret. Om avbildningen inte
cloud init
är -baserad returnerar kommandot inte versionsinformation.Kör följande kommando för att få hjälp med
cloud init
alternativ:cloud-init --help
Kontrollera att instansen
cloud init
kan köras med datakällan inställd på Azure.När datakällan har angetts till Azure ser posten i molninitloggarna ut ungefär som i följande.
Om datakällan inte är inställd på Azure kan du behöva ändra skriptet
cloud init
. Mer information finns i Dykning djupare in i cloud-init.
Etableringsflaggor har angetts felaktigt (virtuella Linux-datorer)
Felbeskrivning: Om du vill distribuera en virtuell Linux-dator i Azure måste etableringen inaktiveras på avbildningen och etablering med hjälp av cloud init
måste vara aktiverat. De etableringsflaggor som anger dessa värden är korrekt konfigurerade för vanliga VM-avbildningar. Om du använder en anpassad VM-avbildning måste du kontrollera att de är korrekta.
Föreslagen lösning: Kontrollera att etableringsflaggor i filen /etc/waagent.conf har följande värden:
Kapacitet | Obligatoriskt värde |
---|---|
Aktivera etablering | Provisioning.Enabled=n |
Förlita dig på cloud-init för att etablera | Provisioning.UseCloudInit=y |
Primärt nätverksgränssnitt som är kopplat till en SRIOV-aktiverad virtuell växel
Felbeskrivning: Det primära nätverksgränssnittet som är kopplat till en enda rot-I/O-virtualisering (SRIOV) gränssnittsaktiverad virtuell växel orsakade nätverkstrafik att kringgå Hyper-V, så värden kunde inte ta emot DHCP-begäranden från den virtuella datorn, vilket resulterade i en tidsgräns för etablering.
Föreslagna lösningar:
Anslut den virtuella datorns primära nätverksgränssnitt till en virtuell växel utan att aktivera accelererat nätverk.
På en Azure Stack Edge Pro 1-enhet aktiverar virtuella växlar som skapats på port 1 till port 4 inte accelererat nätverk. På port 5 eller port 6 aktiverar virtuella växlar accelererat nätverk som standard.
På en Azure Stack Edge Pro 2-enhet aktiverar virtuella växlar som skapats på port 1 eller port 2 inte accelererat nätverk. På port 3 eller port 4 aktiverar virtuella växlar accelererat nätverk som standard.
Problem med att skapa nätverksgränssnitt
Det här avsnittet innehåller vägledning för problem som gör att skapande av nätverksgränssnitt misslyckas under en vm-distribution.
Tidsgräns för att skapa nätverkskort
Felbeskrivning: Skapandet av nätverksgränssnittet på den virtuella datorn slutfördes inte inom den tillåtna tidsgränsen. Det här felet kan orsakas av DHCP-serverproblem i din miljö.
Gör följande för att kontrollera om nätverksgränssnittet har skapats:
I Azure Portal går du till Azure Stack Edge-resursen för din enhet (gå till Virtuella Edge Services-datorer>). Välj sedan Distributioner och gå till distributionen av den virtuella datorn.
Om ett nätverksgränssnitt inte har skapats visas följande fel.
Föreslagen lösning: Skapa den virtuella datorn igen och tilldela den en statisk IP-adress.
Problem med att skapa virtuella datorer
Det här avsnittet beskriver vanliga problem som uppstår när den virtuella datorn skapas.
Det går inte att skapa en virtuell dator
Felbeskrivning: Om du har skapat en Marketplace-avbildning med Azure Stack Edge tidigare än 2403 och sedan skapar en virtuell dator från den befintliga Marketplace-avbildningen misslyckas skapandet av den virtuella datorn eftersom Azure Stack Edge 2407 ändrade nedladdningssökvägen för Marketplace-avbildningen.
Föreslagen lösning: Använd följande steg för att ta bort den befintliga Marketplace-avbildningen och skapa sedan en ny Marketplace-avbildning från Azure Portal.
Ta bort den befintliga Marketplace-avbildningen från Azure Portal.
Visa en lista över inmatnings- och BlobDownload-inmatningsjobbet för Marketplace-avbildningen. Använd de här stegen för att ansluta till Azure Resource Manager.
Kör följande skript för att lista inmatningsjobb:
Ange prenumerations-ID:t i följande URI:
$uri 1 = "https://management.appliance namn. DNS-domän/prenumerationer/sid/providers/Microsoft.AzureBridge/locations/DBELocal/ingestionJobs/?api-version=2022-03-01"
Function Get-AzCachedAccessToken() { $ErrorActionPreference = 'Stop' $azureRmProfile = [Microsoft.Azure.Commands.Common.Authentication.Abstractions.AzureRmProfileProvider]::Instance.Profile $currentAzureContext = Get-AzContext $profileClient = New-Object Microsoft.Azure.Commands.ResourceManager.Common.RMProfileClient($azureRmProfile) Write-Debug ("Getting access token for tenant" + $currentAzureContext.Subscription.TenantId) $token = $profileClient.AcquireAccessToken($currentAzureContext.Subscription.TenantId) $token.AccessToken } $token = Get-AzCachedAccessToken $headers = @{Authorization = "Bearer $token"; "Content-Type" = "application/json" } $v = Invoke-RestMethod -Method Get -Uri $uri1 -Headers $headers v.value
Leta reda på namnet på inmatningsjobbet =
Marketplace image sku name
och kind =BlobDownload
.Exempel: inmatningsjobbnamn =
Ubuntu-18-04
och typ =BlobDownload
.
Om inmatningsjobbet hittas i steg 1 använder du följande steg för att ta bort inmatningsjobbet och ta bort avbildningen. Till exempel är
ubuntu-18-04
inmatningsjobbnamnet i exemplet ovan . DessutomSubscription ID
hittar duResource group
namnet i exemplet.$uri2 = "https://management.<appliance name>.<DNS domain>/subscriptions/sid/resourceGroups/rgname/providers/Microsoft.AzureBridge/locations/dbelocal/ingestionJobs/<ingestion job name>?api-version=2018-06-01"
Invoke-RestMethod -Method DELETE -Uri $uri2 -Headers $headers
Följ stegen för att skapa en ny VM-avbildning från Azure Marketplace.
Det finns inte tillräckligt med minne för att skapa den virtuella datorn
Felbeskrivning: När det inte går att skapa en virtuell dator på grund av otillräckligt minne visas följande fel.
Föreslagen lösning: Kontrollera det tillgängliga minnet på enheten och välj vm-storleken i enlighet med detta. Mer information finns i Storlekar på virtuella datorer som stöds på Azure Stack Edge.
Det tillgängliga minnet för distributionen av en virtuell dator begränsas av flera faktorer:
Mängden tillgängligt minne på enheten. Mer information finns i beräknings- och minnesspecifikationer i tekniska specifikationer för Azure Stack Edge Pro GPU och tekniska specifikationer för Azure Stack Edge Mini R.
Om Kubernetes är aktiverat krävs det beräkningsminne som krävs för Kubernetes och appar i Kubernetes-klustret.
Omkostnaderna för varje virtuell dator i Hyper-V.
Föreslagna lösningar:
- Använd en VM-storlek som kräver mindre minne.
- Stoppa alla virtuella datorer som inte används från portalen innan du distribuerar den nya virtuella datorn.
- Ta bort alla virtuella datorer som inte längre används.
Otillräckligt antal GPU:er för att skapa en virtuell GPU-dator
Om du försöker distribuera en virtuell dator på en GPU-enhet som redan har Kubernetes aktiverat är inga GPU:er tillgängliga och VM-etableringen misslyckas med följande fel:
Möjliga orsaker: Om Kubernetes är aktiverat innan den virtuella datorn skapas använder Kubernetes alla tillgängliga GPU:er och du kan inte skapa några virtuella GPU-datorer. Du kan skapa så många virtuella GPU-datorer som antalet tillgängliga GPU:er. Din Azure Stack Edge-enhet kan vara utrustad med 1 eller 2 GPU:er.
Föreslagen lösning: Information om distributionsalternativ för virtuella datorer på en 1-GPU- eller 2-GPU-enhet med Kubernetes konfigurerad finns i GPU VMs och Kubernetes.