Dela via


Felsöka VM-distribution i Azure Stack Edge Pro GPU

GÄLLER FÖR: Ja för Pro GPU SKUAzure Stack Edge Pro – GPUJa för Pro 2 SKUAzure Stack Edge Pro 2Ja för Pro R SKUAzure Stack Edge Pro RJa för Mini R SKUAzure Stack Edge Mini R

Den här artikeln beskriver hur du felsöker vanliga fel när du distribuerar virtuella datorer på en Azure Stack Edge Pro GPU-enhet. Artikeln innehåller vägledning för att undersöka de vanligaste problemen som orsakar tidsgränser för vm-etablering och problem när nätverksgränssnittet och den virtuella datorn skapas.

Om du vill diagnostisera eventuella vm-etableringsfel granskar du gästloggarna för den misslyckade virtuella datorn. Anvisningar för hur du samlar in vm-gästloggar och inkluderar dem i ett supportpaket finns i Samla in gästloggar för virtuella datorer på Azure Stack Edge Pro.

Vägledning om problem som förhindrar lyckad uppladdning av en virtuell datoravbildning före distributionen av den virtuella datorn finns i Felsöka uppladdningar av virtuella datorer i Azure Stack Edge Pro GPU.

Tidsgräns för etablering av virtuella datorer

Det här avsnittet innehåller felsökning för de vanligaste orsakerna till tidsgränsen för etablering av virtuella datorer.

När tidsgränsen för VM-etablering överskrids visas följande fel:

Skärmbild av felet som visas i Azure Portal när tidsgränsen för VM-etablering uppnås i Azure Stack Edge.

Följande problem är de främsta orsakerna till tidsgränser för vm-etablering:

  • IP-adressen som du har tilldelat den virtuella datorn används redan. Läs mer
  • Den vm-avbildning som du använde för att distribuera den virtuella datorn var inte korrekt förberedd. Läs mer
  • Det gick inte att nå standardgatewayen och DNS-servern från den virtuella gästdatorn. Läs mer
  • Under en cloud init installation cloud init kördes inte eller så uppstod det problem när den kördes. (Endast virtuella Linux-datorer) Lära sig mer
  • För en virtuell Linux-dator som distribueras med en anpassad VM-avbildning är etableringsflaggor i filen /etc/waagent.conf inte korrekta. (Endast virtuella Linux-datorer) Lära sig mer
  • Primärt nätverksgränssnitt kopplat till en SRIOV-aktiverad virtuell växel Läs mer

IP-adress som tilldelats den virtuella datorn används redan

Felbeskrivning: Den virtuella datorn tilldelades en statisk IP-adress som redan används och det gick inte att etablera den virtuella datorn. Det här felet inträffar när IP-adressen används i undernätet där den virtuella datorn distribueras. När du distribuerar en virtuell dator via Azure Portal söker processen efter en befintlig IP-adress på enheten, men kan inte kontrollera IP-adresserna för andra tjänster eller virtuella datorer som också kan finnas i undernätet.

Föreslagen lösning: Använd en statisk IP-adress som inte används eller använd en dynamisk IP-adress som tillhandahålls av DHCP-servern.

Så här söker du efter en duplicerad IP-adress:

  • Kör följande ping kommandon och Test-NetConnection-kommandon (tnc) från alla installationer i samma nätverk:

    ping <IP address>
    tnc <IP address>
    tnc <IP address> -CommonTCPPort “RDP”
    

Om du får ett svar används redan den IP-adress som du har tilldelat till den nya virtuella datorn.

VM-avbildningen är inte korrekt förberedd

Felbeskrivning: Om du vill förbereda en VM-avbildning för användning på en Azure Stack Edge Pro GPU-enhet måste du följa ett specifikt arbetsflöde. Du måste skapa en virtuell gen1-dator i Azure, anpassa den virtuella datorn, generalisera den virtuella hårddisken och sedan ladda ned den virtuella hårddisken för den virtuella datorn. Den förberedda avbildningen måste vara en VHD för gen1 med filnamnstillägget "vhd" och den fasta typen.

En översikt över kraven finns i Skapa anpassade VM-avbildningar för en Azure Stack Edge Pro GPU-enhet. Vägledning om hur du löser problem med vm-avbildningar finns i Felsöka uppladdningar av virtuella datorer i Azure Stack Edge Pro GPU.

Föreslagen lösning: Slutför arbetsflödet för att förbereda vm-avbildningen. Vägledning finns i någon av följande artiklar:

Gateway, DNS-servern kunde inte nås från den virtuella gästdatorn

Felbeskrivning: Om standardgatewayen och DNS-servern inte kan nås under distributionen av virtuella datorer överskrider etableringen av virtuella datorer tidsgränsen och distributionen av den virtuella datorn misslyckas.

Föreslagen lösning: Kontrollera att standardgatewayen och DNS-servern kan nås från den virtuella datorn. Upprepa sedan distributionen av den virtuella datorn.

Gör följande för att kontrollera att standardgatewayen och DNS-servern kan nås från den virtuella datorn:

  1. Anslut till den virtuella datorn.

  2. Kör följande kommandon:

    ping <default gateway IP address>
    ping <DNS server IP address>
    

    Om du vill ta reda på IP-adresserna för standardgatewayen och DNS-servrarna går du till det lokala användargränssnittet för enheten. Välj den port som du är intresserad av och visa nätverksinställningarna.

    Skärmbild av sidan Nätverk för en Azure Stack Edge-enhet med Nätverksinställningar för port 2.

cloud init problem (virtuella Linux-datorer)

Felbeskrivning: cloud init kördes inte, eller så uppstod det problem när cloud init det kördes. cloud-init används för att anpassa en virtuell Linux-dator när den virtuella datorn startas för första gången. Mer information finns i stöd för cloud-init för virtuella datorer i Azure.

Föreslagna lösningar: Så här hittar du problem som uppstod när cloud init den kördes:

  1. Anslut till den virtuella datorn.

  2. cloud init Sök efter fel i följande loggfiler:

    • /var/log/cloud-init-output.log
    • /var/log/cloud-init.log
    • /var/log/waagent/log

Gör så här om du vill söka efter några av de vanligaste problemen som förhindrar cloud init att det körs korrekt:

  1. Kontrollera att vm-avbildningen är baserad på cloud init. Kör följande kommando:

    cloud-init --version

    Kommandot bör returnera cloud init-versionsnumret. Om avbildningen inte cloud initär -baserad returnerar kommandot inte versionsinformation.

    Kör följande kommando för att få hjälp med cloud init alternativ:

    cloud-init --help

  2. Kontrollera att instansen cloud init kan köras med datakällan inställd på Azure.

    När datakällan har angetts till Azure ser posten i molninitloggarna ut ungefär som i följande.

    Bild av en cloud-init-loggpost för en VM-avbildning med datakällan inställd på Azure. Den identifierande texten är markerad.

    Om datakällan inte är inställd på Azure kan du behöva ändra skriptet cloud init . Mer information finns i Dykning djupare in i cloud-init.

Etableringsflaggor har angetts felaktigt (virtuella Linux-datorer)

Felbeskrivning: Om du vill distribuera en virtuell Linux-dator i Azure måste etableringen inaktiveras på avbildningen och etablering med hjälp av cloud init måste vara aktiverat. De etableringsflaggor som anger dessa värden är korrekt konfigurerade för vanliga VM-avbildningar. Om du använder en anpassad VM-avbildning måste du kontrollera att de är korrekta.

Föreslagen lösning: Kontrollera att etableringsflaggor i filen /etc/waagent.conf har följande värden:

Kapacitet Obligatoriskt värde
Aktivera etablering Provisioning.Enabled=n
Förlita dig på cloud-init för att etablera Provisioning.UseCloudInit=y

Primärt nätverksgränssnitt som är kopplat till en SRIOV-aktiverad virtuell växel

Felbeskrivning: Det primära nätverksgränssnittet som är kopplat till en enda rot-I/O-virtualisering (SRIOV) gränssnittsaktiverad virtuell växel orsakade nätverkstrafik att kringgå Hyper-V, så värden kunde inte ta emot DHCP-begäranden från den virtuella datorn, vilket resulterade i en tidsgräns för etablering.

Föreslagna lösningar:

  • Anslut den virtuella datorns primära nätverksgränssnitt till en virtuell växel utan att aktivera accelererat nätverk.

  • På en Azure Stack Edge Pro 1-enhet aktiverar virtuella växlar som skapats på port 1 till port 4 inte accelererat nätverk. På port 5 eller port 6 aktiverar virtuella växlar accelererat nätverk som standard.

  • På en Azure Stack Edge Pro 2-enhet aktiverar virtuella växlar som skapats på port 1 eller port 2 inte accelererat nätverk. På port 3 eller port 4 aktiverar virtuella växlar accelererat nätverk som standard.

Problem med att skapa nätverksgränssnitt

Det här avsnittet innehåller vägledning för problem som gör att skapande av nätverksgränssnitt misslyckas under en vm-distribution.

Tidsgräns för att skapa nätverkskort

Felbeskrivning: Skapandet av nätverksgränssnittet på den virtuella datorn slutfördes inte inom den tillåtna tidsgränsen. Det här felet kan orsakas av DHCP-serverproblem i din miljö.

Gör följande för att kontrollera om nätverksgränssnittet har skapats:

  1. I Azure Portal går du till Azure Stack Edge-resursen för din enhet (gå till Virtuella Edge Services-datorer>). Välj sedan Distributioner och gå till distributionen av den virtuella datorn.

  2. Om ett nätverksgränssnitt inte har skapats visas följande fel.

    Skärmbild av felet som visas i Azure Portal när det inte går att skapa nätverksgränssnittet under distributionen av den virtuella datorn på en Azure Stack Edge-enhet.

Föreslagen lösning: Skapa den virtuella datorn igen och tilldela den en statisk IP-adress.

Problem med att skapa virtuella datorer

Det här avsnittet beskriver vanliga problem som uppstår när den virtuella datorn skapas.

Det går inte att skapa en virtuell dator

Felbeskrivning: Om du har skapat en Marketplace-avbildning med Azure Stack Edge tidigare än 2403 och sedan skapar en virtuell dator från den befintliga Marketplace-avbildningen misslyckas skapandet av den virtuella datorn eftersom Azure Stack Edge 2407 ändrade nedladdningssökvägen för Marketplace-avbildningen.

Föreslagen lösning: Använd följande steg för att ta bort den befintliga Marketplace-avbildningen och skapa sedan en ny Marketplace-avbildning från Azure Portal.

  1. Ta bort den befintliga Marketplace-avbildningen från Azure Portal.

    1. Visa en lista över inmatnings- och BlobDownload-inmatningsjobbet för Marketplace-avbildningen. Använd de här stegen för att ansluta till Azure Resource Manager.

      Kör följande skript för att lista inmatningsjobb:

      Ange prenumerations-ID:t i följande URI:

      $uri 1 = "https://management.appliance namn. DNS-domän/prenumerationer/sid/providers/Microsoft.AzureBridge/locations/DBELocal/ingestionJobs/?api-version=2022-03-01"

      Function Get-AzCachedAccessToken() 
      {
      $ErrorActionPreference = 'Stop' 
      $azureRmProfile = [Microsoft.Azure.Commands.Common.Authentication.Abstractions.AzureRmProfileProvider]::Instance.Profile 
      $currentAzureContext = Get-AzContext 
      $profileClient = New-Object Microsoft.Azure.Commands.ResourceManager.Common.RMProfileClient($azureRmProfile) 
      Write-Debug ("Getting access token for tenant" + $currentAzureContext.Subscription.TenantId) 
      $token = $profileClient.AcquireAccessToken($currentAzureContext.Subscription.TenantId) 
      $token.AccessToken 
      } 
      
      $token = Get-AzCachedAccessToken 
      $headers = @{Authorization = "Bearer $token"; "Content-Type" = "application/json" } 
      $v = Invoke-RestMethod -Method Get -Uri $uri1 -Headers $headers 
      v.value
      
    2. Leta reda på namnet på inmatningsjobbet = Marketplace image sku name och kind = BlobDownload.

      Exempel: inmatningsjobbnamn = Ubuntu-18-04 och typ = BlobDownload.

      Skärmbild av exempelsyntax för att hitta inmatningsjobbets namn.

  2. Om inmatningsjobbet hittas i steg 1 använder du följande steg för att ta bort inmatningsjobbet och ta bort avbildningen. Till exempel är ubuntu-18-04inmatningsjobbnamnet i exemplet ovan . Dessutom Subscription ID hittar du Resource group namnet i exemplet.

    $uri2 = "https://management.<appliance name>.<DNS domain>/subscriptions/sid/resourceGroups/rgname/providers/Microsoft.AzureBridge/locations/dbelocal/ingestionJobs/<ingestion job name>?api-version=2018-06-01" 
    
    Invoke-RestMethod -Method DELETE -Uri $uri2 -Headers $headers
    
  3. Följ stegen för att skapa en ny VM-avbildning från Azure Marketplace.

Det finns inte tillräckligt med minne för att skapa den virtuella datorn

Felbeskrivning: När det inte går att skapa en virtuell dator på grund av otillräckligt minne visas följande fel.

Skärmbild av felet som visas i Azure Portal när det inte går att skapa en virtuell dator på en Azure Stack Edge-enhet.

Föreslagen lösning: Kontrollera det tillgängliga minnet på enheten och välj vm-storleken i enlighet med detta. Mer information finns i Storlekar på virtuella datorer som stöds på Azure Stack Edge.

Det tillgängliga minnet för distributionen av en virtuell dator begränsas av flera faktorer:

  • Mängden tillgängligt minne på enheten. Mer information finns i beräknings- och minnesspecifikationer i tekniska specifikationer för Azure Stack Edge Pro GPU och tekniska specifikationer för Azure Stack Edge Mini R.

  • Om Kubernetes är aktiverat krävs det beräkningsminne som krävs för Kubernetes och appar i Kubernetes-klustret.

  • Omkostnaderna för varje virtuell dator i Hyper-V.

Föreslagna lösningar:

  • Använd en VM-storlek som kräver mindre minne.
  • Stoppa alla virtuella datorer som inte används från portalen innan du distribuerar den nya virtuella datorn.
  • Ta bort alla virtuella datorer som inte längre används.

Otillräckligt antal GPU:er för att skapa en virtuell GPU-dator

Om du försöker distribuera en virtuell dator på en GPU-enhet som redan har Kubernetes aktiverat är inga GPU:er tillgängliga och VM-etableringen misslyckas med följande fel:

Skärmbild av felet som visas i Azure Portal när det inte går att skapa en virtuell GPU-dator på grund av att det inte finns några tillgängliga GPU:er på en Azure Stack Edge-enhet.

Möjliga orsaker: Om Kubernetes är aktiverat innan den virtuella datorn skapas använder Kubernetes alla tillgängliga GPU:er och du kan inte skapa några virtuella GPU-datorer. Du kan skapa så många virtuella GPU-datorer som antalet tillgängliga GPU:er. Din Azure Stack Edge-enhet kan vara utrustad med 1 eller 2 GPU:er.

Föreslagen lösning: Information om distributionsalternativ för virtuella datorer på en 1-GPU- eller 2-GPU-enhet med Kubernetes konfigurerad finns i GPU VMs och Kubernetes.

Nästa steg