Sdílet prostřednictvím


Řešení potíží s nasazením virtuálního počítače ve službě Azure Stack Edge Pro GPU

PLATÍ PRO:Ano pro skladovou položku Pro GPU Azure Stack Edge Pro – GPUAno pro skladovou položku Pro 2Azure Stack Edge Pro 2Ano pro skladovou položku Pro RAzure Stack Edge Pro RAno pro SKU Mini RAzure Stack Edge Mini R

Tento článek popisuje, jak řešit běžné chyby při nasazování virtuálních počítačů na zařízení AZURE Stack Edge Pro GPU. Tento článek obsahuje pokyny pro zkoumání nejběžnějších problémů, které způsobují vypršení časových limitů zřizování virtuálních počítačů a problémů při vytváření síťového rozhraní a virtuálního počítače.

Pokud chcete diagnostikovat případné selhání zřizování virtuálních počítačů, projděte si protokoly hosta pro virtuální počítač, který selhal. Postup shromažďování protokolů hosta virtuálního počítače a jejich zahrnutí do balíčku podpory najdete v tématu Shromažďování protokolů hosta pro virtuální počítače ve službě Azure Stack Edge Pro.

Pokyny k problémům, které brání úspěšnému nahrání image virtuálního počítače před nasazením virtuálního počítače, najdete v tématu Řešení potíží s nahráváním imagí virtuálních počítačů ve službě Azure Stack Edge Pro GPU.

Časový limit zřizování virtuálních počítačů

Tato část obsahuje řešení potíží s nejčastějšími příčinami vypršení časového limitu zřizování virtuálního počítače.

Při vypršení časového limitu zřizování virtuálního počítače se zobrazí následující chyba:

Snímek obrazovky s chybou zobrazenou na webu Azure Portal při vypršení časového limitu zřizování virtuálního počítače ve službě Azure Stack Edge

Hlavní příčiny vypršení časových limitů zřizování virtuálních počítačů jsou následující problémy:

  • IP adresa, kterou jste přiřadili virtuálnímu počítači, se už používá. Další informace
  • Image virtuálního počítače, kterou jste použili k nasazení virtuálního počítače, nebyla správně připravená. Další informace
  • Z virtuálního počítače hosta se nepodařilo získat výchozí bránu a server DNS. Další informace
  • cloud init Během instalace se buď nespustí, cloud init nebo během jeho spuštění došlo k problémům. (pouze virtuální počítače s Linuxem) Víc se uč
  • U virtuálního počítače s Linuxem nasazeného pomocí vlastní image virtuálního počítače nejsou příznaky zřizování v souboru /etc/waagent.conf správné. (pouze virtuální počítače s Linuxem) Víc se uč
  • Další informace o primárním síťovém rozhraní připojeném k virtuálnímu přepínači s podporou SRIOV

IP adresa přiřazená virtuálnímu počítači se už používá

Popis chyby: Virtuálnímu počítači se přiřadila statická IP adresa, která se už používá, a zřizování virtuálního počítače se nezdařilo. K této chybě dochází v případě, že se IP adresa používá v podsíti, na které je virtuální počítač nasazený. Když nasadíte virtuální počítač přes Azure Portal, proces zkontroluje existující IP adresu ve vašem zařízení, ale nemůže zkontrolovat IP adresy jiných služeb nebo virtuálních počítačů, které můžou být také ve vaší podsíti.

Navrhované řešení: Použijte statickou IP adresu, která se nepoužívá, nebo použijte dynamickou IP adresu poskytnutou serverem DHCP.

Kontrola duplicitní IP adresy:

  • Z libovolného zařízení ve stejné síti spusťte následující ping příkazy a příkazy Test-NetConnection (tnc):

    ping <IP address>
    tnc <IP address>
    tnc <IP address> -CommonTCPPort “RDP”
    

Pokud obdržíte odpověď, IP adresa, kterou jste přiřadili novému virtuálnímu počítači, se už používá.

Image virtuálního počítače není správně připravená

Popis chyby: Pokud chcete připravit image virtuálního počítače pro použití na zařízení AZURE Stack Edge Pro GPU, musíte postupovat podle konkrétního pracovního postupu. V Azure musíte vytvořit virtuální počítač Gen1, přizpůsobit virtuální počítač, generalizovat virtuální pevný disk a pak stáhnout virtuální pevný disk s operačním systémem pro tento virtuální počítač. Připravená image musí být virtuální pevný disk Gen1 s příponou názvu souboru "vhd" a pevným typem.

Přehled požadavků najdete v tématu Vytvoření vlastních imagí virtuálních počítačů pro zařízení Azure Stack Edge Pro GPU. Pokyny k řešení problémů s imagí virtuálních počítačů najdete v tématu Řešení potíží s nahráváním imagí virtuálních počítačů ve službě Azure Stack Edge Pro GPU.

Navrhované řešení: Dokončete pracovní postup pro přípravu image virtuálního počítače. Pokyny najdete v jednom z následujících článků:

Bránu, server DNS se nepodařilo získat přístup z virtuálního počítače hosta

Popis chyby: Pokud během nasazování virtuálního počítače není možné dosáhnout výchozí brány a serveru DNS, vyprší časový limit zřizování virtuálního počítače a nasazení virtuálního počítače selže.

Navrhované řešení: Ověřte, že z virtuálního počítače je dostupná výchozí brána a server DNS. Potom zopakujte nasazení virtuálního počítače.

Pokud chcete ověřit, že je z virtuálního počítače dostupná výchozí brána a server DNS, postupujte takto:

  1. Připojte se k virtuálnímu počítači.

  2. Spusťte následující příkazy:

    ping <default gateway IP address>
    ping <DNS server IP address>
    

    Pokud chcete zjistit IP adresy výchozí brány a serverů DNS, přejděte do místního uživatelského rozhraní vašeho zařízení. Vyberte port, který vás zajímá, a zobrazte nastavení sítě.

    Snímek obrazovky se stránkou Síť pro zařízení Azure Stack Edge se zobrazeným nastavením sítě pro port 2

cloud init problémy (virtuální počítače s Linuxem)

Popis chyby: cloud init nespustí se nebo při běhu došlo k problémům cloud init . cloud-init slouží k přizpůsobení virtuálního počítače s Linuxem při prvním spuštění virtuálního počítače. Další informace najdete v tématu podpora cloud-init pro virtuální počítače v Azure.

Navrhovaná řešení: Vyhledání problémů, ke kterým došlo při cloud init spuštění:

  1. Připojte se k virtuálnímu počítači.

  2. Zkontrolujte cloud init chyby v následujících souborech protokolu:

    • /var/log/cloud-init-output.log
    • /var/log/cloud-init.log
    • /var/log/waagent/log

Pokud chcete zkontrolovat některé z nejběžnějších problémů, které brání cloud init úspěšnému spuštění, postupujte takto:

  1. Ujistěte se, že je image virtuálního počítače založená na cloud init. Spusťte následující příkaz:

    cloud-init --version

    Příkaz by měl vrátit číslo verze inicializačního cloudu. Pokud image není cloud initzaložená, příkaz nevrátí informace o verzi.

    Nápovědu k možnostem cloud init získáte spuštěním následujícího příkazu:

    cloud-init --help

  2. Ujistěte se, cloud init že instance může úspěšně běžet se zdrojem dat nastaveným na Azure.

    Když je zdroj dat nastavený na Azure, položka v protokolech inicializačních dat v cloudu vypadá podobně jako v následujícím příkladu.

    Obrázek položky protokolu cloud-init pro image virtuálního počítače se zdrojem dat nastaveným na Azure Identifikační text je zvýrazněný.

    Pokud zdroj dat není nastavený na Azure, možná budete muset skript zrevidovat cloud init . Další informace najdete v tématu Podrobnější informace o cloud-init.

Nesprávně nastavené příznaky zřizování (virtuální počítače s Linuxem)

Popis chyby: Pokud chcete úspěšně nasadit virtuální počítač s Linuxem v Azure, musí být zřizování na imagi zakázané a musí být povolené zřizování pomocí cloud init . Příznaky zřizování, které tyto hodnoty nastavují, jsou správně nakonfigurované pro standardní image virtuálních počítačů. Pokud používáte vlastní image virtuálního počítače, musíte se ujistit, že jsou správné.

Navrhované řešení: Ujistěte se, že příznaky zřizování v souboru /etc/waagent.conf mají následující hodnoty:

Schopnost Požadovaná hodnota
Povolení zřizování Provisioning.Enabled=n
Spoléhat se na zřizování cloud-init Provisioning.UseCloudInit=y

Primární síťové rozhraní připojené k virtuálnímu přepínači s podporou SRIOV

Popis chyby: Primární síťové rozhraní připojené k virtuálnímu přepínači s podporou jednoho kořenového V/V virtualizace (SRIOV) způsobilo vynechání síťového provozu hyper-V, takže hostitel nemohl přijímat požadavky DHCP z virtuálního počítače, což vede k vypršení časového limitu zřizování.

Navrhovaná řešení:

  • Připojte primární síťové rozhraní virtuálního počítače k virtuálnímu přepínači bez povolení akcelerovaných síťových služeb.

  • Na zařízení Azure Stack Edge Pro 1 virtuální přepínače vytvořené na portu 1 na port 4 neumožňují akcelerované síťové služby. Na portu 5 nebo Portu 6 virtuální přepínače ve výchozím nastavení umožňují akcelerované síťové služby.

  • Na zařízení Azure Stack Edge Pro 2 virtuální přepínače vytvořené na portu 1 nebo portu 2 neumožňují akcelerované síťové služby. Na portu 3 nebo Portu 4 virtuální přepínače ve výchozím nastavení umožňují akcelerované síťové služby.

Problémy s vytvářením síťového rozhraní

Tato část obsahuje pokyny k problémům, které způsobují selhání vytváření síťového rozhraní během nasazování virtuálního počítače.

Vypršení časového limitu vytváření síťových adaptérů

Popis chyby: Vytvoření síťového rozhraní na virtuálním počítači se nedokončilo během povoleného časového limitu. Příčinou tohoto selhání můžou být problémy se serverem DHCP ve vašem prostředí.

Pokud chcete ověřit, jestli se síťové rozhraní úspěšně vytvořilo, postupujte takto:

  1. Na webu Azure Portal přejděte k prostředku Azure Stack Edge pro vaše zařízení (přejděte na virtuální počítače Edge Services>). Pak vyberte Nasazení a přejděte k nasazení virtuálního počítače.

  2. Pokud se síťové rozhraní úspěšně nevytvořilo, zobrazí se následující chyba.

    Snímek obrazovky s chybou zobrazenou na webu Azure Portal při selhání vytvoření síťového rozhraní během nasazování virtuálního počítače na zařízení Azure Stack Edge

Navrhované řešení: Vytvořte virtuální počítač znovu a přiřaďte mu statickou IP adresu.

Problémy s vytvářením virtuálních počítačů

Tato část se zabývá běžnými problémy, ke kterým dochází při vytváření virtuálního počítače.

Selhání vytváření virtuálního počítače

Popis chyby: Pokud máte image Marketplace vytvořená se službou Azure Stack Edge starší než 2403 a pak vytvoříte virtuální počítač z existující image Marketplace, vytvoření virtuálního počítače selže, protože Azure Stack Edge 2407 změnil cestu ke stažení image Marketplace.

Navrhované řešení: Pomocí následujících kroků odstraňte existující image Marketplace a pak na webu Azure Portal vytvořte novou image z Marketplace.

  1. Na webu Azure Portal odstraňte existující image Marketplace.

    1. Vypíše příjem dat a úlohu příjmu dat BlobDownload pro image Marketplace. Pomocí těchto kroků se připojte k Azure Resource Manageru.

      Spuštěním následujícího skriptu vypíšete úlohy příjmu dat:

      V následujícím identifikátoru URI zadejte ID předplatného:

      $uri 1 = "https://management.appliance name. Doména/předplatná DNS/sid/providers/Microsoft.AzureBridge/locations/DBELocal/ingestionJobs/?api-version=2022-03-01"

      Function Get-AzCachedAccessToken() 
      {
      $ErrorActionPreference = 'Stop' 
      $azureRmProfile = [Microsoft.Azure.Commands.Common.Authentication.Abstractions.AzureRmProfileProvider]::Instance.Profile 
      $currentAzureContext = Get-AzContext 
      $profileClient = New-Object Microsoft.Azure.Commands.ResourceManager.Common.RMProfileClient($azureRmProfile) 
      Write-Debug ("Getting access token for tenant" + $currentAzureContext.Subscription.TenantId) 
      $token = $profileClient.AcquireAccessToken($currentAzureContext.Subscription.TenantId) 
      $token.AccessToken 
      } 
      
      $token = Get-AzCachedAccessToken 
      $headers = @{Authorization = "Bearer $token"; "Content-Type" = "application/json" } 
      $v = Invoke-RestMethod -Method Get -Uri $uri1 -Headers $headers 
      v.value
      
    2. Vyhledejte název úlohy příjmu dat = Marketplace image sku name a druh = BlobDownload.

      Příklad: název úlohy příjmu dat = Ubuntu-18-04 a druh = BlobDownload.

      Snímek obrazovky s ukázkou syntaxe pro vyhledání názvu úlohy příjmu dat

  2. Pokud se úloha příjmu dat nachází v kroku 1, pomocí následujícího postupu odstraňte úlohu příjmu dat a image odstraňte. Například název úlohy příjmu dat v příkladu výše je ubuntu-18-04. Subscription ID Resource group V příkladu najdete také název a název.

    $uri2 = "https://management.<appliance name>.<DNS domain>/subscriptions/sid/resourceGroups/rgname/providers/Microsoft.AzureBridge/locations/dbelocal/ingestionJobs/<ingestion job name>?api-version=2018-06-01" 
    
    Invoke-RestMethod -Method DELETE -Uri $uri2 -Headers $headers
    
  3. Podle kroků vytvořte novou image virtuálního počítače z Azure Marketplace.

Nedostatek paměti pro vytvoření virtuálního počítače

Popis chyby: Při selhání vytváření virtuálního počítače kvůli nedostatku paměti se zobrazí následující chyba.

Snímek obrazovky s chybou zobrazenou na webu Azure Portal při selhání vytváření virtuálního počítače na zařízení Azure Stack Edge

Navrhované řešení: Zkontrolujte dostupnou paměť na zařízení a odpovídajícím způsobem zvolte velikost virtuálního počítače. Další informace najdete v tématu Podporované velikosti virtuálních počítačů ve službě Azure Stack Edge.

Paměť dostupná pro nasazení virtuálního počítače je omezená několika faktory:

  • Množství dostupné paměti v zařízení. Další informace najdete v technických specifikacích a technických specifikacích Azure Stack Edge Pro GPU a technických specifikacích Azure Stack Edge Mini R.

  • Pokud je kubernetes povolený, výpočetní paměť požadovaná pro Kubernetes a aplikace v clusteru Kubernetes.

  • Režijní náklady na každý virtuální počítač v Hyper-V

Navrhovaná řešení:

  • Použijte velikost virtuálního počítače, která vyžaduje méně paměti.
  • Před nasazením nového virtuálního počítače zastavte všechny virtuální počítače, které se nepoužívají z portálu.
  • Odstraňte všechny virtuální počítače, které se už nepoužívají.

Nedostatečný počet GPU pro vytvoření virtuálního počítače s GPU

Pokud se pokusíte nasadit virtuální počítač na zařízení s GPU, které už má povolené Kubernetes, nejsou k dispozici žádné gpu a zřizování virtuálních počítačů selže s následující chybou:

Snímek obrazovky s chybou zobrazenou na webu Azure Portal při vytváření virtuálního počítače GPU selže kvůli žádným dostupným grafickým procesorům na zařízení Azure Stack Edge

Možné příčiny: Pokud je Kubernetes povolený před vytvořením virtuálního počítače, Kubernetes použije všechny dostupné GPU a nebudete moct vytvářet žádné virtuální počítače s velikostí GPU. Můžete vytvořit libovolný počet virtuálních počítačů s velikostí GPU jako počet dostupných GPU. Zařízení Azure Stack Edge může být vybaveno 1 nebo 2 GPU.

Navrhované řešení: Možnosti nasazení virtuálních počítačů na zařízení s 1 GPU nebo 2 GPU s nakonfigurovaným Kubernetes najdete v tématu Virtuální počítače GPU a Kubernetes.

Další kroky