Platí pro: AKS v Azure Local, AKS na Windows Serveru Tento článek popisuje známé problémy a chyby, se kterými se můžete setkat při instalaci AKS Arc. Můžete si také projít známé problémy s upgradem AKS Arc a při používání Centra pro správu Windows.
Chyba Selhání čekání na onboarding doplňku
Tato chybová zpráva se zobrazí po spuštění install-AksHci.
Poznámka:
Příčinou této chyby může být povolení služby Private Link v nastavení. V současné době neexistuje žádné alternativní řešení pro tento scénář. AKS v Azure Local nefunguje se službou Private Link.
Pokud službu Private Link nepoužíváte, při řešení tohoto problému postupujte následovně:
- Otevřete PowerShell a spusťte Uninstall-AksHci.
- Otevřete azure Portal a přejděte do skupiny prostředků, kterou jste použili při spuštění
Install-AksHci
. - Zkontrolujte všechny připojené prostředky clusteru, které se zobrazují ve stavu Odpojeno , a uveďte název zobrazený jako náhodně vygenerovaný identifikátor GUID.
- Odstraňte tyto prostředky clusteru.
- Zavřete relaci PowerShellu a před dalším spuštěním
Install-AksHci
otevřete novou relaci.
Chyba: Instalace AksHci selhala, služba vrátila chybu. Status=403 Code="RequestDisallowedByPolicy" při instalaci AKS-Azure Local
Příčinou této chyby může být proces instalace, který se pokouší narušit zásady Azure nastavené v předplatném Azure nebo skupině prostředků poskytnuté během procesu onboardingu Azure Arc. K této chybě může dojít u uživatelů, kteří definovali zásady Azure na úrovni předplatného nebo skupiny prostředků, a pak se pokusí nainstalovat AKS v Azure Local, což porušuje zásady Azure Policy.
Pokud chcete tento problém vyřešit, přečtěte si chybovou zprávu, abyste pochopili, která služba Azure Policy nastavila správce Azure, a pak upravte zásady Azure tak, že provedete výjimku ze zásad Azure. Další informace o výjimkách zásad najdete ve struktuře výjimek služby Azure Policy.
Chyba: Instalace AksHci selhala s chybou – [Objekt již existuje] Při vytváření prostředku IPv4 Address xxx.xx.xx.xx došlo k chybě pro clusterovou roli xx-xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxx.
Dříve nainstalovaná funkce zůstává ve stavu selhání a nevymazala se. Může se zobrazit následující chyba:
Exception [An error occurred while creating resource 'MOC Cloud Agent Service' for the clustered role 'ca-3f72bdeb-xxxx-4ae9-a721-3aa902a998f0'.]
Stacktrace [at Add-FailoverClusterGenericRole, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Common.psm1: line 2987
at Install-CloudAgent, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1310
at Install-MocAgents, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1229
at Initialize-Cloud, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1135
at Install-MocInternal, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1078
at Install-Moc, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 207
at Install-AksHciInternal, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 3867
at Install-AksHci, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 778
at <ScriptBlock>, <No file>: line 1]
InnerException[The object already exists]
Nebo se může zobrazit:
Install-Moc failed.
Exception [Unable to save property changes for 'IPv4 Address xxx.168.18.0'.]
Stacktrace [at Add-FailoverClusterGenericRole, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Common.psm1: line 2971
at Install-CloudAgent, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1310
at Install-MocAgents, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1229
at Initialize-Cloud, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1135
at Install-MocInternal, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1078
at Install-Moc, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 207
at Install-AksHciInternal, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 3867
at Install-AksHci, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 778
at <ScriptBlock>, <No file>: line 1]
InnerException[A matching cluster network for the specified IP address could not be found]
Pokud chcete tento problém vyřešit, ručně vyčistíte roli clusteru. Prostředek můžete odebrat ze správce clusteru s podporou převzetí služeb při selhání spuštěním následující rutiny PowerShellu: Remove-ClusterResource -name <resource name>
.
Chyba: Chyba GetRelease vrácená voláním rozhraní API: Chyba stažení souboru: Neshoda hodnot hash
Rutina Install-AksHci
selže s chybou GetRelease vrácenou voláním rozhraní API: Chyba stažení souboru: Neshoda hodnot hash.
- Otevřete PowerShell a spusťte
Uninstall-AksHci
. - Zkuste instalaci zopakovat.
- Pokud problém přetrvává, před opakováním instalace použijte
-concurrentDownloads
parametr Set-AksHciConfig a nastavte ho na číslo nižší než výchozí 10. Snížení počtu souběžných stahování může pomoci citlivým sítím úspěšně dokončit stahování velkých souborů. Tento parametr je funkce preview.
Po nasazení AKS v Azure Local 21H2 se po restartování uzlů zobrazil stav selhání fakturace.
Po nasazení se při restartování místních uzlů Azure v sestavě AKS zobrazil stav selhání fakturace.
Pokud chcete tento problém vyřešit, postupujte podle pokynů k ruční obměně tokenu a restartujte modul plug-in Služby správy klíčů.
Vypršel časový limit instalace AksHci s chybou ''
Po spuštění nástroje Install-AksHci se instalace zastavila a zobrazila následující chybová zpráva:
\kubectl.exe --kubeconfig=C:\AksHci\0.9.7.3\kubeconfig-clustergroup-management
get akshciclusters -o json returned a non zero exit code 1
[Unable to connect to the server: dial tcp 192.168.0.150:6443:
connectex: A connection attempt failed because the connected party
did not properly respond after a period of time, or established connection
failed because connected host has failed to respond.]
Existuje několik důvodů, proč může instalace selhat s chybou waiting for API server
.
Následující část popisuje možné příčiny a řešení této chyby.
Důvod 1: Nesprávná konfigurace brány PROTOKOLU IP Pokud používáte statické IP adresy a zobrazila se následující chybová zpráva, ověřte správnost konfigurace IP adresy a brány.
Install-AksHci
C:\AksHci\kvactl.exe create --configfile C:\AksHci\yaml\appliance.yaml --outfile C:\AksHci\kubeconfig-clustergroup-management returned a non-zero exit code 1 [ ]
Pokud chcete zkontrolovat, jestli máte správnou konfiguraci pro vaši IP adresu a bránu, spusťte následující příkaz:
ipconfig /all
V zobrazeném nastavení konfigurace potvrďte konfiguraci. Můžete se také pokusit o příkaz ping brány IP a serveru DNS.
ping <DNS server>
Pokud tyto metody nefungují, změňte konfiguraci pomocí rutiny New-AksHciNetworkSetting .
Důvod 2: Nesprávný server DNS Pokud používáte statické IP adresy, ověřte, že je server DNS správně nakonfigurovaný. Pokud chcete zkontrolovat adresu serveru DNS hostitele, použijte následující příkaz:
Get-NetIPConfiguration.DNSServer | ?{ $_.AddressFamily -ne 23} ).ServerAddresses
Spuštěním následujícího příkazu ověřte, že adresa serveru DNS je stejná jako adresa použitá při spuštění New-AksHciNetworkSetting
:
Get-MocConfig
Pokud je server DNS nesprávně nakonfigurovaný, přeinstalujte AKS v Azure Local se správným serverem DNS. Další informace najdete v tématu Restartování, odebrání nebo přeinstalace služby Azure Kubernetes Service v místním prostředí Azure.
Problém se vyřešil po odstranění konfigurace a restartování virtuálního počítače s novou konfigurací.
Chyba: Proces nemůže získat přístup k souboru mocstack.cab, protože ho používá jiný proces.
Install-AksHci
Při této chybě došlo k chybě, protože k němu přistupuje mocstack.cab
jiný proces.
Pokud chcete tento problém vyřešit, zavřete všechna otevřená okna PowerShellu a otevřete nové okno PowerShellu.
Chyba: Instalace AksHci selže s chybou Install-MOC selhala s chybou – proces nemůže získat přístup k souboru \<path> protože ho používá jiný proces.
K souboru nejde získat přístup, protože ho používá jiný proces.
Tento problém můžete vyřešit restartováním relace PowerShellu. Zavřete okno PowerShellu a zkuste nainstalovat AksHci znovu.
Chyba: "Vzdálený hostitel vynutil ukončení existujícího připojení"
Install-AksHci
Při této chybě došlo k chybě, protože rozsahy fondů IP adres uvedené v místní konfiguraci AKS v Azure byly vypnuty 1 v CIDR a může způsobit chybové ukončení CloudAgent. Pokud například máte podsíť 10.0.0.0/21 s rozsahem adres 10.0.0.0–10.0.7.255 a pak použijete počáteční adresu 10.0.0.1 nebo koncovou adresu 10.0.7.254, způsobí to selhání cloudového agenta.
Chcete-li tento problém vyřešit, spusťte New-AksHciNetworkSetting a použijte jakýkoli jiný platný rozsah IP adres pro váš fond VIP a fond uzlů Kubernetes. Ujistěte se, že hodnoty, které používáte, nejsou na začátku nebo na konci rozsahu adres vypnuté o 1.
Instalace AksHci selhala v instalaci s více uzly s chybou Uzly nedosáhly aktivního stavu.
Při spuštění instalace Install-AksHci na jednom uzlu instalace fungovala instalace, ale při nastavování clusteru s podporou převzetí služeb při selhání instalace selže s chybovou zprávou. Příkaz ping u cloudového agenta ale ukázal, že CloudAgent je dostupný.
Pokud chcete zajistit, aby všechny uzly přeložily DNS agenta CloudAgent, spusťte na každém uzlu následující příkaz:
Resolve-DnsName <FQDN of cloudagent>
Pokud výše uvedený krok proběhne úspěšně na uzlech, ujistěte se, že se uzly dostanou k portu CloudAgent a ověřte, že se proxy server nepokouší blokovat toto připojení a port je otevřený. Uděláte to tak, že na každém uzlu spustíte následující příkaz:
Test-NetConnection <FQDN of cloudagent> -Port <Cloudagent port - default 65000>
Balíček AKS pro místní stahování Azure selže s chybou msft.sme.aks, která se nepodařilo načíst.
Tato chyba vychází z chyby při stahování.
Pokud se zobrazí tato chyba, měli byste použít nejnovější verzi Microsoft Edge nebo Google Chrome a zkusit to znovu.
Při spuštění set-AksHciRegistration se zobrazí chyba Nejde zkontrolovat zaregistrované poskytovatele prostředků.
Tato chyba se zobrazí po spuštění set-AksHciRegistration v AKS v místní instalaci Azure. Tato chyba značí, že poskytovatelé prostředků Kubernetes nejsou zaregistrovaní pro tenanta, který je aktuálně přihlášený.
Pokud chcete tento problém vyřešit, spusťte azure CLI nebo následující kroky PowerShellu:
az provider register --namespace Microsoft.Kubernetes
az provider register --namespace Microsoft.KubernetesConfiguration
Register-AzResourceProvider -ProviderNamespace Microsoft.Kubernetes
Register-AzResourceProvider -ProviderNamespace Microsoft.KubernetesConfiguration
Dokončení registrace trvá přibližně 10 minut. K monitorování procesu registrace použijte následující příkazy.
az provider show -n Microsoft.Kubernetes -o table
az provider show -n Microsoft.KubernetesConfiguration -o table
Get-AzResourceProvider -ProviderNamespace Microsoft.Kubernetes
Get-AzResourceProvider -ProviderNamespace Microsoft.KubernetesConfiguration
Instalace AksHci přestane reagovat ve fázi Čekání na dokončení onboardingu azure-arc před uplynutím časového limitu.
Poznámka:
Tento problém je opravený ve verzi z května 2022 a novější.
Instalace AksHci přestane reagovat před vypršením Waiting for azure-arc-onboarding to complete
časového limitu, kdy:
- Instanční objekt se používá v AKS v místní registraci Azure (Set-AksHciRegistration).
- Nainstalované moduly Az.Accounts PowerShellu (2.7.x).
Az.Accounts 2.7.x
verze odeberou ServicePrincipalSecret
a CertificatePassword
v PSAzureRmAccount
, které AKS v Azure Local používá pro onboarding Azure Arc.
Reprodukování:
- Nainstalujte
Az.Accounts
verzi modulů PowerShellu (>= 2.7.0). Set-AksHciRegistration
pomocí instančního objektu.Install-AksHci
.
Očekávané chování:
- Místní instalace AKS v Azure přestane reagovat na
Waiting for azure-arc-onboarding to complete
adrese . Azure-arc-onboarding
Pody se přejdou do smyčky chybového ukončení.- Chyba
Azure-arc-onboarding
podů s následující chybou:
Starting onboarding process ERROR: variable CLIENT_SECRET is required
Řešení tohoto problému:
Odinstalujte moduly Az.Accounts s verzemi 2.7.x. Spusťte následující rutinu:
Uninstall-Module -Name Az.Accounts -RequiredVersion 2.7.0 -Force
Během instalace se zobrazí tato chyba: Nejde vytvořit virtuální počítač zařízení: nejde vytvořit virtuální počítač: chyba rpc = neznámá desc = Došlo k výjimce. (Obecná chyba)]
K této chybě dochází v případě, že služba Azure Local není v zásadách. Stav připojení v clusteru může zobrazit, že je připojený, ale v protokolu událostí se zobrazí zpráva s upozorněním, že Azure Local's subscription is expired, run Sync-AzureStackHCI to renew the subscription
.
Pokud chcete tuto chybu vyřešit, pomocí rutiny PowerShellu, která je k dispozici na vašem počítači, ověřte, že je cluster zaregistrovaný v Azure Get-AzureStackHCI
. Informace o stavu registrace clusteru v Azure se zobrazí také na řídicím panelu Windows Admin Center.
Pokud je cluster již zaregistrovaný, zkontrolujte pole LastConnected
ve výstupu rutiny Get-AzureStackHCI
. Pokud se v tomto poli zobrazí, že k poslednímu připojení došlo před více než 30 dny, měli byste se pokusit tuto situaci vyřešit pomocí rutiny Sync-AzureStackHCI
.
Pomocí následující rutiny můžete také ověřit, jestli má každý uzel clusteru požadovanou licenci:
Get-ClusterNode | % { Get-AzureStackHCISubscriptionStatus -ComputerName $_ }
Computer Name Subscription Name Status Valid To
------------- ----------------- ------ --------
MS-HCIv2-01 Azure Local Active 12/23/2021 12:00:14 AM
MS-HCIv2-01 Windows Server Subscription Inactive
MS-HCIv2-02 Azure Local Active 12/23/2021 12:00:14 AM
MS-HCIv2-02 Windows Server Subscription Inactive
MS-HCIv2-03 Azure Local Active 12/23/2021 12:00:14 AM
MS-HCIv2-03 Windows Server Subscription Inactive
Pokud se problém po spuštění Sync-AzureStackHCI
rutiny nevyřeší, měli byste kontaktovat podporu Microsoftu.
Po neúspěšné instalaci nefunguje spuštění install-AksHci
K tomuto problému dochází, protože neúspěšná instalace může vést k úniku prostředků, které je potřeba před opětovnou instalací vyčistit.
Pokud instalace selže pomocí install-AksHci, měli byste před dalším spuštěním Install-AksHci
spustit Uninstall-AksHci.
Chyba: Nepodařilo se odsouhlasit virtuální síť nebo Chyba: Instalace moc selhala s chybou – Výjimka [[Moc] Tento počítač zřejmě není nakonfigurovaný pro nasazení]"
Tyto chyby můžete aktivovat při spuštění Install-AksHci
bez spuštění set-AksHciConfig .
Pokud chcete tuto chybu vyřešit, spusťte uninstall-akshci
a zavřete všechna okna PowerShellu. Otevřete novou relaci PowerShellu a restartujte AKS v místním procesu instalace Azure pomocí PowerShellu.
Set-AksHciConfig selže s chybou GetCatalog chyba vrácená voláním rozhraní API: ... proxyconnect tcp: tls: první záznam nevypadá jako handshake TLS"
Rutina Set-AksHciConfig
PowerShellu selže s chybou:
GetCatalog error returned by API call: ... proxyconnect tcp: tls: first record does not look like a TLS Handshake
Pokud používáte AKS s proxy serverem, možná jste při nastavování požadované hodnoty adresy URL proxy HTTPS použili nesprávnou adresu URL. Při konfiguraci AKS s proxy serverem se vyžadují hodnoty adresy URL proxy serveru HTTP i adresy URL proxy serveru HTTPS, ale obě hodnoty je běžné ke sdílení stejné adresy URL s předponou HTTP.
Pokud to může být váš případ ve vašem prostředí, vyzkoušejte následující kroky pro zmírnění rizik:
- Zavřete okno PowerShellu a otevřete nový.
- Znovu spusťte rutiny
New-AksHciNetworkSetting
aNew-AksHciProxySetting
spusťte je. Při spuštěníNew-AksHciProxySetting
nastavte-https
parametr se stejnou hodnotou adresy URL s předponou HTTP, pro-http
kterou jste nastavili . - Spusťte a pokračujte
Set-AksHciConfig
.
Když nasadíte AKS v Azure Local s chybně nakonfigurovanou sítí, vyprší časový limit nasazení v různých bodech.
Když nasadíte AKS v Azure Local, může dojít k vypršení časového limitu nasazení v různých bodech procesu v závislosti na tom, kde došlo k chybné konfiguraci. Měli byste zkontrolovat chybovou zprávu a zjistit příčinu a místo, kde k ní došlo.
Například v následující chybě je bod, ve kterém došlo k Get-DownloadSdkRelease -Name "mocstack-stable"
chybné konfiguraci:
$vnet = New-AksHciNetworkSettingSet-AksHciConfig -vnet $vnetInstall-AksHciVERBOSE:
Initializing environmentVERBOSE: [AksHci] Importing ConfigurationVERBOSE:
[AksHci] Importing Configuration Completedpowershell :
GetRelease - error returned by API call:
Post "https://msk8s.api.cdp.microsoft.com/api/v1.1/contents/default/namespaces/default/names/mocstack-stable/versions/0.9.7.0/files?action=generateDownloadInfo&ForegroundPriority=True":
dial tcp 52.184.220.11:443: connectex:
A connection attempt failed because the connected party did not properly
respond after a period of time, or established connection failed because
connected host has failed to respond.At line:1 char:1+ powershell -command
{ Get-DownloadSdkRelease -Name "mocstack-stable"}
To znamená, že fyzický místní uzel Azure dokáže přeložit název adresy URL pro stažení, msk8s.api.cdp.microsoft.com
ale uzel se nemůže připojit k cílovému serveru.
Pokud chcete tento problém vyřešit, musíte určit, kde došlo k rozpisu v toku připojení. Tady je několik kroků, jak problém vyřešit z fyzického uzlu clusteru:
- Příkaz ping cílového názvu DNS: ping
msk8s.api.cdp.microsoft.com
. - Pokud se vám vrátí odpověď a žádný časový limit, základní síťová cesta funguje.
- Pokud vyprší časový limit připojení, může dojít k přerušení cesty k datům. Další informace najdete v tématu kontrola nastavení proxy serveru. Nebo může dojít k přerušení návratové cesty, takže byste měli zkontrolovat pravidla brány firewall.
Set-AksHciConfig selže s chybami WinRM, ale zobrazuje, že winRM je správně nakonfigurovaný
Při spuštění set-AksHciConfig se může zobrazit následující chyba:
WinRM service is already running on this machine.
WinRM is already set up for remote management on this computer.
Powershell remoting to TK5-3WP08R0733 was not successful.
At C:\Program Files\WindowsPowerShell\Modules\Moc\0.2.23\Moc.psm1:2957 char:17
+ ... throw "Powershell remoting to "+$env:computername+" was n ...
+ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+ CategoryInfo : OperationStopped: (Powershell remo...not successful.:String) [], RuntimeException
+ FullyQualifiedErrorId : Powershell remoting to TK5-3WP08R0733 was not successful.
K této chybě obvykle dochází v důsledku změny tokenu zabezpečení uživatele (kvůli změně členství ve skupině), změny hesla nebo vypršení platnosti hesla. Ve většině případů je možné tento problém napravit tím, že se odhlásíte z počítače a přihlásíte se znovu. Pokud se problém stále nedaří, můžete problém podat v místních problémech s GitHubem AKS v Azure.
Obměně protokolu agenta Moc selhává
Očekává se, že agenti moc budou uchovávat pouze posledních 100 protokolů agentů. Mají odstranit starší protokoly. Obměna protokolů se ale neděje a protokoly se neustále hromadí zabírají místo na disku.
Reprodukování: Install AksHci
a mít cluster spuštěný, dokud počet protokolů agenta nepřekročí 100. V době vytvoření n-th protokolu se očekává, že agenti odstraní n-100th protokol, pokud existují.
Řešení tohoto problému:
Upravte soubory logconf agenta cloudu a agentů uzlů. Protokolconfig cloudového agenta se nachází na adrese:
(Get-MocConfig).cloudConfigLocation+"\log\logconf"
.
Logconfig agenta uzlu se nachází na adrese:
(Get-MocConfig).cloudConfigLocation+"\log\logconf"
.Změňte hodnotu Limit na 100 a Sloty na 100 a uložte konfigurační soubory.
Restartujte agenta cloudu a agenty uzlů, aby se tyto změny zaregistrovaly.
Tyto kroky spustí obměnu protokolů až po vygenerování 100 nových protokolů z restartování agenta. Pokud už v době restartování existuje n protokolů agenta, zahájí se obměna protokolů až po vygenerování n+100 protokolů.
Cloudový agent se nemusí úspěšně spustit při použití názvů cest s mezerami v nich
Při použití set-AksHciConfig k určení -imageDir
, -workingDir
, -cloudConfigLocation
, nebo -nodeConfigLocation
parametrů s názvem cesty, který obsahuje znak mezery, například D:\Cloud Share\AKS HCI
, cloud agent cluster service se nepodaří spustit následující (nebo podobné) chybová zpráva:
Failed to start the cloud agent generic cluster service in failover cluster. The cluster resource group os in the 'failed' state. Resources in 'failed' or 'pending' states: 'MOC Cloud Agent Service'
Chcete-li tento problém vyřešit, použijte cestu, která neobsahuje mezery, C:\CloudShare\AKS-HCI
například .
Chyba: Instalace moc selhala s chybou – Výjimka [CloudAgent je nedostupná. Moc CloudAgent může být nedostupný z následujících důvodů]
K této chybě může dojít v případě chybné konfigurace infrastruktury.
Pokud chcete tuto chybu vyřešit, postupujte následovně:
Zkontrolujte konfiguraci hostitelského serveru DNS a nastavení brány:
- Ověřte, že je server DNS správně nakonfigurovaný. Pokud chcete zkontrolovat adresu serveru DNS hostitele, spusťte následující příkaz:
((Get-NetIPConfiguration).DNSServer | ?{ $_.AddressFamily -ne 23}).ServerAddresses
- Pokud chcete zkontrolovat správnost vaší IP adresy a konfigurace brány, spusťte příkaz
ipconfig/all
. - Pokuste se otestovat bránu IP a server DNS příkazem Ping.
- Ověřte, že je server DNS správně nakonfigurovaný. Pokud chcete zkontrolovat adresu serveru DNS hostitele, spusťte následující příkaz:
Zkontrolujte službu CloudAgent a ujistěte se, že je spuštěná:
- Otestujte příkazem Ping službu cloudového agenta a ujistěte se, že je dostupná.
- Spuštěním následujícího příkazu na každém uzlu se ujistěte, že všechny uzly můžou přeložit DNS agenta CloudAgent:
Resolve-DnsName <FQDN of cloudagent>
- Pokud předchozí krok na všech uzlech proběhne úspěšně, ujistěte se, že se uzly můžou připojit k portu cloudového agenta, abyste ověřili, že se toto připojení nepokouší blokovat žádný proxy server a že je daný port otevřený. Provedete to spuštěním následujícího příkazu na všech uzlech:
Test-NetConnection <FQDN of cloudagent> -Port <Cloudagent port - default 65000>
- Pokud chcete zkontrolovat, jestli je clusterová služba spuštěná pro cluster s podporou převzetí služeb při selhání, můžete také spustit následující příkaz:
Get-ClusterGroup -Name (Get-AksHciConfig).Moc['clusterRoleName']
Chyba: Instalace moc se nezdařila. Výjimka [Obvykle to značí problém, ke kterým došlo při registraci názvu prostředku jako objektu počítače v řadiči domény nebo serveru DNS. Zkontrolujte, jestli má objekt počítače clusteru oprávnění k vytvoření objektu počítače v řadiči domény. Zkontrolujte, jestli řadič domény a protokoly DNS obsahují související chybové zprávy.
Obvykle to značí, že objekt CNO (Cluster Name Object) představující základní cluster s podporou převzetí služeb při selhání ve službě Doména služby Active Directory Services (AD DS) nemá oprávnění k vytvoření objektu virtuálního počítače (VCO) v organizační jednotce nebo v kontejneru, ve kterém se cluster nachází.
Pokud nejste správcem domény, můžete požádat jednoho o udělení oprávnění CNO organizačnímu objektu nebo předběžnému nastavení VCO pro obecnou clusterovou službu cloudového agenta.
Pokud jste správcem domény, je stále možné, že vaše organizační jednotky nebo kontejner nemají požadovaná oprávnění. Ve službě Active Directory může být povolený například režim vynucení zavedený v KB5008383. Před pokusem o přeinstalaci zkuste následující:
- Přejděte na Uživatelé a počítače služby Active Directory.
- Klikněte pravým tlačítkem na organizační jednotky nebo kontejner, ve kterém se cluster nachází.
- Výběrem možnosti Delegovat řízení... otevřete Průvodce delegováním ovládacího prvku.
- Kliknutím na další> tlačítko Přidat... otevřete okno Vybrat uživatele, počítače nebo skupiny .
- Vyberte skupinu nebo uživatele, kterým chcete delegovat řízení > , klikněte na TLAČÍTKO OK.
- Vyberte Vytvořit vlastní úkol, který deleguje> kliknutím na tlačítko Další a přejdete na stránku Typ objektu služby Active Directory.
- V této složce Vyberte pouze následující objekty ve složce> Vybrat objekty> Počítače Vyberte vybrat vybrané objekty v této složce a Odstranit vybrané objekty v této složce> Kliknutím na tlačítko Další přejdete na stránku Oprávnění.
- V seznamu oprávnění vyberte Vytvořit všechny podřízené objekty a odstranit všechny podřízené objekty.>>
Pokud se přeinstalace nezdaří, zkuste to znovu s následujícími změnami kroků 7 a 8:
- Krok 7: Vyberte tuto složku, existující objekty v této složce a vytvořte nové objekty v této složce> klepněte na tlačítko Další.
- Krok 8: V seznamu oprávnění > vyberte Čtení, Zápis, Vytvořit všechny podřízené objekty a Odstraňte všechny podřízené objekty.>
Chyba: Instalace AksHci selže s chybou Install-Moc selhala. K dispozici jsou protokoly C:\Users\xxx\AppData\Local\Temp\v0eoltcc.a10'
Při spuštění nástroje Install-AksHci se může zobrazit tato chyba.
Další informace získáte spuštěním a následným $error[0].Exception.InnerException
spuštěním $error = Install-AksHci
.
Nasazení PowerShellu nekontroluje dostupnou paměť před vytvořením nového clusteru úloh.
Příkazy PowerShellu Aks-Hci neověřují dostupnou paměť na hostitelském serveru před vytvořením uzlů Kubernetes. Tento problém může vést k vyčerpání paměti a virtuálním počítačům, které se nespustí. Toto selhání se v současné době nezpracuje elegantně a nasazení přestane reagovat bez jasné chybové zprávy.
Pokud máte nasazení, které přestane reagovat, otevřete Prohlížeč událostí a vyhledejte chybovou zprávu související s Technologií Hyper-V, která indikuje, že pro spuštění virtuálního počítače není dostatek paměti.
Při spuštění set-AksHciRegistration se zobrazí chyba Nejde získat token.
K této chybě může dojít v případě, že máte ve svém účtu Azure více tenantů.
Slouží $tenantId = (Get-AzContext).Tenant.Id
k nastavení správného tenanta. Tento tenant pak při spuštění set-AksHciRegistration zahrňte jako parametr.
Chyba: Čekání na pod Operátor cloudu je připravené
Při pokusu o nasazení clusteru AKS na virtuálním počítači Azure se instalace zablokovala Waiting for pod 'Cloud Operator' to be ready...
a pak selhala a po dvou hodinách vypršel časový limit. Pokusy o řešení potíží kontrolou brány a serveru DNS ukázaly, že fungují správně. Kontroluje konflikty IP adres nebo ADRES MAC, které nebyly nalezeny. Protokoly nezobrazovat fond VIRTUÁLNÍCH IP adres. Při načítání image kontejneru došlo sudo docker pull ecpacr.azurecr.io/kube-vip:0.3.4
k omezení, které místo neoprávněného vypršení časového limitu protokolu TLS (Transport Layer Security) vrátilo.
Pokud chcete tento problém vyřešit, postupujte následovně:
- Začněte nasazovat cluster.
- Po nasazení clusteru se připojte k virtuálnímu počítači clusteru pro správu přes SSH, jak je znázorněno níže:
ssh -i (Get-MocConfig)['sshPrivateKey'] clouduser@<IP Address>
- Změňte nastavení maximální přenosové jednotky (MTU). Neváhejte provést změnu; Pokud změnu provedete příliš pozdě, nasazení selže. Úprava nastavení MTU pomáhá odblokovat vyžádání image kontejneru.
sudo ifconfig eth0 mtu 1300
- Pokud chcete zobrazit stav kontejnerů, spusťte následující příkaz:
sudo docker ps -a
Po provedení těchto kroků by se mělo odblokovat vyžádání image kontejneru.
Chyba: Instalace moc selhala s chybou – Výjimka [Nepodařilo se vytvořit obecnou roli clusteru s podporou převzetí služeb při selhání.]
Tato chyba značí, že IP adresa cloudové služby není součástí sítě clusteru a neodpovídá žádné síti clusteru s povolenou client and cluster communication
rolí.
Pokud chcete tento problém vyřešit, spusťte Get-ClusterNetwork , kde Role
se rovná ClusterAndClient
. Potom na jednom z uzlů clusteru vyberte název, adresu a masku adresy a ověřte, že IP adresa zadaná pro -cloudServiceIP
parametr New-AksHciNetworkSetting odpovídá jedné ze zobrazených sítí.
Rutina Enable-AksHciArcConnection vygeneruje upozornění, že rutina GetServicePrincipals nemá dostatečná oprávnění k povolení vlastních umístění.
Enable-AksHciArcConnection
může připojit cluster AKS k Azure, ale zobrazuje následující upozornění, když zákazník k ověřování používá instanční objekt:
WARNING: Error occurred while executing GetServicePrincipals
Code: Authorization_RequestDenied
Message: Insufficient privileges to complete the operation.
RequestId: <removed>
DateTimeStamp: <removed>
HttpStatusCode: Forbidden
HttpStatusDescription: Forbidden
HttpResponseStatus: Completed
WARNING: Custom locations has not been enabled on the AKS on Azure Local cluster. To enable custom locations manually, visit aka.ms/enable-custom-location
Aktuálním chováním onboardingu Arc je ve výchozím nastavení povolit vlastní umístění. Pokud chcete povolit vlastní umístění, akce GetServicePrincipals se provádí v kontextu přihlášeného uživatele Azure. Pokud uživatel (nebo hlavní název služby) nemá dostatečná oprávnění k tomu, aby to mohl provést, příkaz vydá upozornění, že tato oprávnění neexistují, a proto nebude povolená funkce Vlastní umístění.
Pokud nechcete, aby byla povolená vlastní umístění, můžete toto upozornění bezpečně ignorovat, protože to nemá vliv na onboarding clusteru do služby Arc. Pokud ale potřebujete povolit vlastní umístění, musíte uživateli (nebo hlavnímu názvu služby) udělit potřebná oprávnění.
Další kroky
- Přehled řešení potíží
- Známé problémy v Centru pro správu Windows
- Řešení potíží s clustery Kubernetes
Pokud při používání služby AKS Arc stále dochází k problémům, můžete chyby zasdílit prostřednictvím GitHubu.