Sdílet prostřednictvím


Pokyny k řešení potíží pro agenta Azure Monitor na virtuálních počítačích s Linux a škálovacích sadách

Přehled agenta Služby Azure Monitor

Než si přečtete další informace, musíte být obeznámeni s agentem služby Azure Monitor a pravidly shromažďování dat.

Terminologie

Název Zkratka Popis
Agent Azure Monitoru AMA Nový agent Azure Monitoru
Pravidla shromažďování dat DCR Pravidla pro konfiguraci shromažďování dat agentem, tj. co shromažďovat, kam se mají odesílat, a další
Služba konfigurace služby Azure Monitor AMCS Regionální služba hostovaná v Azure, která řídí shromažďování dat pro tohoto agenta a další části služby Azure Monitor. Agent volá do této služby za účelem načtení řadičů domény.
Koncový bod protokolů -- Koncový bod pro odesílání dat do pracovních prostorů služby Log Analytics
Koncový bod metrik -- Koncový bod pro odesílání dat do databází metrik služby Azure Monitor
Služba metadat instance a hybridní služba IMDS a HIMDS Služby hostované v Azure, které poskytují informace o aktuálně spuštěných virtuálních počítačích, škálovacích sadách (přes IMDS) a serverech s podporou Arc (prostřednictvím HIMDS).
Pracovní prostor služby Log Analytics ZÁKON Cíl ve službě Azure Monitor, do kterého můžete odesílat protokoly shromážděné agentem.
Vlastní metriky -- Cíl ve službě Azure Monitor, do kterého můžete odesílat metriky hosta shromážděné agentem.

Základní postupy při řešení potíží

Při řešení potíží s nejnovější verzí agenta služby Azure Monitor spuštěného na virtuálním počítači s Linuxem postupujte následovně:

  1. Pečlivě si projděte požadavky.

  2. Ověřte, že se rozšíření úspěšně nainstalovalo a zřídilo, což nainstaluje binární soubory agenta na váš počítač:

    1. V levém podokně AzureMonitorLinuxAgent by se měl zobrazit Stav: Zřizování proběhlo úspěšně. Otevřete Azure Portal>. V podokně vlevo by se měla zobrazit možnost Otevřít nastavení virtuálního počítače > : Rozšíření a aplikace >
    2. Pokud uvedené rozšíření nevidíte, zkontrolujte, jestli se počítač může spojit s Azure, a pomocí následujícího příkazu vyhledejte rozšíření, které se má nainstalovat:
      az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
      
    3. Počkejte 10 až 15 minut, protože rozšíření může být ve stavu přechodu. Pokud se stále nezobrazuje jako výše, odinstalujte a nainstalujte rozšíření znovu.
    4. Zkontrolujte, jestli se v protokolech rozšíření na vašem počítači zobrazují /var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/ nějaké chyby.
  3. Ověřte, že je agent spuštěný:

    1. Pomocí následujícího dotazu zkontrolujte, jestli agent vysílá protokoly prezenčních signálů do pracovního prostoru služby Log Analytics. Pokud je vlastní metrika jediným cílem v DCR, přeskočte:
      Heartbeat | where Category == "Azure Monitor Agent" and Computer == "<computer-name>" | take 10
      
    2. Kontrola, jestli je spuštěná služba agenta
      systemctl status azuremonitoragent
      
    3. Zkontrolujte, jestli v protokolech základního agenta, které se nacházejí na /var/opt/microsoft/azuremonitoragent/log/mdsd.* vašem počítači, nějaké chyby.
  4. Ověřte, že řadič domény existuje a je přidružený k virtuálnímu počítači:

    1. Pokud jako cíl používáte pracovní prostor služby Log Analytics, ověřte, že řadič domény existuje ve stejné fyzické oblasti jako pracovní prostor služby Log Analytics.
    2. Otevřete Azure Portal > a vyberte pravidlo > shromažďování dat Otevřít konfiguraci : Prostředky z podokna vlevo > By se měl zobrazit virtuální počítač uvedený tady.
    3. Pokud tu není uvedený, klikněte na Přidat a vyberte virtuální počítač z nástroje pro výběr prostředků. Opakujte všechny řadiče domény.
  5. Ověřte, že agent mohl stáhnout přidružené řadiče domény ze služby AMCS:

    1. Zkontrolujte, jestli se v tomto umístění zobrazuje nejnovější stažený řadič domény .DCR. /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/

Problémy se shromažďováním syslogu

Další informace o řešení potíží s syslogem s agentem služby Azure Monitor najdete tady.

  • Soubor /var/opt/microsoft/azuremonitoragent/log/mdsd.qos QoS (Quality of Service) poskytuje agregace zpracovaných událostí ve formátu CSV ve formátu 15 minut a obsahuje informace o množství zpracovaných událostí syslogu v daném časovém rámci. Tento soubor je užitečný při sledování poklesů příjmu událostí Syslogu.

    Následující fragment například ukazuje, že v 15 minutách před 2022-02-02-28T19:55:23.5432920Z agent obdržel 77 událostí syslogu s démonem zařízení a informacemi o úrovni a odeslal 77 z uvedených událostí do úlohy nahrání. Úloha nahrání agenta navíc přijala 77 a úspěšně nahrála všech 77 těchto daemon.info zpráv.

    #Time: 2022-02-28T19:55:23.5432920Z
    #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent
    ...
    MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77
    MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0
    ...
    MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
    

Postup při řešení potíží

  1. Nejprve si projděte obecné kroky pro řešení potíží s Linuxem AMA. Pokud agent generuje prezenčních signálů, přejděte ke kroku 2.

  2. Analyzovaná konfigurace je uložena na /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/adrese . Zkontrolujte, jestli je definovaná kolekce Syslog a cíle protokolů jsou stejné jako vytvořené v uživatelském rozhraní DCR / JSON DCR.

    1. Pokud ano, přejděte ke kroku 3. Pokud ne, problém je v pracovním postupu konfigurace.
    2. Prozkoumejte mdsd.errsoubory v mdsd.info části /var/opt/microsoft/azuremonitoragent/log s možnými chybamimdsd.warn konfigurace.
  3. Ověřte rozložení pracovního postupu kolekce Syslog, abyste měli jistotu, že jsou všechny potřebné části zavedené a přístupné:

    1. Pro rsyslog uživatele se ujistěte /etc/rsyslog.d/10-azuremonitoragent.conf , že soubor existuje, není prázdný a je přístupný démonem rsyslog (uživatel syslogu).
      1. Zkontrolujte konfiguraci rsyslogu /etc/rsyslog.conf a /etc/rsyslog.d/* zkontrolujte, jestli máte nějaké vstupy vázané na jinou než výchozí sadu pravidel, protože zprávy z těchto vstupů se nepřepošou do agenta služby Azure Monitor. Například zprávy ze vstupu nakonfigurované pomocí jiné než výchozí sady pravidel, jako input(type="imtcp" port="514" ruleset="myruleset") by se nepřeposílaly.
    2. Pro syslog-ng uživatele se ujistěte /etc/syslog-ng/conf.d/azuremonitoragent.conf , že soubor existuje, není prázdný a je přístupný démonem syslog-ng (uživatel syslogu).
    3. Ujistěte se, že soubor /run/azuremonitoragent/default_syslog.socket existuje a je přístupný v rsyslog syslog-ng uvedeném pořadí.
    4. Zkontrolujte, jestli fronta démona syslogu nepřeteče, což způsobuje selhání nahrávání, a to s využitím následujících pokynů: Data Rsyslogu se nenahrála kvůli problému s plným místem na disku v agentovi AMA Linuxu.
  4. Pokud chcete dále ladit příjem událostí syslogu, můžete připojit příznak trasování -T 0x2002 na konci MDSD_OPTIONS v souboru /etc/default/azuremonitoragenta restartovat agenta:

    export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
    
  5. Po reprodukování problému s příznakem trasování najdete další informace o ladění v /var/opt/microsoft/azuremonitoragent/log/mdsd.infosouboru . Zkontrolujte, jestli soubor neobsahuje možnou příčinu problému se shromažďováním syslogu, například parsováním, zpracováním, konfigurací nebo chybami nahrávání.

    Upozorňující

    Zajistěte, aby se po ladicí relaci odebralo nastavení příznaku trasování -T 0x2002 , protože generuje mnoho příkazů trasování, které by mohly disk zaplnit rychleji nebo vizuálně parsovat soubor protokolu.

Řešení potíží na serveru s podporou arc

Pokud po kontrole základních kroků pro řešení potíží nevidíte agenta služby Azure Monitor, který generuje protokoly, nebo v souboru protokolu zjistíte , že se nepodařilo získat token MSI z koncového bodu /var/opt/microsoft/azuremonitoragent/log/mdsd.err IMDS, syslog pravděpodobně uživatel není členem skupiny himds. Pokud uživatel není členem této skupiny, přidejte syslog uživatele do himds skupiny uživatelů. V případě potřeby vytvořte uživatele syslog a skupinu sysloga ujistěte se, že je uživatel v této skupině. Další informace najdete v požadavcích na ověřování serveru s podporou Služby Azure Arc.