Поделиться через


Сбор диагностических данных для кластеров

Область применения: Azure Stack HCI, версии 22H2 и 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

Внимание

Azure Stack HCI теперь является частью Azure Local. Выполняется переименование документации по продукту. Однако старые версии Azure Stack HCI, например 22H2, будут продолжать ссылаться на Azure Stack HCI и не отражают изменение имени. Подробнее.

Существуют различные средства диагностики в Локальные дисковые пространства, которые можно использовать для сбора данных, необходимых для устранения неполадок кластеров Azure Stack HCI и Windows Server. В этой статье мы сосредоточимся на установке и использовании средств диагностики SDDC для сбора соответствующих сведений для диагностики кластера.

Так как журналы и другие сведения являются плотными, сведения, представленные в этой статье, полезны для устранения сложных проблем, которые были расширены, и которые могут потребовать отправки данных в Корпорацию Майкрософт для рассмотрения.

Установка и использование средств диагностики в Windows Admin Center

Windows Admin Center (версия 1812) можно использовать для:

  • Установка средств диагностики SDDC и их актуальность
  • Планирование ежедневных диагностических запусков (они имеют низкое влияние на систему, обычно занимает менее пяти минут для выполнения в фоновом режиме и не займет более 500 МБ в кластере).
  • Просмотрите ранее собранные диагностические сведения, если необходимо предоставить ему поддержку или проанализировать его самостоятельно.

Чтобы установить средства диагностики SDDC и начать сбор данных, выполните следующие действия.

  1. Запустите Windows Admin Center и выберите "Диагностика средств>". Если средства диагностика еще не установлены, нажмите кнопку "Установить".

    Нажмите кнопку

  2. Чтобы начать сбор диагностических данных, нажмите кнопку "Собрать". Появится сообщение " Сбор диагностических сведений. Это может занять несколько минут. После первоначальной коллекции данных, если вы хотите автоматически собирать данные каждые 24 часа, измените ползунок на On.

    Нажмите кнопку

  3. Сбор данных не завершен, пока не отобразится снимок экрана ниже. Чтобы просмотреть собранные диагностические сведения, нажмите кнопку "Скачать" (.zip) или "Открыть в файлах".

    Чтобы просмотреть диагностические сведения, можно скачать файл .zip или открыть в средстве

Установка Get-SDDCDiagnosticInfo с помощью PowerShell

Командлет PowerShell (также известный Test-StorageHealthкак Get-PCStorageDiagnosticInfo) позволяет Get-SDDCDiagnosticInfo собирать журналы и выполнять проверки работоспособности для отказоустойчивой кластеризации (кластер, ресурсы, сети, узлы), дисковые пространства (физические диски, корпуса, виртуальные диски), общие тома кластера, общие тома SMB и дедупликация.

Существует два метода установки скрипта: коллекция PowerShell и GitHub. Оба описаны ниже.

Коллекция PowerShell — это моментальный снимок репозитория GitHub. Обратите внимание, что для установки элементов из коллекция PowerShell требуется последняя версия модуля PowerShellGet, которая доступна в Windows 10, в Windows Management Framework (WMF) 5.0 или в установщике на основе MSI (для PowerShell 3 и 4).

Мы устанавливаем последнюю версию средств диагностики сети Майкрософт во время этого процесса, так как Get-SDDCDiagnosticInfo это зависит от этого. Этот модуль манифеста содержит средство диагностики сети и средства устранения неполадок, которые поддерживаются группой продуктов Microsoft Core Networking в Корпорации Майкрософт.

Модуль можно установить, выполнив следующую команду в PowerShell от имени администратора:

Install-PackageProvider NuGet -Force
Install-Module PrivateCloud.DiagnosticInfo -Force
Import-Module PrivateCloud.DiagnosticInfo -Force
Install-Module -Name MSFT.Network.Diag

Чтобы обновить модуль, выполните следующую команду в PowerShell:

Update-Module PrivateCloud.DiagnosticInfo

GitHub

Репозиторий GitHub является самой актуальной версией модуля, так как мы постоянно итерируем здесь. Чтобы установить модуль из GitHub, скачайте последний модуль из архива и извлеките каталог PrivateCloud.DiagnosticsInfo в правильный путь к модулям PowerShell, на который указывает$env:PSModulePath

# Allowing Tls12 and Tls11 -- e.g. github now requires Tls12
# If this is not set, the Invoke-WebRequest fails with "The request was aborted: Could not create SSL/TLS secure channel."
[Net.ServicePointManager]::SecurityProtocol = [Net.SecurityProtocolType]::Tls12
$module = 'PrivateCloud.DiagnosticInfo'
Invoke-WebRequest -Uri https://github.com/PowerShell/$module/archive/master.zip -OutFile $env:TEMP\master.zip
Expand-Archive -Path $env:TEMP\master.zip -DestinationPath $env:TEMP -Force
if (Test-Path $env:SystemRoot\System32\WindowsPowerShell\v1.0\Modules\$module) {
    rm -Recurse $env:SystemRoot\System32\WindowsPowerShell\v1.0\Modules\$module -ErrorAction Stop
    Remove-Module $module -ErrorAction SilentlyContinue
} else {
    Import-Module $module -ErrorAction SilentlyContinue
}
if (-not ($m = Get-Module $module -ErrorAction SilentlyContinue)) {
    $md = "$env:ProgramFiles\WindowsPowerShell\Modules"
} else {
    $md = (gi $m.ModuleBase -ErrorAction SilentlyContinue).PsParentPath
    Remove-Module $module -ErrorAction SilentlyContinue
    rm -Recurse $m.ModuleBase -ErrorAction Stop
}
cp -Recurse $env:TEMP\$module-master\$module $md -Force -ErrorAction Stop
rm -Recurse $env:TEMP\$module-master,$env:TEMP\master.zip
Import-Module $module -Force

Если вам нужно получить этот модуль в автономном кластере, скачайте zip-файл, переместите его на целевой узел сервера и установите модуль.

Сбор журналов с помощью PowerShell

После включения каналов событий и завершения процесса установки можно использовать Get-SDDCDiagnosticInfo командлет PowerShell в модуле, чтобы получить следующее:

  • Отчеты о работоспособности хранилища, а также сведения о неработоспособных компонентах
  • Отчеты о емкости хранилища по пулу, тому и дедупликированному тому
  • Журналы событий со всех узлов кластера и сводный отчет об ошибке

Предположим, что кластер хранилища имеет имя CLUS01.

Чтобы выполнить кластер удаленного хранилища, выполните следующую команду:

Get-SDDCDiagnosticInfo -ClusterName CLUS01

Чтобы выполнить локально на кластеризованном узле хранилища:

Get-SDDCDiagnosticInfo

Чтобы сохранить результаты в указанную папку, выполните указанные действия.

Get-SDDCDiagnosticInfo -WriteToPath D:\Folder

Ниже приведен пример того, как это выглядит в реальном кластере:

New-Item -Name SDDCDiagTemp -Path d:\ -ItemType Directory -Force
Get-SddcDiagnosticInfo -ClusterName S2D-Cluster -WriteToPath d:\SDDCDiagTemp

Как видно, скрипт также будет выполнять проверку текущего состояния кластера:

Снимок экрана: сбор данных PowerShell.

Все данные записываются в папку SDDCDiagTemp:

Данные на снимке экрана проводник.

После завершения скрипта он создаст ZIP-файл в каталоге пользователя:

Снимок экрана с данными в PowerShell.

Создадим отчет в текстовый файл:

#find the latest diagnostic zip in UserProfile
    $DiagZip=(get-childitem $env:USERPROFILE | where Name -like HealthTest*.zip)
    $LatestDiagPath=($DiagZip | sort lastwritetime | select -First 1).FullName
#expand to temp directory
    New-Item -Name SDDCDiagTemp -Path d:\ -ItemType Directory -Force
    Expand-Archive -Path $LatestDiagPath -DestinationPath D:\SDDCDiagTemp -Force
#generate report and save to text file
    $report=Show-SddcDiagnosticReport -Path D:\SDDCDiagTemp
    $report | out-file d:\SDDCReport.txt

Для справки здесь приведена ссылка на пример отчета и zip-файл.

Выходные данные Get-SDDCDiagnosticInfo

Ниже приведены файлы, включенные в сжатые выходные данные Get-SDDCDiagnosticInfo.

Сводный отчет о работоспособности

Сводный отчет о работоспособности сохраняется следующим образом:

  • 0_CloudHealthSummary.log

Этот файл создается после анализа всех собранных данных и предназначен для предоставления краткой сводки по системе. Она содержит:

  • Сведения о системе
  • Общие сведения о работоспособности хранилища (количество узлов вверх, ресурсы в сети, общие тома кластера, неработоспособные компоненты и т. д.)
  • Сведения о неработоспособных компонентах (ресурсы кластера, которые находятся в автономном режиме, не удалось или в режиме ожидания в сети)
  • Сведения о встроенном ПО и драйвере
  • Сведения о пуле, физическом диске и томе
  • Производительность хранилища (собираются счетчики производительности)

Этот отчет постоянно обновляется, чтобы включить более полезную информацию. Последние сведения см. в GitHub README.

Журналы и XML-файлы

Скрипт запускает различные скрипты сбора журналов и сохраняет выходные данные в виде XML-файлов. Мы собираем журналы событий кластера и работоспособности, сведения о системе (MSInfo32), нефильтрованные журналы событий (отказоустойчивая кластеризация, дисперс диагностика, Hyper-V, дисковые пространства и многое другое), а также сведения об диагностика хранилища (операционные журналы). Последние сведения о том, какие сведения собираются, см. в GitHub README (то, что мы собираем).

Использование XML-файлов из Get-SDDCDiagnosticInfo

Данные из XML-файлов, предоставленных командлетом Get-SDDCDiagnosticInfo , можно использовать. Эти файлы содержат сведения о виртуальных дисках, физических дисках, основных сведениях о кластере и других связанных выходных данных PowerShell.

Чтобы просмотреть результаты этих выходных данных, откройте окно PowerShell и выполните следующие действия.

ipmo storage
$d = import-clixml <filename>
$d

Следующие шаги

Предоставьте отзыв о том, что вы хотите увидеть, отправив здесь проблемы. Кроме того, вы можете внести полезные изменения в скрипт, отправив запрос на вытягивание.