Freigeben über


Behandeln von Konnektivitätsproblemen für Azure SQL-Datenbank mithilfe von Resource Health

Gilt für: Azure SQL-Datenbank

Resource Health für Azure SQL-Datenbank unterstützt Sie bei der Diagnose und bei Supportanfragen, wenn sich ein Azure-bezogenes Problem auf Ihre SQL-Ressourcen auswirkt. Der Dienst informiert Sie über die aktuelle und frühere Integrität Ihrer Ressourcen und unterstützt Sie beim Beheben von Problemen. Die Seite Resource Health bietet technischen Support, wenn Sie Hilfe bei Problemen mit Azure-Diensten benötigen.

Screenshot des Azure-Portals mit der Seite „Resource Health“ für eine Azure SQL-Datenbank.

Integritätsprüfungen

Resource Health ermittelt anhand von erfolgreichen und nicht erfolgreichen Anmeldungen die Integrität Ihrer SQL-Datenbank. Aktuell untersucht Resource Health für Ihre SQL-Datenbankressource nur Anmeldefehler, die auf Systemfehler (nicht auf Benutzerfehler) zurückzuführen sind. Der Integritätsstatus wird im Abstand von ein bis zwei Minuten aktualisiert.

Integritätszustände

Verfügbar

Ein Status Verfügbar bedeutet, dass Resource Health keine Anmeldefehler aufgrund von Systemfehlern in Ihrer SQL-Datenbank erkannt hat oder dass es Anmeldefehler gegeben hat, die aber nicht dem Warnungsschwellenwert entsprochen haben. Ausführlichere Informationen zum Warnungsschwellenwert finden Sie in den folgenden Abschnitten.

Screenshot des Azure-Portals mit der Statusmeldung für den Status „Verfügbar“.

Heruntergestuft

Ein Status Heruntergestuft bedeutet, dass Resource Health in zwei der letzten drei Minuten Folgendes erkannt hat:

  • mehrheitlich erfolgreiche Anmeldungen, aber es gab auch mehr als einen Anmeldefehler (aufgrund von Systemfehlern) oder
  • mehr als ein Anmeldefehler (aufgrund von Systemfehlern), aber es gab insgesamt weniger als sechs Anmeldeversuche.

Dabei handelt es sich wahrscheinlich um vorübergehende Anmeldefehler. Implementieren Sie in Ihrem Code eine Wiederholungslogik, um die Auswirkungen von Verbindungsproblemen zu verringern, die durch vorübergehende Anmeldefehler verursacht werden.

Screenshot des Azure-Portals mit der Statusmeldung für den Status „Beeinträchtigt“.

Nicht verfügbar

Ein Status Nicht verfügbar bedeutet, dass Resource Health festgestellt hat, dass es in der letzten Minute mehr als fünf Anmeldeversuche gegeben hat, von denen mehr als ein Viertel aus Systemgründen fehlgeschlagen sind. Falls sich Ihre Ressource länger in diesem Zustand befindet, wenden Sie sich an den Microsoft-Support.

Screenshot des Azure-Portals mit der Statusmeldung für den Status „Nicht verfügbar“.

Unbekannt

Der Integritätsstatus Unbekannt gibt an, dass Resource Health seit mehr als 10 Minuten keine Informationen mehr zu dieser Ressource empfangen hat. Zwar zeigt dieser Status nicht definitiv den Ressourcenzustand an, aber er ist ein wichtiger Datenpunkt im Problembehandlungsprozess. Wenn die Ressource wie erwartet ausgeführt wird, wird der Status der Ressource nach wenigen Minuten in „Verfügbar“ geändert. Wenn Probleme mit der Ressource auftreten, kann der Integritätsstatus „Unbekannt“ darauf hindeuten, dass die Ressource durch ein Ereignis auf der Plattform beeinträchtigt wird.

Screenshot des Azure-Portals mit der Statusmeldung für den Status „Unbekannt“.

Warnungszeit

Die von der Resource Health-Warnung angegebene Zeit stimmt nicht mit den Zeiten der Anmeldefehler überein, die die Warnung verursacht haben. Dies liegt daran, dass das Erfassen und Analysieren der Telemetrie zum Bestimmen eines Problems mit Resource Health mehrere Minuten dauert. Die in der Resource Health-Warnung angegebene Zeit liegt daher mehrere Minuten nach den Anmeldefehlern.

Darüber hinaus kann das Zeitintervall, in dem die Anmeldefehler aufgetreten sind, oft kürzer sein als das Zeitintervall in der Resource Health-Warnung.

Verlaufsinformationen

Im Abschnitt „Integritätsverlauf“ von Resource Health stehen bis zu 30 Tage alte Integritätsverlaufsdaten zur Verfügung. Dieser Abschnitt enthält auch die Ursache für Downtime (sofern verfügbar). Derzeit zeigt Azure die Downtime für Ihre Datenbankressource auf zwei Minuten genau an. Die tatsächliche Downtime beträgt wahrscheinlich weniger als einer Minute. Die durchschnittliche Dauer beträgt 8 Sekunden.

Ursachen für Downtime

Bei einer Downtime Ihrer Datenbank wird eine Analyse durchgeführt, um eine Ursache zu ermitteln. Die Ursache der Downtime wird (sofern verfügbar) im Abschnitt „Integritätsverlauf“ von Resource Health gemeldet. Die Gründe für Ausfallzeiten werden in der Regel innerhalb von 45 Minuten nach einem Ereignis veröffentlicht.

Auswählen eines Wartungsfensters

Sie können Ihr Wartungsfenster konfigurieren, um wichtige Wartungsereignisse vorhersehbar und weniger störend für Ihren Workload zu machen. Das Feature Wartungsfenster hilft Ihnen bei der Planung von vorhersehbaren Upgrades oder geplanten Wartungsarbeiten. Vorabbenachrichtigungen sind für Datenbanken verfügbar, für die kein standardmäßiges Wartungsfenster konfiguriert ist. Vorabbenachrichtigungen bieten dem Kunden die Möglichkeit, Benachrichtigungen so zu konfigurieren, dass sie bis zu 24 Stunden vor einem geplanten Ereignis gesendet werden.

Geplante Wartung

Für die Azure-Infrastruktur werden in regelmäßigen Abständen geplante Wartungsmaßnahmen (Hardware- oder Softwareupgrades im Rechenzentrum) durchgeführt. Während die Datenbank gewartet wird, kann Azure SQL einige bestehende Verbindungen trennen und neue Verbindungen ablehnen. Anmeldefehler, die während geplanter Wartungsarbeiten auftreten, sind in der Regel vorübergehend, und die Wiederholungslogik für gelegentliche Netzwerkfehler hilft, die Auswirkungen zu verringern. Sollten weiterhin Anmeldefehler auftreten, wenden Sie sich an den Support.

Reconfiguration

Neukonfigurationen gelten als vorübergehende Bedingungen und werden von Zeit zu Zeit erwartet. Diese Ereignisse können durch den Lastenausgleich oder durch Software-/Hardwarefehler ausgelöst werden. Jede Client-Produktionsanwendung, die eine Verbindung zu einer Clouddatenbank herstellt, sollte eine robuste Wiederholungslogik für vorübergehende Fehler implementieren, da sie dazu beiträgt, diese Situationen zu verringern und die Fehler im Allgemeinen für den Endbenutzer transparent macht.