Azure-Technologien für den Lernprozess

Abgeschlossen

In dieser Lerneinheit erfahren Sie, wie Sie die Ergebnisse des Schritts „Messen“ im Innovationslebenszyklus anwenden. Außerdem erfahren Sie mehr über die Bedeutung der Datendemokratisierung.

Demokratisierung von Daten

Wie Sie in den vorherigen Lerneinheiten gelernt haben, können Sie Daten von Ihren Kunden mithilfe mehrerer Quellen erfassen. Zu diesen Quellen gehören Mikroumfragen, von Azure Application Insights abgeleitete Nutzungsdaten und Featureflags, die Kunden selbst aktivieren oder deaktivieren können. Je mehr Daten Ihnen zur Verfügung stehen, desto bessere Entscheidungen können Sie treffen. Sie benötigen jedoch eine Möglichkeit, diese ständig wachsende Datenmenge zu bewältigen.

Im Jahr 2014 hat Satya Nadella über die Bedeutung der Datenkultur in einer Organisation gesprochen. Er sagte, dass Entscheidungen nicht auf der Grundlage von persönlichen oder subjektiven Ansichten getroffen werden sollten, sondern anhand von Daten, die deren Gültigkeit belegen. Er sagte außerdem, dass Daten für jede Person verfügbar sein sollten, die sie benötigt, und sie sollten leicht in umsetzbare Erkenntnisse konvertiert werden können, um datengesteuerte Entscheidungen zu erleichtern.

Eine Organisation kann umfassende Datenentscheidungen nur treffen, wenn diese Entscheidungen auf einer soliden, zugänglichen Datenplattform basieren. Diese Maßnahmen umfassen vier Bereiche:

  • Datensammlung: Der erste Schritt bei der datengesteuerten Entscheidungsfindung besteht immer aus der Verfügbarkeit von Daten. Die Datensammlung kann verschiedene Formen annehmen: Migration aus vorhandenen Datenrepositorys, Datengenerierung aus Quellen wie Azure Application Insights oder Datenerfassung aus anderen Quellen.
  • Datenfreigabe: Gesammelte Daten müssen für alle verfügbar sein, die sie benötigen, nicht nur für Datenexperten. Alle Personen in einer Organisation sollten in der Lage sein, Daten zu nutzen, um Entscheidungen zu treffen.
  • Datenzentralisierung: Zentralisierte Datenplattformen können zur Vereinfachung von Datenfreigabe und -governance beitragen.
  • Datengovernance: Die gemeinsame Nutzung von Daten bedeutet nicht, dass sämtliche Daten für alle Benutzer*innen verfügbar sein müssen. Stellen Sie vor der Freigabe sicher, dass vertrauliche Daten geschützt, nachverfolgt und gesteuert werden können.

Azure-Datenplattform

Die Azure-Plattform deckt den gesamten Datenlebenszyklus ab, der die für datengesteuerte Entscheidungsfindung und Demokratisierung von Daten von grundlegender Bedeutung ist. Von einfachen, bedarfsorientierten Datenbanken bis hin zu umfangreichen Data Warehouses oder flexiblen NoSQL-Systemen können Sie mit der Azure-Datenplattform die vier Datenaktivitätsbereiche abdecken.

Datensammlung

Das Azure-Datenökosystem umfasst Dienste und Tools zum Migrieren, Erfassen, Speichern und Analysieren von Daten. Die folgende Liste zeigt nur einige der Mechanismen, die Sie verwenden können, um Daten zu verarbeiten und für eine spätere gemeinsame Nutzung verfügbar zu machen, um datengesteuerte Entscheidungsfindung zu erleichtern:

  • Datenanalyse: Azure Synapse Analytics ist ein integrierter Unternehmensanalysedienst zur schnelleren Gewinnung von Erkenntnissen aus Data Warehouses und Big Data-Systemen. Azure Synapse Analytics vereint das Beste aus:
    • SQL-Technologien, die im Data Warehousing für Unternehmen verwendet werden
    • Für Big Data verwendete Spark-Technologien
    • Pipelines für Datenintegration und ETL (Extrahieren, Transformieren, Laden) und ELT (Extrahieren, Laden, Transformieren)
    • Tiefe Integration in andere Microsoft-Dienste wie Power BI, Azure Cosmos DB und Azure Machine Learning
  • Datenmigration: Daten sind möglicherweise bereits in vorhandenen Quellen gespeichert, müssen jedoch zu einer modernen Plattform migriert werden, bevor sie in umsetzbare Erkenntnisse konvertiert werden können. Azure Database Migration Service enthält Tools, die bei Datenmigrationen von Systemen wie SQL Server, PostgreSQL, Oracle und MongoDB helfen.
  • Datenverarbeitung: Azure umfasst Dienste zum Analysieren und Transformieren von Datenströmen mit Azure Stream Analytics und zum Ausführen von ETL-Prozessen im großem Stil mit Azure Data Factory.

Datenfreigabe

Microsoft Power BI ist ein Satz von Tools, die Daten aus unterschiedlichen Quellen in integrierten interaktiven Visualisierungen konsolidieren. Die Benutzer können durch intuitive Steuerelemente einfach in die Daten eintauchen. Die Macht der Erkenntnisse steht jedem Mitarbeiter eines Unternehmens zur Verfügung, nicht nur Datenexperten.

Bereichsbesitzer können Berichte und Dashboards erstellen, die die relevanten Informationen zu bestimmten Aspekten der Anwendung enthalten. Nachdem neue Funktionen eingeführt wurden, um eine Hypothese zu validieren, sind Daten verfügbar, um die Hypothese basierend auf der tatsächlichen Kundennutzung entweder zu validieren oder abzulehnen.

Microsoft Power BI kann bei der Datenfreigabe aus mehreren Perspektiven helfen. Hier einige Beispiele:

  • Freigeben von Daten für Kollegen und Partner: Power BI-Dashboards vereinfachen die Nutzung von Daten. Visualisierungen ermöglichen es Personen, die keine Datenexperten sind, einen Drilldown in Daten durchzuführen, ohne mit der zugrunde liegenden Struktur vertraut sein zu müssen.
  • Schnelles Generieren von Datenerkenntnissen: Power BI kann mit Quick Insights-Funktionen automatisch Visualisierungen von Datensätzen generieren. Sie können Dashboards schnell erstellen und Datenkorrelationen ermitteln, die zunächst nicht offensichtlich waren.
  • Einbetten von Berichten in eine Website oder ein Portal: Mit Power BI können Sie nicht nur im nativen Power BI-Portal auf Visualisierungen zugreifen, sondern Berichte und Dashboards auch in andere Webanwendungen einbetten. Auf diese Weise müssen Benutzer ihre vertrauten Unternehmenswebseiten nicht verlassen, um die Daten zu finden, die sie für ihren Entscheidungsprozess benötigen.

Zentralisierung von Daten

Das Hauptproblem der Datenzentralisierung ist die Skalierung auf unterschiedlichen Ebenen. Auch auf die Gefahr hin, das Ganze zu sehr zu vereinfachen, kann es auf die drei Vs von Big Data reduziert werden:

  • Volume (Umfang): Azure Data Lake Storage Gen2 ist die kostengünstigste und skalierbarste Azure-Plattform für Datenspeicherung. Basierend auf der enormen Skalierbarkeit von Azure Storage wurde Azure Data Lake Storage für mehrere Petabyte Informationen entwickelt und unterstützt gleichzeitig Hunderte von Gigabit Durchsatz.
  • Variety (Vielfalt): Dieser Begriff bezieht sich häufig auf die Tatsache, dass Daten nicht immer strukturiert sind. Möglicherweise verfügen Sie auch über teilstrukturierte und sogar über unstrukturierte Daten. Azure Synapse glänzt in diesem Bereich, weil es die besten SQL-Technologien, die in Data Warehousing für Unternehmen verwendet werden, mit Spark vereint, das häufig für Big Data verwendet wird.
  • Velocity (Schnelligkeit): Ein Problem, das häufig in älteren Datenarchitekturen auftritt, ist die gegenseitige Abhängigkeit zwischen Speicherkapazität, Analysegeschwindigkeit und Erfassungsraten. Bei Azure-Datenlösungen kann ein Unternehmen verschiedene Dimensionen der Plattform unabhängig voneinander skalieren, indem es sie entkoppelt. Daten können über Datenpipelines, die die erforderlichen Azure-Datendienste verwenden, erfasst, verarbeitet und freigegeben werden, wie die Business Intelligence-Architektur für Unternehmen zeigt.

Datengovernance

In der heutigen Welt stellen Daten eine wichtige Ressource sowie eine erhebliche Verantwortung dar. Gespeicherte Daten enthalten oft vertrauliche Informationen, die zu finanziellem oder persönlichem Schaden führen können, wenn sie an die Öffentlichkeit gelangen oder auf unangemessene Weise weitergegeben werden. Das Speichern und Verarbeiten von Daten bedeutet implizit, dass eine Organisation diese Verantwortung übernimmt. Rechtliche Vorschriften können dazu führen, dass Organisationen personenbezogene oder vertrauliche Daten falsch behandeln.

Daher ist Datengovernance für jede Organisation mit dem Ziel der Demokratisierung von Daten von entscheidender Bedeutung. Der erste Schritt in Richtung Datengovernance besteht darin, Daten, die auf bestimmte Weise behandelt werden müssen, zu klassifizieren. Microsoft verwendet diese Datenkategorien beispielsweise intern zur Datenklassifizierung:

  • Nicht geschäftlich: Daten aus Ihrem Privatleben, die nicht zu Microsoft gehören.
  • Öffentlich: Geschäftsdaten, die frei verfügbar und für den öffentlichen Gebrauch genehmigt sind.
  • Allgemein: Geschäftsdaten, die nicht für eine öffentliche Zielgruppe bestimmt sind.
  • Vertraulich: Geschäftsdaten, die Microsoft bei Weitergabe Schaden zufügen können.
  • Streng vertraulich: Geschäftsdaten, die bei Weitergabe Microsoft erheblichen Schaden zufügen würden.

Der nächste Schritt nach der Datenklassifizierung besteht darin, sicherzustellen, dass jede Datenkategorie vor nicht autorisiertem Zugriff geschützt ist. Azure unterstützt die folgenden Technologien, die Vertraulichkeit durchsetzen:

  • Verschlüsselung ruhender Daten: Alle Azure-Daten werden verschlüsselt, wenn sie in Microsoft-Rechenzentren gespeichert werden. Einige Azure-Dienste bieten spezielle Verschlüsselungsfeatures, z. B. Transparent Data Encryption in Azure Synapse und Azure SQL-Datenbank.
  • Verschlüsselung von Daten während der Übertragung: Daten werden von allen Azure-Datendiensten mit TLS/SSL verschlüsselt, bevor sie über das Netzwerk gesendet werden. Einige Dienste wie Azure Storage können optional auch unverschlüsselten Datenverkehr zulassen. Organisationen sollten jegliche unverschlüsselte Kommunikation für jede Art von vertraulichen Daten deaktivieren.
  • Datenzugriffssteuerung: Azure bietet komplexe Authentifizierungs- und Autorisierungsmechanismen sowohl für den Zugriff auf die Azure-Plattform als auch für den Zugriff auf die Daten selbst. Rollenbasierte Zugriffssteuerung in Azure, bedingter Zugriff und Privileged Identity Management sind drei Beispiele für wichtige Dienste, mit denen sichergestellt werden kann, dass nur berechtigte Personen Zugriff auf vertrauliche Informationen besitzen.
  • Datenüberwachung: Viele Standards zur Einhaltung gesetzlicher Bestimmungen erfordern Nachweise der Datenschutzmechanismen, indem dokumentiert wird, wer bestimmte Vorgänge ausgeführt hat und auf welche Daten zugegriffen wurde. Wie unter Überwachung für Azure SQL-Datenbank und Azure Synapse Analytics beschrieben, fasst die Datenüberwachung in Azure drei Aspekte der Überwachung ins Auge:
    • Aufbewahrung: Bewahren Sie ein Überwachungsprotokoll für ausgewählte Ereignisse auf, in dem Kategorien von Datenaktionen definiert sind, die überwacht werden sollen.
    • Berichte: Erstellen Sie Berichte zur Datenbankaktivität, für den schnellen Einstieg optional anhand von vorkonfigurierten Berichten und Dashboards.
    • Analysen: Analysieren Sie Berichte, um verdächtige Ereignisse, ungewöhnliche Aktivitäten und Trends aufzudecken.

Wachstumsorientierte Mentalität

Die Lernphase liefert nicht immer gute Nachrichten. Hypothesen, die Sie für richtig gehalten haben, können sich als falsch erweisen. Offen für alternative Ideen zu sein, ist der Schlüssel für einen reibungslosen Ablauf des Innovationsprozesses. Vielleicht war die gesamte Hypothese falsch, oder vielleicht war nur die Art und Weise problematisch, in der der Prototyp entwickelt wurde.

In jedem Fall sollten Schlussfolgerungen immer durch Daten gestützt werden. Das Team sollte mit der Formulierung der nächsten Hypothese fortfahren, möglicherweise eine Art Überarbeitung oder Iteration der ursprünglichen Hypothese.

Vorhandene Daten lassen möglicherweise keinen eindeutigen Rückschluss darauf zu, ob die Hypothese richtig oder falsch war. In diesem Fall sollte das Dataset, das den Entscheidungsprozess unterstützt, verbessert werden. Führen Sie entweder neue Telemetriepunkte in der Anwendung ein, oder finden Sie neue Wege, um Informationen zur Kundenerfahrungen zu erhalten.

Wachstumsmentalität ist in dieser Phase von grundlegender Bedeutung. Betrachten Sie Hypothesen, die sich als falsch oder teilweise falsch herausstellen, als Lernchance. Unternehmen sollten keine Zeit mit einer Innovation verschwenden, die nicht die erwarteten Geschäftsergebnisse liefert.

Wo als nächstes gesucht werden sollte

Viele der Konzepte in dieser Einheit werden in der Dokumentation des Cloud Adoption Frameworks über Datendemokratisierung näher erläutert.