Einführung

Abgeschlossen

Viele Organisationen nutzen heutzutage Big Data. Die extrem große Datenmenge und die Vielfalt der Daten sowie die Geschwindigkeit der Datengenerierung machen Systeme notwendig, die Sie bei der Verwaltung und Steuerung unterstützen. In der Vergangenheit haben Organisationen relationale Datenbankmanagementsysteme für die Steuerung der Daten verwendet. Heute erwarten Organisationen jedoch die Funktionalität von Open-Source-Software zusammen mit den Vorteilen gehosteter Plattformen. Azure HDInsight ist das perfekte Beispiel für eine solche Partnerschaft. HDInsight bietet die Möglichkeit, Big Data in vielen Szenarien unter Verwendung von historischen Daten oder Echtzeitdaten zu verarbeiten.

Die folgende Grafik enthält eine Übersicht über die Verwendungsmöglichkeiten von HDInsight. Es werden mehrere Datenquellen wie IoT-Sensoren (Internet der Dinge), Datenbanken und mehrere Azure-Datenspeicher veranschaulicht. HDInsight verarbeitet Daten in diesen Speicherorten. Anschließend werden die Daten für Echtzeit-Apps und weitere Analysen langfristig gespeichert und zur Verfügung gestellt.

Diagram of the architecture of HDInsight in a typical organization, depicting several data sources from which it manages big data.

Beispielszenario

Angenommen, Sie arbeiten für eine Organisation, die Workloads erstellt, die Daten für historische Berichte und erweiterte Analysen erfassen. Eventuell verfügen Sie auch über Streamingdaten, die analysiert werden müssen. In dieser Situation sollten Sie die Verwendung von HDInsight in Betracht ziehen. Damit können Sie alle Daten in einem einzelnen Data Lake-Speicherort erfassen. Danach können Sie die folgenden Workloads verwalten:

  • Batchverarbeitung
  • Data Warehousing
  • Data Science-Vorgänge
  • Streaming

Was werden wir tun?

Am Ende dieses Moduls können Sie bewerten, ob HDInsight Ihre Organisation bei der Verarbeitung von Big Data unterstützen kann. Sie können außerdem beschreiben, wie HDInsight gängige Open-Source-Frameworks verwendet, die viele Datenszenarien unterstützen.

Was ist das Hauptziel?

Das Hauptziel besteht darin, festzustellen, ob HDInsight eine geeignete Wahl für Ihre Big Data-Verarbeitungsanforderungen ist.