Erstellen einer IoT-Lösung mithilfe von Stream Analytics
Einführung
Anhand dieser Lösung wird beschrieben, wie Sie mit Azure Stream Analytics in Echtzeit Einblicke in Ihre Daten erhalten. Entwickler können Datenströme, z.B. Klickstreams, Protokolle und von Geräten generierte Ereignisse, leicht mit Verlaufsdatensätzen oder Referenzdaten kombinieren, um geschäftliche Erkenntnisse zu gewinnen. Da Azure Stream Analytics ein vollständig verwalteter Dienst für die Datenstromberechnung in Echtzeit ist, der in Microsoft Azure gehostet wird, bietet er integrierte Resilienz, Skalierbarkeit sowie geringe Latenz und ist innerhalb von Minuten einsatzbereit.
Nachdem Sie diese Lösung durchgearbeitet haben, verfügen Sie über folgende Kenntnisse:
- Kennenlernen des Azure Stream Analytics-Portals
- Konfigurieren und Bereitstellen eines Streamingauftrags
- Formulieren von realen Problemen und Durchführen der Behebung mithilfe der Stream Analytics-Abfragesprache
- Problemloses Entwickeln von Streaminglösungen für Ihre Kunden mit Stream Analytics
- Verwenden der Überwachung und Protokollierung beim Beheben von Problemen
Voraussetzungen
Zum Ausführen der Schritte dieser Lösung benötigen Sie Folgendes:
Einführung in das Szenario: „Hallo, Mautstation!“
Eine Mautstation ist eine bekannte Einrichtung. Es gibt sie auf vielen Autobahnen und an Brücken und Tunneln auf der ganzen Welt. Jede Mautstation umfasst mehrere Mauthäuschen. An Häuschen mit manueller Bezahlung halten Sie an und entrichten den Mautbetrag bei der zuständigen Person. Bei Häuschen mit automatisierter Bezahlung wird mit einem Sensor oben auf dem Häuschen eine RFID-Karte abgetastet, die an der Windschutzscheibe Ihres Fahrzeugs angebracht ist, während Sie das Mauthäuschen passieren. Es ist einfach, die Durchfahrt von Fahrzeugen durch diese Mautstellen als einen Strom von Ereignissen zu visualisieren, über den interessante Vorgänge ausgeführt werden können.
Eingehende Daten
In dieser Lösung werden zwei Datenströme verwendet. Mit Sensoren, die am Eingang und Ausgang der Mautstationen installiert sind, wird der erste Datenstrom produziert. Der zweite Datenstrom ist ein statisches Suchdataset mit Daten zur Fahrzeugregistrierung.
Eingangsdatenstrom
Der Eingangsdatenstrom enthält Informationen zu den Fahrzeugen, die in Mautstationen einfahren. Die Ereignisse des Ausgangsdatenstroms werden von einer Web-App, die in der Beispiel-App enthalten ist, live in einen Event Hub gestreamt.
| TollID | EntryTime | LicensePlate | State | Make | Model | VehicleType | VehicleWeight | Toll | Tag |
| --- | --- | --- | --- | --- | --- | --- | --- | --- | --- |
| 1 |2014-09-10 12:01:00.000 |JNB 7001 |NY |Honda |CRV |1 |0 |7 | |
| 1 |2014-09-10 12:02:00.000 |YXZ 1001 |NY |Toyota |Camry |1 |0 |4 |123456789 |
| 3 |2014-09-10 12:02:00.000 |ABC 1004 |CT |Ford |Taurus |1 |0 |5 |456789123 |
| 2 |2014-09-10 12:03:00.000 |XYZ 1003 |CT |Toyota |Corolla |1 |0 |4 | |
| 1 |2014-09-10 12:03:00.000 |BNJ 1007 |NY |Honda |CRV |1 |0 |5 |789123456 |
| 2 |2014-09-10 12:05:00.000 |CDE 1007 |NJ |Toyota |4x4 |1 |0 |6 |321987654 |
Nachfolgend finden Sie eine kurze Beschreibung der Spalten:
Column | BESCHREIBUNG |
---|---|
TollId | Mauthäuschen-ID zur eindeutigen Identifizierung des Mauthäuschens |
EntryTime | Datum und Uhrzeit der Einfahrt des Fahrzeugs in das Mauthäuschen in UTC |
LicensePlate | Nummernschild des Fahrzeugs |
State | Bundesstaat (USA) |
Make | Der Fahrzeughersteller |
Modell | Modellnummer des Fahrzeugs |
VehicleType | 1 für Privatfahrzeuge oder 2 für Nutzfahrzeuge |
WeightType | Fahrzeuggewicht in Tonnen; „0“ für Pkws |
Toll | Die Mautgebühr in US-Dollar |
Tag | Nummer des elektronischen Geräts („ETag“) im Fahrzeug, das die automatische Zahlung ermöglicht. Bei nicht-automatischer Zahlung bleibt diese Spalte leer. |
Ausgangsdatenstrom
Der Ausgangsdatenstrom enthält Informationen zu den Fahrzeugen, die aus der Mautstelle ausfahren. Die Ereignisse des Ausgangsdatenstroms werden von einer Web-App, die in der Beispiel-App enthalten ist, live in einen Event Hub gestreamt.
TollId | ExitTime | LicensePlate |
---|---|---|
1 | 2014-09-10T12:03:00Z | JNB 7001 |
1 | 2014-09-10T12:03:00Z | YXZ 1001 |
3 | 2014-09-10T12:04:00Z | ABC 1004 |
2 | 2014-09-10T12:07:00Z | XYZ 1003 |
1 | 2014-09-10T12:08:00Z | BNJ 1007 |
2 | 2014-09-10T12:07:00Z | CDE 1007 |
Nachfolgend finden Sie eine kurze Beschreibung der Spalten:
Column | BESCHREIBUNG |
---|---|
TollId | Mauthäuschen-ID zur eindeutigen Identifizierung des Mauthäuschens |
ExitTime | Datum und Uhrzeit der Ausfahrt des Fahrzeugs aus einem Mauthäuschen in UTC |
LicensePlate | Nummernschild des Fahrzeugs |
Registrierungsdaten von Nutzfahrzeugen
In der Lösung wird eine statische Momentaufnahme der Registrierungsdatenbank für Nutzfahrzeuge verwendet. Diese Daten werden als JSON-Datei in Azure-Blobspeicher gespeichert, der im Beispiel enthalten ist.
LicensePlate | RegistrationId | Abgelaufen |
---|---|---|
SVT 6023 | 285429838 | 1 |
XLZ 3463 | 362715656 | 0 |
BAC 1005 | 876133137 | 1 |
RIV 8632 | 992711956 | 0 |
SNY 7188 | 592133890 | 0 |
ELH 9896 | 678427724 | 1 |
Nachfolgend finden Sie eine kurze Beschreibung der Spalten:
Column | BESCHREIBUNG |
---|---|
LicensePlate | Nummernschild des Fahrzeugs |
RegistrationId | ID der Fahrzeugregistrierung |
Abgelaufen | Der Registrierungsstatus des Fahrzeugs: „0“, wenn das Fahrzeug registriert ist, und „1“, wenn die Registrierung abgelaufen ist |
Einrichten der Umgebung für Azure Stream Analytics
Sie benötigen ein Microsoft Azure-Abonnement, um diese Lösung durchzuarbeiten. Wenn Sie nicht über ein Azure-Konto verfügen, können Sie eine kostenlose Testversion anfordern.
Stellen Sie sicher, dass Sie am Ende dieses Artikels die Anleitung zum Bereinigen Ihres Azure-Kontos befolgen, damit Sie Ihre Azure-Gutschrift bestmöglich nutzen können.
Bereitstellen des Beispiels
Es sind verschiedene Ressourcen vorhanden, die mit wenigen Klicks zusammen in einer Ressourcengruppe bereitgestellt werden können. Die Lösungsdefinition wird im GitHub-Repository unter https://github.com/Azure/azure-stream-analytics/tree/master/Samples/TollApp gehostet.
Bereitstellen der TollApp-Vorlage im Azure-Portal
Verwenden Sie den Link zum Bereitstellen der TollApp-Azure-Vorlage, um die TollApp-Umgebung in Azure bereitzustellen.
Melden Sie sich am Azure-Portal an, wenn Sie dazu aufgefordert werden.
Wählen Sie das Abonnement aus, unter dem die unterschiedlichen Ressourcen abgerechnet werden.
Geben Sie eine neue Ressourcengruppe mit einem eindeutigen Namen an, z.B.
MyTollBooth
.Wählen Sie einen Azure-Standort aus.
Geben Sie ein Intervall in Sekunden an. Dieser Wert wird in der Beispiel-Web-App verwendet, um anzugeben, wie oft Daten an den Event Hub gesendet werden sollen.
Aktivieren Sie das Kontrollkästchen, um den Geschäftsbedingungen zuzustimmen.
Wählen Sie An Dashboard anheften, damit Sie die Ressourcen später leicht finden können.
Wählen Sie Kaufen, um die Beispielvorlage bereitzustellen.
Nach kurzer Zeit wird eine Benachrichtigung mit dem Hinweis Bereitstellung erfolgreich angezeigt.
Überprüfen der Azure Stream Analytics-TollApp-Ressourcen
Melden Sie sich beim Azure-Portal an.
Suchen Sie nach der Ressourcengruppe, der Sie im vorherigen Abschnitt einen Namen gegeben haben.
Überprüfen Sie, ob die folgenden Ressourcen in der Ressourcengruppe aufgeführt sind:
- Ein Azure Cosmos DB-Konto
- Ein Azure Stream Analytics-Auftrag
- Ein Azure-Speicherkonto
- Ein Azure Event Hub
- Zwei Web-Apps
Erkunden des Beispiels für einen TollApp-Auftrag
Wählen Sie für die Ressourcengruppe aus dem vorherigen Abschnitt den Stream Analytics-Streamingauftrag aus, der mit dem Namen
tollapp
beginnt (aus Gründen der Eindeutigkeit enthält der Name zufällige Zeichen).Beachten Sie auf der Seite Übersicht des Auftrags das Feld Abfrage, um die Abfragesyntax anzuzeigen.
SELECT TollId, System.Timestamp AS WindowEnd, COUNT(*) AS Count INTO CosmosDB FROM EntryStream TIMESTAMP BY EntryTime GROUP BY TUMBLINGWINDOW(minute, 3), TollId
Das Ziel der Abfrage lässt sich auch anhand des folgenden Beispiels darstellen: Angenommen, Sie müssen die Fahrzeuge zählen, die ein Mauthäuschen passieren. Da das Mauthäuschen an einer Straße über einen kontinuierlichen Strom von ankommenden Fahrzeugen verfügt, sind diese Ereignisse mit einem analogen Datenstrom vergleichbar, der niemals endet. Zum Quantifizieren des Datenstroms müssen Sie einen „Zeitraum“ für die Messung definieren. Sie verfeinern die Frage also weiter: „Wie viele Fahrzeuge passieren ein Mauthäuschen jeweils innerhalb von drei Minuten?“ Dies wird für gewöhnlich als „Rollierende Anzahl“ bezeichnet.
Es ist erkennbar, dass in Azure Stream Analytics eine Abfragesprache verwendet wird, die wie SQL aufgebaut ist und über einige Erweiterungen verfügt, damit die zeitbezogenen Aspekte der Abfrage angegeben werden können. Weitere Informationen finden Sie in den Artikeln zu Zeitmanagement- und Windowing-Konstrukten, die in der Abfrage verwendet werden.
Untersuchen Sie die Eingaben des TollApp-Beispielauftrags. Nur die EntryStream-Eingabe wird in der aktuellen Abfrage verwendet.
- Die EntryStream-Eingabe ist eine Event Hub-Verbindung, bei der Daten, die jeweils für das Ankommen eines Fahrzeugs am Mauthäuschen einer Straße stehen, in eine Warteschlange eingereiht werden. Eine Web-App, die Teil des Beispiels ist, erstellt die Ereignisse, und diese Daten werden im Event Hub in die Warteschlange eingereiht. Beachten Sie, dass diese Eingabe über die FROM-Klausel der Streamingabfrage abgefragt wird.
- Die ExitStream-Eingabe ist eine Event Hub-Verbindung, bei der Daten, die jeweils für das Ausfahren eines Fahrzeugs aus dem Mauthäuschen einer Straße stehen, in eine Warteschlange eingereiht werden. Diese Streamingeingabe wird in späteren Varianten der Abfragesyntax verwendet.
- Die Eingabe Registration (Registrierung) ist eine Azure-Blobspeicherverbindung und verweist auf die statische Datei „registration.json“, die je nach Bedarf für Suchvorgänge verwendet wird. Diese Referenzdateneingabe wird in späteren Varianten der Abfragesyntax verwendet.
Untersuchen Sie die Ausgaben des TollApp-Beispielauftrags.
- Die Azure Cosmos DB-Ausgabe ist ein Azure Cosmos DB-Datenbankcontainer, der die Ausgabesenkenereignisse empfängt. Beachten Sie, dass diese Ausgabe in der INTO-Klausel der Streamingabfrage verwendet wird.
Starten des TollApp-Streamingauftrags
Führen Sie diese Schritte aus, um den Streamingauftrag zu starten:
Wählen Sie auf der Seite Übersicht des Auftrags die Option Starten.
Wählen Sie im Bereich Auftrag starten die Option Jetzt.
Wenn der Auftrag ausgeführt wird, können Sie nach kurzer Zeit auf der Seite Übersicht des Streamingauftrags den Graphen Überwachung anzeigen. Im Graphen sollten mehrere Tausend Eingabeereignisse und Dutzende von Ausgabeereignissen angezeigt werden.
Überprüfen der Azure Cosmos DB-Ausgabedaten
Suchen Sie nach der Ressourcengruppe, die die TollApp-Ressourcen enthält.
Wählen Sie das Azure Cosmos DB-Konto mit dem Namensmuster tollapp<random>-cosmos aus.
Wählen Sie die Überschrift Daten-Explorer, um die Seite mit dem Daten-Explorer zu öffnen.
Erweitern Sie tollAppDatabase>tollAppCollection>Dokumente.
In der Liste mit den IDs werden mehrere Dokumente angezeigt, nachdem die Ausgabe verfügbar ist.
Wählen Sie jeweils die ID aus, um sich ein JSON-Dokument anzusehen. Beachten Sie jeweils die
tollid
, diewindowend time
und diecount of cars
eines Fensters.Nach weiteren drei Minuten ist eine weitere Gruppe von vier Dokumenten verfügbar – ein Dokument pro
tollid
.
Gesamtberichtszeit pro Fahrzeug
Die durchschnittliche Zeit, die ein Fahrzeug zum Passieren des Mauthäuschens benötigt, trägt zur Bewertung der Effizienz des Prozesses und der Benutzerfreundlichkeit für Kunden bei.
Verknüpfen Sie zum Ermitteln der Gesamtzeit den EntryTime-Datenstrom mit dem ExitTime-Datenstrom. Verknüpfen Sie die beiden Eingabedatenströme für die übereinstimmenden Spalten „TollId“ und „LicensePlate“. Beim Operator JOIN müssen Sie einen zeitlichen Spielraum angeben, um die akzeptable Zeitdifferenz zwischen den verknüpften Ereignissen zu beschreiben. Verwenden Sie die Funktion DATEDIFF, um anzugeben, dass Ereignisse nicht mehr als 15 Minuten auseinander liegen sollen. Wenden Sie die Funktion DATEDIFF außerdem auf Ausfahrts- und Einfahrtszeiten an, um die genaue Zeit zu berechnen, die ein Fahrzeug in der Mautstation verbringt. Beachten Sie den Unterschied bei der Verwendung der Funktion DATEDIFF in einer SELECT-Anweisung im Vergleich zu einer JOIN-Bedingung.
SELECT EntryStream.TollId, EntryStream.EntryTime, ExitStream.ExitTime, EntryStream.LicensePlate, DATEDIFF (minute, EntryStream.EntryTime, ExitStream.ExitTime) AS DurationInMinutes
INTO CosmosDB
FROM EntryStream TIMESTAMP BY EntryTime
JOIN ExitStream TIMESTAMP BY ExitTime
ON (EntryStream.TollId= ExitStream.TollId AND EntryStream.LicensePlate = ExitStream.LicensePlate)
AND DATEDIFF (minute, EntryStream, ExitStream ) BETWEEN 0 AND 15
Aktualisieren Sie die Abfragesyntax des TollApp-Streamingauftrags wie folgt:
Wählen Sie auf der Seite Übersicht des Auftrags die Option Beenden.
Warten Sie kurz auf die Benachrichtigung, dass der Auftrag beendet wurde.
Wählen Sie unter der Überschrift „AUFTRAGSTOPOLOGIE“ die Option <> Abfrage aus.
Fügen Sie die angepasste SQL-Streamingabfrage ein.
Wählen Sie Speichern, um die Abfrage zu speichern. Bestätigen Sie den Vorgang mit Ja, um die Änderungen zu speichern.
Wählen Sie auf der Seite Übersicht des Auftrags die Option Starten.
Wählen Sie im Bereich Auftrag starten die Option Jetzt.
Überprüfen der Gesamtzeit in der Ausgabe
Wiederholen Sie die Schritte im vorherigen Abschnitt, um die Azure Cosmos DB-Ausgabedaten aus dem Streamingauftrag zu überprüfen. Überprüfen Sie die neuesten JSON-Dokumente.
In diesem Dokument werden beispielsweise ein Beispielfahrzeug mit einem bestimmten Nummernschild, der entrytime
und exit time
und das berechnete DATEDIFF-Feld durationinminutes
mit einer Verweildauer von zwei Minuten angezeigt:
{
"tollid": 4,
"entrytime": "2018-04-05T06:51:39.0491173Z",
"exittime": "2018-04-05T06:53:09.0491173Z",
"licenseplate": "JVR 9425",
"durationinminutes": 2,
"id": "ff52eb25-d580-7566-2879-1f52bba6601e",
"_rid": "+8E4AI1DZgBjAAAAAAAAAA==",
"_self": "dbs/+8E4AA==/colls/+8E4AI1DZgA=/docs/+8E4AI1DZgBjAAAAAAAAAA==/",
"_etag": "\"ad02f6b8-0000-0000-0000-5ac5c8330000\"",
"_attachments": "attachments/",
"_ts": 1522911283
}
Melden von Fahrzeugen mit abgelaufener Registrierung
Azure Stream Analytics kann statische Momentaufnahmen von Referenzdaten mit temporären Datenströmen verknüpfen. Um diese Funktion zu demonstrieren, verwenden wir die folgende Beispielfrage. Die Eingabe „Registration“ (Registrierung) ist eine statische JSON-Blobdatei, in der der Ablauf von Nummernschildmarkierungen aufgeführt ist. Wenn dies mit dem Nummernschild verknüpft wird, werden die Referenzdaten für jedes Fahrzeug verglichen, das das Mauthäuschen passiert.
Wenn ein Nutzfahrzeug bei einer Mautfirma registriert ist, kann es das Mauthäuschen passieren, ohne für eine Kontrolle angehalten zu werden. Verwenden Sie die Nachschlagetabellen für die Registrierung, um alle Nutzfahrzeuge mit abgelaufener Registrierung zu identifizieren.
SELECT EntryStream.EntryTime, EntryStream.LicensePlate, EntryStream.TollId, Registration.RegistrationId
INTO CosmosDB
FROM EntryStream TIMESTAMP BY EntryTime
JOIN Registration
ON EntryStream.LicensePlate = Registration.LicensePlate
WHERE Registration.Expired = '1'
Wiederholen Sie die Schritte des vorherigen Abschnitts, um die Abfragesyntax des TollApp-Streamingauftrags zu aktualisieren.
Wiederholen Sie die Schritte im vorherigen Abschnitt, um die Azure Cosmos DB-Ausgabedaten aus dem Streamingauftrag zu überprüfen.
Beispielausgabe:
{
"entrytime": "2018-04-05T08:01:28.0252168Z",
"licenseplate": "GMT 3221",
"tollid": 1,
"registrationid": "763220582",
"id": "47db0535-9716-4eb2-db58-de7886966cbf",
"_rid": "y+F8AJ9QWACSAQAAAAAAAA==",
"_self": "dbs/y+F8AA==/colls/y+F8AJ9QWAA=/docs/y+F8AJ9QWACSAQAAAAAAAA==/",
"_etag": "\"88007d8d-0000-0000-0000-5ac5d7e20000\"",
"_attachments": "attachments/",
"_ts": 1522915298
}
Aufskalieren des Auftrags
Azure Stream Analytics ist für die elastische Skalierung ausgelegt, damit große Datenmengen verarbeitet werden können. Die Azure Stream Analytics-Abfrage kann eine PARTITION BY-Klausel verwenden, um das System darauf hinzuweisen, dass für diesen Schritt horizontal hochskaliert wird. PartitionId ist eine spezielle Spalte, die vom System hinzugefügt wurde und mit der Partitions-ID der Eingabe (Event Hub) übereinstimmt.
Ändern Sie die Abfragesyntax in den folgenden Code, um die Abfrage für Partitionen aufzuskalieren:
SELECT TollId, System.Timestamp AS WindowEnd, COUNT(*)AS Count
INTO CosmosDB
FROM EntryStream
TIMESTAMP BY EntryTime
PARTITION BY PartitionId
GROUP BY TUMBLINGWINDOW(minute,3), TollId, PartitionId
Skalieren Sie den Streamingauftrag wie folgt auf mehr Streamingeinheiten hoch:
Beenden Sie den aktuellen Auftrag.
Aktualisieren Sie die Abfragesyntax auf der Seite <> Abfrage, und speichern Sie die Änderungen.
Wählen Sie unter der Überschrift „KONFIGURIEREN“ des Streamingauftrags die Option Skalieren.
Verschieben Sie den Schieberegler Streamingeinheiten von 1 auf 6. Mit den Streamingeinheiten wird die Menge an Rechenleistung definiert, die der Auftrag erhalten kann. Wählen Sie Speichern aus.
Starten Sie den Streamingauftrag, um die zusätzliche Skalierung zu demonstrieren. Azure Stream Analytics erreicht eine Verteilung der Arbeit auf mehr Computeressourcen und einen besseren Durchsatz, indem die Arbeit über die in der PARTITION BY-Klausel angegebenen Spalte ressourcenübergreifend partitioniert wird.
Überwachen des Auftrags
Der Bereich MONITOR (ÜBERWACHEN) enthält Statistiken zum laufenden Auftrag. Um das Speicherkonto in der gleichen Region zu verwenden, ist eine erstmalige Konfiguration erforderlich (die Mautstation muss wie der Rest des Dokuments bezeichnet werden).
Sie können auf die Aktivitätsprotokolle auch über das Dashboard für Aufträge im Bereich Einstellungen zugreifen.
Bereinigen der TollApp-Ressourcen
Beenden Sie den Stream Analytics-Auftrag im Azure-Portal.
Suchen Sie nach der Ressourcengruppe, die in Bezug auf die TollApp-Vorlage acht Ressourcen enthält.
Wählen Sie die Option Ressourcengruppe löschen. Geben Sie den Namen der Ressourcengruppe ein, um den Löschvorgang zu bestätigen.
Zusammenfassung
In dieser Lösung haben Sie eine Einführung in den Azure Stream Analytics-Dienst erhalten. Es wurde gezeigt, wie Sie Eingaben und Ausgaben für den Stream Analytics-Auftrag konfigurieren. Mithilfe des Mautdatenszenarios wurden die häufigsten Probleme erläutert, die im Bereich der Daten in Bewegung vorkommen, und es wurde aufgezeigt, wie diese mithilfe von einfachen SQL-ähnlichen Abfragen in Azure Stream Analytics behoben werden können. In der Lösung wurden SQL-Erweiterungskonstrukte für die Arbeit mit temporären Datenströmen beschrieben. Es wurde veranschaulicht, wie Sie Datenströme verknüpfen, den Datenstrom um statische Referenzdaten erweitern und eine Abfrage aufskalieren, um einen höheren Durchsatz zu erzielen.
Die Lösung ist zwar eine gute Einführung, aber bei Weitem nicht erschöpfend. Weitere Abfragemuster mit der SAQL-Sprache finden Sie unter Abfragebeispiele für gängige Stream Analytics-Verwendungsmuster.