Wanneer gebruikt u Azure Data Explorer?

Voltooid

Hier bespreken we hoe u kunt bepalen of Azure Data Explorer de juiste keuze is voor uw big data-analysebehoeften. Door de volgende criteria te beoordelen, kunt u bepalen of Azure Data Explorer voldoet aan uw prestatie- en functionele doelstellingen.

  • Interactieve analyse
  • Gegevensvariant
  • Snelheid van gegevens
  • Gegevensvolume
  • Gegevensorganisatie
  • Gelijktijdigheid van query's
  • Bouwen versus kopen

Beslissingscriteria

Azure Data Explorer is een interactief analyseplatform voor big data waarmee mensen gegevensgestuurde beslissingen kunnen nemen in een zeer flexibele omgeving. De factoren die hier worden vermeld, kunnen u helpen om te beoordelen of Azure Data Explorer geschikt is voor de workload die u bij de hand hebt. Stel uzelf de volgende belangrijke vragen:

Interactieve analyse

Moet ik gegevens interactief analyseren?

Gegevensanalyse omvat technieken zoals aggregatie, bereik, evaluatie, correlatie, anomaliedetectie, prognoses en algemene modelevaluatie waarmee grote hoeveelheden gegevens in bruikbare conclusies kunnen worden verminderd. Het interactief uitvoeren van dergelijke activiteiten is waar Azure Data Explorer over gaat. Deze activiteiten kunnen plaatsvinden in interactieve dashboards, analytische aangepaste toepassingen of via directe interactie met gegevens via gebruiksvriendelijke query's en visualisaties. Azure Data Explorer is mogelijk niet de juiste technologie voor het uitvoeren van langlopende batchtaken via gegevens. Overweeg technologieën zoals Microsoft Spark te gebruiken die goed werken met Azure Data Explorer voor langlopende taken.

Gegevensvariant

Hoe gevarieerd is mijn gegevensstructuur?

Azure Data Explorer biedt schaalbare volledige-tekstindex en dynamische schemaondersteuning voor hoge prestaties. Als u gestructureerde, semi-gestructureerde (json/xml) en texturale gegevens wilt analyseren en verwerken, is het een goede indicatie dat Azure Data Explorer relevant is voor uw workload.

Snelheid van gegevens

Is realtime gegevensanalyse een kritieke factor?

Azure Data Explorer kan snel en in lage latentie enorme hoeveelheden gegevens opnemen. Typische gegevenssets zijn traceringen, transactielogboeken, tijdreeksen, metrische gegevens en in het algemeen activiteitsrecordstromen. Bijna realtime analyse van nieuwe gegevens is een veelvoorkomende use-case. Azure Data Explorer maakt verbinding met streamingtechnologieën zoals Azure Event Hubs, IoT-hubs, Kafka om dergelijke workloads mogelijk te maken. Als er echter realtime analyses nodig zijn, is Azure Data Explorer mogelijk niet de beste optie.

Gegevensvolume

Hoeveel gegevens moet ik opnemen?

Azure Data Explorer is gebouwd om dynamische padanalyses te bieden, interactief en via API, via enorme gegevensworkloads. Voor scenario's waarbij de totale totale gegevensgrootte een paar gigabytes is, zijn er mogelijk andere kostenefficiëntere oplossingen.

Gegevensorganisatie

Hoe consistent zijn mijn gegevens georganiseerd?

Azure Data Explorer is gebouwd om schema-on-read toe te passen op onbewerkte gegevens. Deze aanpak creëert flexibiliteit om gegevens op verschillende manieren en vanuit verschillende standpunten te onderzoeken op basis van de huidige behoeften. Deze mogelijkheid is waardevol voor het omgaan met onverwachte uitdagingen in beveiligings-, operationele en concurrerende omgevingen onder andere. Azure Data Explorer biedt extreme snelheid, schaalbaarheid en kostenefficiëntie voor het analyseren van onbewerkte gegevens. Vaak genereert een ETL-proces (extract, transform, load) regelmatig een goed samengestelde, zeer consistente en goed gedocumenteerde set entiteiten en kenmerken. Analyse van deze complexe sterschema's omvat meestal grote fact-to-fact-joins waarvoor Azure Data Explorer niet is geoptimaliseerd.

Gelijktijdigheid van query's

Hoeveel gebruikers moeten tegelijkertijd gegevens opvragen/opnemen/verwerken?

Azure Data Explorer wordt breed gebruikt voor het implementeren van SaaS-aanbiedingen voor analyses. Als er ondersteuning moet worden geboden voor verschillende en unieke analysebehoeften van een groot aantal aanvragen parallel, moet Azure Data Explorer een goede oplossing bieden.

Bouwen versus kopen

Hoeveel wil ik mijn gegevensplatform aanpassen?

Azure Data Explorer is een volledig beheerd platform als een service. Het biedt echter geen kant-en-klare oplossing. Hiervoor is wel het aanpassen, configureren, verbinden en maken van ervaringen nodig om een oplossing (build) te leveren. Er zijn verschillende oplossingen, van Microsoft en derden die Gebruikmaken van Azure Data Explorer om dergelijke kant-en-klare oplossingen in verschillende domeinen en verticalen te leveren. Bijvoorbeeld Azure Monitor voor IT-bewerkingen. Microsoft Advanced Threat Protection en Microsoft Sentinel in het beveiligingsdomein, Azure Time Series Insights en Azure IoT Central in de IoT-domeinen.

De criteria toepassen

Azure Data Explorer werkt het beste voor het inschakelen van interactieve analysemogelijkheden voor kenniswerkers met een hoge snelheid, diverse onbewerkte gegevens. Laten we eens nadenken over het toepassen van de criteria die we eerder hebben vermeld op onze voorbeeldprocessen in het scenario van het kledingbedrijf.

Moet Azure Data Explorer worden gebruikt voor productiegegevens?

De productieafdeling van ons voorbeeldkledingbedrijf moet beslissingen nemen over het beheren van voorraad- en productievolumes. Ze hebben binnenkomende logboeken met gegevens voor inventaris. Ze willen ook georuimtelijke gegevens van marketing gebruiken om te anticiperen op productbehoeften per regio. Deze gegevens hebben een hoge mate van verscheidenheid, snelheid en volume. Het is niet consistent georganiseerd en veel belanghebbenden moeten deze gegevens gelijktijdig opvragen. Van opname tot query vereisen ze lage latentie. Ze hebben reactietijden van query's nodig van minder dan een seconde en hoger. Op basis van de beslissingscriteria is Azure Data Explorer geschikt voor de productieafdeling van het kledingbedrijf.

Moet Azure Data Explorer worden gebruikt voor marketinggegevens?

De marketingafdeling van het kledingbedrijf wil de effectiviteit van hun campagne evalueren. Ze hebben clickstreamgegevens van hun website en advertentiecampagnes. Ze hebben ook vrije tekstgegevens (ongestructureerde) gegevens van sociale media. Deze gegevens zijn zeer gevarieerd en ongeordend. De afdeling wil verkennende interactieve analyses uitvoeren. Op basis van de beslissingscriteria is Azure Data Explorer geschikt voor de marketingafdeling van het kledingbedrijf.

Samenvatting van de richtlijnen

In de volgende tabel ziet u hoe u nieuwe use cases evalueert. Hoewel hier geen gebruiksscenario's worden behandeld, kunnen we u hierbij helpen bepalen of Azure Data Explorer de juiste oplossing voor u is.

Gebruiksscenario Interactieve analyse Big data (Variety, Velocity, Volume) Gegevensorganisatie Gelijktijdigheid Bouwen versus kopen Moet ik Azure Data Explorer gebruiken?
Een Security Analytics SaaS implementeren Intensief gebruik van interactieve, bijna realtime analyse. Beveiligingsgegevens zijn divers, hoog volume en hoge snelheid. Varieert Het systeem wordt vaak gebruikt door meerdere analisten van meerdere tenants. Het implementeren van een SaaS-aanbieding is een buildscenario . Ja
CDN Log Analytics Interactief voor probleemoplossing, QoS-bewaking. CDN-logboeken zijn divers, hoog volume en hoge snelheid. Afzonderlijke logboekrecords. Een kleine groep gegevenswetenschappers kunnen deze analyses gebruiken, maar het kan ook veel dashboards aandrijven. De waarde die is geëxtraheerd uit CDN-analyse is scenariospecifiek en vereist aangepaste analyses. Ja
Tijdreeksdatabase voor IoT-telemetrie Interactief voor het oplossen van problemen, het analyseren van trends, het gebruik en het detecteren van afwijkingen. IoT-telemetrie is snel, maar kan alleen of gemiddeld zijn gestructureerd. Gerelateerde recordsets. Een kleine groep gegevenswetenschappers kunnen deze analyses gebruiken, maar het kan ook veel dashboards aandrijven. De context wordt doorgaans gebouwd bij het zoeken naar een database. Ja

De volgende tabel met stroomdiagrammen bevat een overzicht van de belangrijkste vragen die u moet stellen wanneer u Azure Data Explorer gebruikt.

Stroomdiagram waarin wordt weergegeven wanneer u Azure Data Explorer gebruikt. Vragen zijn: moet u een specifieke record lezen en schrijven, moet u langlopende taken uitvoeren, klassiek datawarehouse, moeten worden uitgevoerd in andere clouds en kleine gegevens.