Condividi tramite


Output di Azure Esplora dati da Analisi di flusso di Azure

È possibile usare Azure Esplora dati come output per analizzare grandi volumi di dati diversi da qualsiasi origine dati, ad esempio siti Web, applicazioni e dispositivi Internet delle cose (IoT). Esplora dati di Azure è un servizio di esplorazione dati rapido e a scalabilità elevata per dati di log e di telemetria. Consente di gestire i numerosi flussi di dati generati dal software moderno, in modo da poter raccogliere, archiviare e analizzare i dati. Questi dati vengono usati per la diagnostica, il monitoraggio, la creazione di report, l'apprendimento automatico e altre funzionalità di analisi.

Azure Esplora dati supporta diversi metodi di inserimento, inclusi i connettori a servizi comuni, ad esempio Hub eventi di Azure, l'inserimento a livello di codice tramite SDK come .NET e Python e l'accesso diretto al motore a scopo di esplorazione. Esplora dati di Azure si integra con servizi di analisi e modellazione per un'ulteriore analisi e visualizzazione dei dati.

Per altre informazioni sulla Esplora dati di Azure, vedere Che cos'è Azure Esplora dati?.

Per altre informazioni su come creare un cluster di Azure Esplora dati usando il portale di Azure, vedere Avvio rapido: Creare un cluster e un database di Azure Esplora dati.

Nota

Azure Esplora dati da Analisi di flusso di Azure supporta l'output in Azure Synapse Esplora dati. Per scrivere nei cluster in Azure Synapse Esplora dati, specificare l'URL del cluster nel riquadro di configurazione per l'output di Azure Esplora dati nel processo di Analisi di flusso di Azure.

Configurazione di output

La tabella seguente elenca i nomi delle proprietà e le relative descrizioni per la creazione di un output di Azure Esplora dati.

Nome proprietà Descrizione
Alias di output Nome descrittivo usato nelle query per indirizzare l'output della query a questo database.
Subscription Sottoscrizione di Azure da usare per il cluster.
Cluster Nome univoco che identifica il cluster. Il nome di <dominio region.kusto.windows.net> viene aggiunto al nome del cluster specificato. Il nome può contenere solo lettere minuscole e numeri. Deve contenere da 4 a 22 caratteri.
Database Nome del database in cui si sta inviando l'output. Il nome del database deve essere univoco all'interno del cluster.
Authentication Un'identità gestita da Microsoft Entra ID, che consente al cluster di accedere facilmente ad altre risorse protette di Microsoft Entra, ad esempio Azure Key Vault. L'identità viene gestita dalla piattaforma Azure e non è necessario eseguire il provisioning o ruotare alcun segreto. La configurazione dell'identità gestita è attualmente supportata solo per abilitare le chiavi gestite dal cliente per il cluster.
Tabella Nome della tabella in cui viene scritto l'output. Il nome della tabella fa distinzione tra maiuscole e minuscole. Lo schema di questa tabella deve corrispondere esattamente al numero di campi e ai relativi tipi generati dall'output del processo.

Partizionamento

Il partizionamento deve essere abilitato ed è basato sulla PARTITION BY clausola nella query. Quando l'opzione Eredita partizionamento è abilitata, segue il partizionamento di input per le query completamente parallelizzabili.

Quando usare Analisi di flusso di Azure e Azure Esplora dati

Le caratteristiche di Analisi di flusso di Azure includono:

  • Motore di elaborazione dei flussi: analisi in tempo reale continue e in streaming
  • Basato su processi
  • Finestra di lookback da 1 millisecondi a 7 giorni per l'analisi temporale in memoria e l'elaborazione del flusso
  • Inserimento da Hub eventi di Azure e hub IoT di Azure con latenza di sottosecondo

Le caratteristiche di Azure Esplora dati includono:

  • Motore analitico: analisi interattiva in tempo reale su richiesta
  • Inserimento di dati in streaming in un archivio dati persistente, insieme alle funzionalità di query
  • Inserimento di dati da Hub eventi, hub IoT, Archiviazione BLOB di Azure, Azure Data Lake Archiviazione, Kafka, Logstash, Spark e Azure Data Factory
  • Latenza da 10 secondi a 5 minuti per carichi di lavoro con velocità effettiva elevata
  • Trasformazione dei dati semplice tramite un criterio di aggiornamento durante l'inserimento

È possibile aumentare significativamente l'ambito dell'analisi in tempo reale usando Analisi di flusso di Azure e Azure Esplora dati insieme. Ecco alcuni scenari:

  • Analisi di flusso identifica le anomalie in tempo reale e Azure Esplora dati consente di determinare come e perché si sono verificati tramite l'esplorazione interattiva.
  • Analisi di flusso deserializza i flussi di dati in ingresso da usare in Azure Esplora dati (ad esempio, inserire protobuf in formato usando un deserializzatore personalizzato o formati binari personalizzati).
  • Analisi di flusso può aggregare, filtrare, arricchire e trasformare i flussi di dati in ingresso da usare in Azure Esplora dati.

Altri scenari e limitazioni

  • Il nome delle colonne e del tipo di dati deve corrispondere tra la query SQL di Analisi di flusso di Azure e la tabella Esplora dati di Azure. Il confronto fa distinzione tra maiuscole e minuscole.
  • Le colonne presenti nei cluster di Azure Esplora dati ma non sono presenti in Analisi di flusso di Azure vengono ignorate. Le colonne mancanti in Analisi di flusso di Azure generano un errore.
  • L'ordine delle colonne nella query di Analisi di flusso di Azure non è rilevante. Lo schema della tabella Esplora dati di Azure determina l'ordine.
  • Azure Esplora dati ha criteri di aggregazione (invio in batch) per l'inserimento dati progettato per ottimizzare il processo di inserimento. I criteri sono configurati per 5 minuti, 1.000 elementi o 1 GB di dati per impostazione predefinita, quindi è possibile che si verifichi una latenza. Per ridurre la latenza, abilitare l'inserimento in streaming nel cluster e quindi tabella o database seguendo la procedura descritta in Configurare l'inserimento in streaming nel cluster di Azure Esplora dati. Per le opzioni di aggregazione, vedere Criteri Di inserimento.

Passaggi successivi