Condividi tramite


Arricchire i dati e l'inserimento nell'hub eventi usando Analisi di flusso senza editor di codice

Questo articolo descrive come usare l'editor di codice senza creare facilmente un processo di Analisi di flusso. Legge continuamente da Hub eventi, arricchisce i dati in ingresso con i dati di riferimento SQL e quindi scrive i risultati in modo continuo nell'hub eventi.

Prerequisiti

  • Le risorse dei dati di riferimento di Hub eventi di Azure e SQL devono essere accessibili pubblicamente e non si trovano dietro un firewall o protette in un'Rete virtuale di Azure
  • I dati negli hub eventi devono essere serializzati in formato JSON, CSV o Avro.

Sviluppare un processo di Analisi di flusso per arricchire i dati dell'hub eventi

  1. Nella portale di Azure individuare e selezionare l'istanza di Hub eventi di Azure.

  2. Selezionare Funzionalità>Elabora dati e quindi selezionare Avvia nella scheda Arricchire i dati e inserire nell'hub eventi.

    Screenshot che mostra la scheda Filtro e inserimento nella scheda ADLS Gen2 in cui si seleziona Avvia.

  3. Immettere un nome per il processo di Analisi di flusso e quindi selezionare Crea.

    Screenshot che mostra dove immettere un nome di processo.

  4. Specificare il tipo di serializzazione dei dati nella finestra hub eventi e il metodo di autenticazione che verrà usato dal processo per connettersi a Hub eventi. Selezionare Connetti.
    Screenshot che mostra la configurazione della connessione di Hub eventi.

  5. Quando la connessione viene stabilita correttamente e si hanno flussi di dati che passano all'istanza di Hub eventi, verranno immediatamente visualizzati due elementi:

    • Campi presenti nei dati di input. È possibile scegliere Aggiungi campo oppure selezionare il simbolo a tre punti accanto a un campo per rimuovere, rinominare o modificarne il tipo.
      Screenshot che mostra l'elenco dei campi di Hub eventi in cui è possibile rimuovere, rinominare o modificare il tipo di campo.
    • Esempio live di dati in ingresso nella tabella Anteprima dati nella vista diagramma. Viene aggiornato automaticamente periodicamente. È possibile selezionare Sospendi anteprima streaming per visualizzare una visualizzazione statica dei dati di input di esempio.
      Screenshot che mostra i dati di esempio in Anteprima dati.
  6. Selezionare il riquadro Di input SQL di riferimento per connettersi al database SQL di riferimento.
    Screenshot che mostra la configurazione della connessione dati di riferimento sql.

  7. Selezionare il riquadro Aggiungi . Nel pannello di configurazione a destra scegliere un campo da ogni input per unire i dati in ingresso dai due input.

    Screenshot che mostra la configurazione dell'operatore join.

  8. Selezionare il riquadro Gestisci . Nel pannello Gestisci campi di configurazione scegliere i campi da restituire nell'hub eventi. Per aggiungere tutti i campi, selezionare Aggiungi tutti i campi.

    Screenshot che mostra la configurazione dell'operatore manage field.

  9. Selezionare il riquadro hub eventi. Nel pannello di configurazione dell'hub eventi compilare i parametri necessari e connettersi in modo analogo alla configurazione dell'hub eventi di input.

  10. Facoltativamente, selezionare Recupera anteprima statica/Aggiorna anteprima statica per visualizzare l'anteprima dei dati che verrà inserita nell'hub eventi.
    Screenshot che mostra l'opzione Recupera anteprima statica/Aggiorna anteprima statica.

  11. Selezionare Salva e quindi avviare il processo di Analisi di flusso.
    Screenshot che mostra le opzioni Salva e Avvia.

  12. Per avviare il processo, specificare:

    • Numero di unità di streaming (UNITÀ di streaming) con cui viene eseguito il processo. Le unità di streaming rappresentano la quantità di calcolo e memoria allocata al processo. È consigliabile iniziare con tre e quindi regolare in base alle esigenze.
    • Gestione degli errori dei dati di output: consente di specificare il comportamento desiderato quando l'output di un processo nella destinazione non riesce a causa di errori di dati. Per impostazione predefinita, il processo ritenta fino a quando l'operazione di scrittura non riesce. È anche possibile scegliere di eliminare tali eventi di output.
      Screenshot che mostra le opzioni di avvio del processo di Analisi di flusso in cui è possibile modificare l'ora di output, impostare il numero di unità di streaming e selezionare le opzioni di gestione degli errori dei dati di output.
  13. Dopo aver selezionato Start, il processo viene avviato entro due minuti e le metriche verranno aperte nella sezione della scheda seguente.

    Screenshot che mostra i dati delle metriche del processo dopo l'avvio.

    È anche possibile visualizzare il processo nella sezione Elabora dati nella scheda Processi di Analisi di flusso. Selezionare Apri metriche per monitorarlo o arrestarlo e riavviarlo in base alle esigenze.

    Screenshot della scheda Processi di Analisi di flusso in cui viene visualizzato lo stato dei processi in esecuzione.

Considerazioni sull'uso della funzionalità di replica geografica di Hub eventi

Hub eventi di Azure recentemente lanciato il Funzionalità replica geografica in anteprima pubblica. Questa funzionalità è diversa dalla funzionalità ripristino di emergenza geografico di Hub eventi di Azure.

Quando il tipo di failover è Forzato e la coerenza della replica è asincrona, il processo di Analisi di flusso non garantisce esattamente una volta l'output in un output Hub eventi di Azure.

Analisi di flusso di Azure, come producer con un output di un hub eventi, potrebbe osservare un ritardo limite nel processo durante la durata del failover e durante la limitazione da parte di Hub eventi nel caso in cui il ritardo di replica tra primario e secondario raggiunga il ritardo massimo configurato.

Analisi di flusso di Azure, come consumer con Hub eventi come input, potrebbe osservare un ritardo limite nel processo durante la durata del failover e potrebbe ignorare i dati o trovare dati duplicati al termine del failover.

A causa di queste avvertenze, è consigliabile riavviare il processo di Analisi di flusso con l'ora di inizio appropriata subito dopo il completamento del failover di Hub eventi. Inoltre, poiché la funzionalità di replica geografica di Hub eventi è in anteprima pubblica, non è consigliabile usare questo modello per i processi di Analisi di flusso di produzione a questo punto. Il comportamento corrente di Analisi di flusso migliorerà prima che la funzionalità di replica geografica di Hub eventi sia disponibile a livello generale e possa essere usata nei processi di produzione di Analisi di flusso.

Passaggi successivi

Altre informazioni su Analisi di flusso di Azure e su come monitorare il processo creato.