Condividi tramite


Procedura: eseguire l'onboarding dei dati delle metriche in Advisor metriche di Azure

Importante

A partire dal 20 settembre 2023 non sarà possibile creare nuove risorse di Advisor metriche. Il servizio Advisor metriche verrà ritirato il 1° ottobre 2026.

Usare questo articolo per informazioni sull'onboarding dei dati in Advisor metriche di Azure.

Requisiti e configurazione dello schema di dati

Advisor metriche di Azure AI è un servizio per il rilevamento, la diagnostica e l'analisi delle anomalie delle serie temporali. Supportato dall'intelligenza artificiale, usa i dati per eseguire il training del modello usato. Il servizio accetta tabelle di dati aggregati con le colonne seguenti:

  • Misura (obbligatorio): una misura è un termine fondamentale o specifico dell'unità e un valore quantificabile della metrica. Significa che una o più colonne contiene valori numerici.
  • Timestamp (facoltativo): zero o una colonna di tipo DateTime o String. Quando questa colonna non è configurata, il timestamp viene impostato come ora di inizio di ogni periodo di inserimento. Formattare il timestamp come indicato di seguito: yyyy-MM-ddTHH:mm:ssZ.
  • Dimensione (facoltativa): una dimensione rappresenta uno o più valori categorici. La combinazione di questi valori identifica una particolare serie temporale univariata, ad esempio paese/area, lingua e tenant. Le colonne della dimensione possono essere di qualsiasi tipo di dati. Prestare attenzione quando si lavora con grandi volumi di colonne e valori, per evitare l'elaborazione di un numero eccessivo di dimensioni.

Se si usano origini dati come Azure Data Lake Storage o Archiviazione BLOB di Azure, è possibile aggregare i dati per allinearli allo schema delle metriche previsto. Ciò è dovuto al fatto che queste origini dati utilizzano un file come input delle metriche.

Se si usano origini dati come Azure SQL o Esplora dati di Azure, è possibile usare le funzioni di aggregazione per aggregare i dati nello schema previsto. Ciò è dovuto al fatto che queste origini dati supportano l'esecuzione di una query per ottenere i dati delle metriche dalle origini.

Se non si è certi di alcuni termini, vedere Glossario.

Evitare di caricare dati parziali

I dati parziali sono causati da incoerenze tra i dati archiviati in Advisor metriche di Azure e l'origine dati. Questo problema può verificarsi quando l'origine dati viene aggiornata dopo che Advisor metriche di Azure ha terminato il pull dei dati. Advisor metriche di Azure esegue il pull dei dati soltanto da una determinata origine dati un'unica volta.

Ad esempio, se è stata eseguito l'onboarding di una metrica in Advisor metriche di Azure a scopo di monitoraggio. Advisor metriche di Azure recupera correttamente i dati delle metriche al timestamp A ed esegue il rilevamento anomalie su di esso. Tuttavia, se i dati delle metriche di quel particolare timestamp A sono stati aggiornati dopo l'inserimento dei dati. Il nuovo valore dei dati non verrà recuperato.

È possibile provare a eseguire il back-fill dei dati cronologici (descritti più avanti) per attenuare le incoerenze, ma ciò non attiverà nuovi avvisi di anomalie, se gli avvisi per tali punti temporali sono già stati abilitati. Questo processo può aggiungere un carico di lavoro aggiuntivo al sistema e non è automatico.

Per evitare il caricamento di dati parziali, è consigliabile adottare due approcci:

  • Generare i dati in una transazione:

    Assicurasi che i valori delle metriche per tutte le combinazioni di dimensioni con lo stesso timestamp siano memorizzati nell'origine dati in un'unica transazione. Nell'esempio precedente, attendere che i dati di tutte le origini dati siano pronti, quindi caricarli in Advisor metriche di Azure in un'unica transazione. Advisor metriche di Azure può eseguire regolarmente il polling del feed di dati, fino a quando i dati non vengono recuperati correttamente (o parzialmente).

  • Ritardare l'inserimento dei dati impostando un valore appropriato per il parametro di Offset del tempo di inserimento:

    Impostare il parametro di Offset del tempo di inserimento per il feed di dati per ritardare l'inserimento fino a quando i dati non saranno completamente preparati. Ciò può essere utile per alcune origini dati che non supportano transazioni, come archiviazione tabelle di Azure. Per informazioni dettagliate, vedere Impostazioni avanzate.

Iniziare aggiungendo un feed di dati

Dopo aver eseguito l'accesso al portale di Advisor metriche di Azure e aver scelto l'area di lavoro, fare clic su Inizia. Nella pagina principale dell'area di lavoro, fare quindi clic su Aggiungi feed di dati dal menu a sinistra.

Aggiungere le impostazioni di connessione

1. Impostazioni di base

Verrà quindi immesso un set di parametri per connettere l'origine dati serie temporale.

  • Tipo di origine: il tipo di origine dati in cui sono archiviati i dati delle serie temporali.
  • Granularità: intervallo tra punti dati consecutivi nei dati delle serie temporali. Attualmente Advisor metriche di Azure supporta: annuale, mensile, settimanale, giornaliero, orario, al minuto e personalizzato. L'intervallo più piccolo supportato dall'opzione di personalizzazione è di 60 secondi.
    • Secondi: numero di secondi in cui granularityName è impostato su Personalizza.
  • Inserisci dati dalle ore (UTC): ora di inizio di base prevista per l'inserimento dati. startOffsetInSeconds viene spesso usato per aggiungere un offset per facilitare la coerenza dei dati.

2. Specificare la stringa di connessione

Sarà quindi necessario indicare le informazioni di connessione per l'origine dati. Per informazioni dettagliate sugli altri campi e sulla connessione di diversi tipi di origini dati, vedere Procedura: connettere origini dati diverse.

3. Specificare una query per un singolo timestamp

Per informazioni dettagliate sui diversi tipi di origini dati, vedere Procedura: connettere origini dati diverse.

Caricare i dati

Dopo aver immesso la stringa di connessione e la stringa di query, selezionare Carica dati. In questa operazione, Advisor metriche di Azure verificherà la connessione e l'autorizzazione per caricare i dati, controllare i parametri necessari (@IntervalStart e @IntervalEnd) che devono essere usati nella query, nonché verificare il nome della colonna dall'origine dati.

Se si verifica un errore in questo passaggio:

  1. Controllare innanzitutto se la stringa di connessione è valida.
  2. Verificare quindi se sono presenti autorizzazioni sufficienti e che all'indirizzo IP del ruolo di lavoro di inserimento venga concesso l'accesso.
  3. Controllare quindi se i parametri obbligatori (@IntervalStart e @IntervalEnd) sono usati nella query.

Configurazione dello schema

Dopo aver caricato lo schema dei dati, selezionare i campi appropriati.

Se il timestamp di un punto dati viene omesso, Advisor metriche di Azure userà il timestamp nel momento in cui il punto dati viene inserito. Per ogni feed di dati è possibile specificare al massimo una colonna come timestamp. Se viene visualizzato un messaggio che indica che una colonna non può essere specificata come timestamp, controllare la query o l'origine dati e se sono presenti più timestamp nel risultato della query, non solo nei dati di anteprima. Quando si esegue l'inserimento dati, Advisor metriche di Azure può utilizzare ogni volta un solo blocco (ad esempio un giorno, un'ora, in base alla granularità) dei dati delle serie temporali dall'origine specificata.

Selezione Descrizione Note
Nome visualizzato Nome da visualizzare nell'area di lavoro invece del nome della colonna originale. Facoltativo.
Timestamp: Timestamp di un punto dati. Se omesso, Advisor metriche userà il timestamp quando il punto dati viene inserito. Per ogni feed di dati è possibile specificare al massimo una colonna come timestamp. Facoltativo. Deve essere specificato con al massimo una colonna. Se non è possibile specificare una colonna come errore timestamp, controllare la query o l'origine dati per la presenza di timestamp duplicati.
Misurare Valori numerici nel feed di dati. Per ogni feed di dati è possibile specificare più misure, ma almeno una colonna deve essere selezionata come misura. Deve essere specificato con almeno una colonna.
Dimensione Valori di categoria. Una combinazione di valori diversi identifica una particolare serie temporale unidimensionale, ad esempio paese/area, lingua, tenant. È possibile selezionare zero o più colonne come dimensioni. Nota: prestare attenzione quando si seleziona come dimensione una colonna non di tipo stringa. Facoltativo.
Ignora Ignora la colonna selezionata. Facoltativo. Per le origini dati che supportano l'utilizzoo di una query per ottenere i dati, non esiste l'opzione 'Ignora'.

Per ignorare le colonne, è consigliabile aggiornare la query o l'origine dati per poter escludere tali colonne. È anche possibile ignorare le colonne usando Ignora colonne e quindi selezionare Ignora nelle colonne specifiche. Se una colonna deve essere una dimensione e viene erroneamente impostata come Ignorata, Advisor metriche di Azure potrebbe terminare l'inserimento di dati parziali. Si supponga, ad esempio, che i dati della query siano i seguenti:

ID riga Timestamp: Paese/area geografica Lingua Reddito
1 10/11/2019 Cina ZH-CN 10000
2 10/11/2019 Cina EN-US 1000
3 10/11/2019 Stati Uniti ZH-CN 12000
4 11/11/2019 Stati Uniti EN-US 23000
... ... ... ... ...

Se Paese è una dimensione e Lingua è impostato su Ignorata, le prime e le seconde righe avranno le stesse dimensioni per un timestamp. Advisor metriche di Azure userà arbitrariamente un valore delle due righe. In questo caso, Advisor metriche di Azure non aggregherà le righe.

Dopo aver configurato lo schema, selezionare Verifica schema. All'interno di questa operazione, Advisor metriche di Azure eseguirà i controlli seguenti:

  • Indica se il timestamp dei dati sottoposti a query rientra in un singolo intervallo.
  • Indica se sono presenti valori duplicati restituiti per la stessa combinazione di dimensioni entro un intervallo di metriche.

Impostazioni di rollup automatico

Importante

Se si vuole abilitare l'analisi della causa radice e altre funzionalità di diagnostica, è necessario configurare le Impostazioni di rollup automatico. Una volta abilitate, le impostazioni di rollup automatico non possono essere modificate.

Advisor metriche di Azure può eseguire automaticamente l'aggregazione (SUM/MAX/MIN...) su ogni dimensione durante l'inserimento, quindi crea una gerarchia che verrà usata nell'analisi della causa radice e in altre funzionalità di diagnostica.

Si considerino gli scenari seguenti:

  • "Non è necessario includere l'analisi di rollup per i dati."

    Non è necessario usare il rollup di Advisor metriche di Azure.

  • "I dati sono già stati distribuiti e il valore della dimensione è rappresentato da: NULL o Empty (predefinito), solo NULL, Altri".

    Questa opzione indica che Advisor metriche di Azure non deve eseguire il rollup dei dati perché le righe sono già sommate. Ad esempio, se si seleziona solo NULL, la seconda riga di dati nell'esempio seguente verrà considerata come un'aggregazione di tutti i paesi/aree geografiche e la lingua EN-US. La quarta riga di dati con un valore vuoto per Country verrà tuttavia considerata come una riga normale che potrebbe indicare dati incompleti.

    Paese/area geografica Lingua Reddito
    Cina ZH-CN 10000
    (NULL) EN-US 999999
    Stati Uniti EN-US 12000
    EN-US 5000
  • "Ho bisogno di Advisor metriche di Azure per eseguire il rollup dei dati calcolando Sum/Max/Min/Avg/Count e rappresentarlo con {some string}".

    Alcune origini dati, ad esempio Azure Cosmos DB o Archiviazione BLOB di Azure, non supportano determinati calcoli, come raggruppa per o cubo. Advisor metriche di Azure offre l'opzione di rollup per generare automaticamente un cubo di dati durante l'inserimento. Questa opzione significa che Advisor metriche di Azure deve calcolare il rollup utilizzando l'algoritmo selezionato e utilizzare la stringa specificata per rappresentare il rollup in Advisor metriche di Azure. Ciò non modificherà alcun dato nell'origine dati. Si supponga, ad esempio, di avere un set di serie temporali che corrisponde alle metriche Vendite con la dimensione (Paese, Area). Per un determinato timestamp, il risultato potrebbe essere simile al seguente:

    Country Area Vendite
    Canada Alberta 100
    Canada British Columbia 500
    Stati Uniti Montana 100

    Dopo aver abilitato il rollup automatico con Sum, Advisor metriche di Azure calcolerà le combinazioni di dimensioni e sommerà le metriche durante l'inserimento dati. Il risultato potrebbe essere il seguente:

    Country Area Vendite
    Canada Alberta 100
    NULL Alberta 100
    Canada British Columbia 500
    NULL British Columbia 500
    Stati Uniti Montana 100
    NULL Montana 100
    NULL NULL 700
    Canada NULL 600
    Stati Uniti NULL 100

    (Country=Canada, Region=NULL, Sales=600) indica che la somma delle vendite in Canada (tutte le aree) è 600.

    Di seguito è riportata la trasformazione nel linguaggio SQL.

    SELECT
        dimension_1,
        dimension_2,
        ...
        dimension_n,
        sum (metrics_1) AS metrics_1,
        sum (metrics_2) AS metrics_2,
        ...
        sum (metrics_n) AS metrics_n
    FROM
        each_timestamp_data
    GROUP BY
        CUBE (dimension_1, dimension_2, ..., dimension_n);
    

    Prima di usare la funzionalità di rollup automatico, tenere presente quanto segue:

    • Se si vuole usare SUM per aggregare i dati, assicurarsi che le metriche siano additive in ogni dimensione. Ecco alcuni esempi di metriche non additive:
      • Metriche basate su frazione. Includono rapporto, percentuale e così via. Ad esempio, non si dovrebbe aggiungere il tasso di disoccupazione di ogni stato per calcolare il tasso di disoccupazione dell'intero paese/area.
      • Sovrapposizione nella dimensione. Ad esempio, per calcolare il numero di persone a cui piacciono gli sport non si deve sommare il numero di persone che li amano, perché esiste una sovrapposizione tra di essi, una persona può amare più sport.
    • Per garantire l'integrità dell'intero sistema, le dimensioni del cubo sono limitate. Attualmente, il limite è 100.000. Se i dati superano tale limite, l'inserimento avrà esito negativo per tale timestamp.

Impostazioni avanzate

Esistono diverse impostazioni avanzate per abilitare i dati inseriti in modo personalizzato, ad esempio specificando l'offset di inserimento o la concorrenza. Per altre informazioni, vedere la sezione Impostazioni avanzate nell'articolo sulla gestione dei feed di dati.

Specificare un nome per il feed di dati e controllare lo stato di avanzamento dell'inserimento

Assegnare al feed di dati un nome personalizzato, che verrà visualizzato nell'area di lavoro. Selezionare quindi Invia. Nella pagina dei dettagli del feed di dati è possibile usare la barra di stato di inserimento per visualizzare le informazioni sullo stato.

Barra di stato inserimento

Per controllare i dettagli dell'errore di inserimento:

  1. Selezionare Mostra dettagli.
  2. Selezionare Stato e quindi scegliere Non riuscito o Errore.
  3. Passare il puntatore del mouse su un inserimento non riuscito e visualizzare il messaggio dei dettagli relativo.

Controllare l'inserimento non riuscito

Uno stato non riuscito indica che l'inserimento per questa origine dati verrà ritentato in un secondo momento. Uno stato Errore indica che Advisor metriche di Azure non eseguirà un'altra prova per l'origine dati. Per ricaricare i dati, è necessario attivare manualmente il back-fill/ricarica.

È anche possibile ricaricare lo stato di avanzamento di un inserimento facendo clic su Aggiorna stato. Al termine dell'inserimento dati, è possibile fare clic sulle metriche e controllare i risultati del rilevamento anomalie.

Passaggi successivi