Informazioni sulla conservazione dei dati in Azure Time Series Insights Gen1
Nota
Il servizio Time Series Insights verrà ritirato il 7 luglio 2024. Valutare la possibilità di eseguire la migrazione di ambienti esistenti a soluzioni alternative il prima possibile. Per altre informazioni sulla deprecazione e la migrazione, vedere la documentazione .
Attenzione
Questo è un articolo di Gen1.
Questo articolo descrive due impostazioni principali che influisce sulla conservazione dei dati nell'ambiente Azure Time Series Insights.
Video
Il video seguente riepiloga la conservazione dei dati di Azure Time Series Insights e come pianificarla.
Ogni ambiente di Azure Time Series Insights ha un'impostazione che controlla tempo di conservazione dei dati. Il valore è compreso tra 1 e 400 giorni. I dati vengono eliminati in base alla capacità di archiviazione o alla durata di conservazione dell'ambiente, a seconda di quale sia il primo.
Inoltre, l'ambiente Azure Time Series Insights ha una configurazione per il comportamento al superamento del limite di archiviazione. Controlla il comportamento di ingresso e eliminazione quando viene raggiunta la capacità massima di un ambiente. Esistono due comportamenti tra cui scegliere durante la configurazione:
- Eliminare i dati obsoleti (impostazione predefinita)
- Sospendere l'ingresso
Nota
Per impostazione predefinita, quando si crea un nuovo ambiente, la conservazione viene configurata per Eliminare i dati obsoleti. Questa impostazione può essere attivata o disattivata in base alle esigenze dopo la creazione tramite il portale di Azure, nella pagina Configura dell'ambiente Azure Time Series Insights.
- Per informazioni su come configurare i criteri di conservazione, vedere Configurazione della conservazione in Azure Time Series Insights.
Entrambi i criteri di conservazione dei dati sono descritti in modo più dettagliato di seguito.
Eliminare i dati vecchi
- Eliminare i vecchi dati è l'impostazione predefinita per gli ambienti Azure Time Series Insights.
- Eliminare i dati vecchi è preferito quando gli utenti vogliono avere sempre i loro dati più recenti nell'ambiente Azure Time Series Insights.
- L'impostazione ripulitura dei dati obsoletielimina i dati una volta raggiunti i limiti dell'ambiente (tempo di conservazione, dimensioni o conteggio, a seconda di quale viene raggiunto per primo). La conservazione è impostata su 30 giorni per impostazione predefinita.
- I dati inseriti più vecchi vengono eliminati per primi (approccio *First In First Out*).
Esempio 1
Si consideri un ambiente di esempio con comportamento di conservazione Continuare l'ingresso e eliminare i dati obsoleti:
il tempo di conservazione dei dati è impostato su 400 giorni. Capacità è impostata sull'unità S1, che ha una capacità totale di 30 GB. Si supponga che i dati in entrata si accumulino in media fino a 500 MB al giorno. Questo ambiente può conservare solo 60 giorni di dati in base alla velocità dei dati in ingresso, poiché la capacità massima viene raggiunta a 60 giorni. I dati in ingresso si accumulano come: 500 MB ogni giorno x 60 giorni = 30 GB.
Il 61° giorno l'ambiente mostra i dati più recenti, ma elimina i dati meno recenti, più vecchi di 60 giorni. L'eliminazione rende spazio per il nuovo flusso di dati, in modo che i nuovi dati continuino a essere esplorati. Se l'utente desidera conservare i dati più a lungo, può aumentare le dimensioni dell'ambiente aggiungendo unità aggiuntive o eseguendo il push di meno dati.
Esempio 2
Si consideri un ambiente configurato anche per il comportamento di conservazione Procedere con l'incorporazione dei dati ed eliminare quelli obsoleti. In questo esempio, tempo di conservazione dei dati è impostato su un valore inferiore di 180 giorni. Capacità è impostata sull'unità S1, che ha una capacità complessiva di 30 GB. Per archiviare i dati per l'intero periodo di 180 giorni, il traffico in ingresso giornaliero non può superare 0,166 GB (166 MB) al giorno.
Ogni volta che la velocità di ingresso giornaliera di questo ambiente supera 0,166 GB al giorno, i dati non possono essere archiviati per 180 giorni, perché alcuni dati vengono eliminati. Si consideri lo stesso ambiente durante un intervallo di tempo occupato. Presupponiamo che il tasso di ingresso dell'ambiente possa aumentare a una media di 0,189 GB al giorno. In tale intervallo di tempo occupato, vengono conservati circa 158 giorni di dati (30 GB/0,189 = 158,73 giorni di conservazione). Questo tempo è inferiore all'intervallo di tempo desiderato per la conservazione dei dati.
Sospendere l'ingresso
L'impostazione Sospendi ingresso è progettata per garantire che i dati non vengano rimossi se la dimensione e i limiti di conteggio sono stati raggiunti prima del periodo di conservazione.
Pause ingress fornisce agli utenti tempo aggiuntivo per aumentare la capacità del loro ambiente prima che i dati vengano eliminati a causa del superamento del periodo di conservazione.
Consente di proteggere l'utente dalla perdita di dati, ma può aumentare il rischio di perdere i dati più recenti se l'inserimento dati viene interrotto oltre il periodo di conservazione della fonte evento.
Tuttavia, una volta raggiunta la capacità massima di un ambiente, l'ambiente sospende l'ingresso dei dati fino a quando non si verificano le azioni aggiuntive seguenti:
- Aumenti la capacità massima dell'ambiente per aggiungere altre unità di scala, come descritto in Come ridimensionare l'ambiente di Azure Time Series Insights.
- Il periodo di conservazione dei dati viene raggiunto e i dati vengono eliminati, portando l'ambiente al di sotto della capacità massima.
Esempio 3
Si consideri un ambiente con modalità di conservazione configurata per sospendere l'ingresso dia
In quel momento, l'ambiente mostra lo stesso set di dati fino a quando l'ingresso non riprende o fino a quando l'opzione continuare l'ingresso non viene abilitata (che elimina i dati più vecchi per liberare spazio per i nuovi dati).
Quando l'ingresso riprende:
- Flussi di dati nell'ordine in cui sono stati ricevuti dall'origine dell'evento
- Gli eventi vengono indicizzati in base al timestamp, a meno che non siano state superate le politiche di conservazione nella sorgente dell'evento. Per altre informazioni sulla configurazione della conservazione dell'origine eventi, domande frequenti su Hub eventi
Importante
È consigliabile impostare avvisi in modo da evitare che l'accesso venga sospeso. La perdita di dati potrebbe verificarsi poiché il periodo di conservazione predefinito è di 1 giorno per le origini eventi di Azure. Pertanto, una volta sospeso l'ingresso, è probabile che si perdano i dati più recenti, a meno che non venga eseguita un'azione aggiuntiva. È necessario aumentare la capacità o modificare il comportamento verso eliminare i dati obsoleti per evitare la perdita potenziale di dati.
Negli Hub eventi interessati, è consigliabile modificare la proprietà conservazione dei messaggi per ridurre al minimo la perdita di dati quando si verifica una sospensione dell'ingresso in Azure Time Series Insights.
Se non sono configurate proprietà nell'origine evento (timeStampPropertyName
), Azure Time Series Insights, per impostazione predefinita, utilizza il timestamp di arrivo nell'hub eventi come l'asse X. Se timeStampPropertyName
è configurato per un'altra operazione, l'ambiente cerca il timeStampPropertyName
configurato nel pacchetto di dati quando vengono analizzati gli eventi.
Leggi Come ridimensionare l'ambiente Azure Time Series Insights per supportare capacità aggiuntive o aumentare la durata della conservazione dei dati.
Passaggi successivi
Per informazioni sulla configurazione o sulla modifica delle impostazioni di conservazione dei dati, vedere Configurazione della conservazione in Azure Time Series Insights.
Scopri la mitigazione della latenza in Azure Time Series Insights.