Compartir a través de


Descripción de la retención de datos en Azure Time Series Insights Gen1

Nota

El servicio Time Series Insights se retirará el 7 de julio de 2024. Considere la posibilidad de migrar entornos existentes a soluciones alternativas lo antes posible. Para obtener más información sobre la desaprobación y la migración, consulte nuestra documentación en .

Cautela

Este es un artículo de Gen1.

En este artículo se describen dos configuraciones principales que afectan a la retención de datos en el entorno de Azure Time Series Insights.

Vídeo

En el vídeo siguiente se resume la retención de datos de Azure Time Series Insights y cómo planearla.

Cada uno de los entornos de Azure Time Series Insights tiene una configuración que controla tiempo de retención de datos. El valor abarca de 1 a 400 días. Los datos se eliminan en función de la capacidad de almacenamiento del entorno o la duración de retención, lo que ocurra primero.

Además, su entorno de Azure Time Series Insights tiene una configuración de comportamiento para el límite de almacenamiento excedido . Controla el comportamiento de entrada y purga cuando se alcanza la capacidad máxima de un entorno. Hay dos comportamientos entre los que elegir al configurarlo:

  • Purgar de datos antiguos (valor predeterminado)
  • Pausa de entrada

Nota

De forma predeterminada, al crear un nuevo entorno, la retención se configura para Purgar datos antiguos. Esta configuración se puede alternar según sea necesario después de la hora de creación mediante el portal de Azure, en la página Configuración del entorno de Azure Time Series Insights.

Ambas directivas de retención de datos se describen con más detalle a continuación.

Purgar datos antiguos

  • purgar datos antiguos es la configuración predeterminada para los entornos de Azure Time Series Insights.
  • Purgar datos antiguos es preferible cuando los usuarios quieren tener siempre sus datos más recientes en su entorno de Azure Time Series Insights.
  • La configuración Purgar datos antiguospurga los datos una vez que se alcanzan los límites del entorno (tiempo de retención, tamaño o recuento, lo que ocurra primero). La retención se establece en 30 días de forma predeterminada.
  • Los datos ingeridos más antiguos se purgan primero (el enfoque "Primero en entrar, primero en salir").

Ejemplo uno

Considere un entorno de ejemplo con el comportamiento de retención Continuar entrada y purgar datos antiguos:

tiempo de retención de datos se establece en 400 días. Capacidad se establece en unidad S1, que contiene 30 GB de capacidad total. Supongamos que los datos entrantes se acumulan a 500 MB cada día en promedio. Este entorno solo puede conservar 60 días de datos según la tasa de datos entrantes, ya que la capacidad máxima se alcanza a 60 días. Los datos entrantes se acumulan como: 500 MB cada día x 60 días = 30 GB.

En el día 61, el entorno muestra los datos más recientes, pero purga los datos más antiguos, más de 60 días. La purga hace espacio para los nuevos datos que fluyen, de modo que puedan seguir siendo explorados. Si el usuario desea conservar los datos más tiempo, puede aumentar el tamaño del entorno agregando unidades adicionales o puede insertar menos datos.

Ejemplo dos

Considere también un entorno en el que esté configurado el comportamiento de retención y continúe con la entrada y purga de datos antiguos. En este ejemplo, tiempo de retención de datos se establece en un valor inferior de 180 días. Capacidad se establece en unidad S1, que contiene 30 GB de capacidad total. Para almacenar datos durante los 180 días completos, la entrada diaria no puede superar los 0,166 GB (166 MB) al día.

Cada vez que la tasa de entrada diaria de este entorno supera los 0,166 GB al día, los datos no se pueden almacenar durante 180 días, ya que algunos datos se purgan. Considere este mismo entorno durante un período de tiempo ocupado. Supongamos que la tasa de entrada del entorno puede aumentar a un promedio de 0,189 GB al día. En ese período de tiempo ocupado, se conservan aproximadamente 158 días de datos (30 GB/0,189 = 158,73 días de retención). Este tiempo es menor que el período de tiempo de retención de datos deseado.

Pausar la entrada

  • La configuración Pausar entrada está diseñada para garantizar que los datos no se eliminen si se alcanzan los límites de tamaño y cantidad antes de su período de retención.

  • Pausar ingreso proporciona tiempo adicional para que los usuarios aumenten la capacidad de su entorno antes de purgar los datos debido a exceder el período de retención.

  • Ayuda a protegerle de la pérdida de datos, pero puede provocar la pérdida de sus datos más recientes si la entrada está en pausa más allá del período de retención de su fuente de eventos.

  • Sin embargo, una vez alcanzada la capacidad máxima de un entorno, el entorno detiene la entrada de datos hasta que se produzcan las siguientes acciones adicionales:

    • Aumentas la capacidad máxima del entorno para agregar más unidades de escala, según se describe en Cómo escalar tu entorno de Azure Time Series Insights.
    • Se alcanza el período de retención de datos y se purgan los datos, lo que hace que el entorno esté por debajo de su capacidad máxima.

Ejemplo tres

Considere un entorno con el comportamiento de retención configurado para pausar la entrada. En este ejemplo, el período de retención de datos está configurado en 60 días. La capacidad está configurada en tres (3) unidades de S1. Supongamos que este entorno tiene entrada de datos de 2 GB cada día. En este entorno, la entrada se pausa una vez alcanzada la capacidad máxima.

En ese momento, el entorno muestra el mismo conjunto de datos hasta que se reanude la entrada o hasta que se habilite continuar la entrada (lo que purgaría los datos más antiguos para hacer espacio a los nuevos datos).

Cuando se reanuda la entrada:

  • Los datos fluyen en el orden en que fueron recibidos por la fuente del evento.
  • Los eventos se indexan en función de su marca de tiempo, a menos que haya superado las directivas de retención en el origen del evento. Para obtener más información sobre la configuración de retención del origen de eventos, Preguntas frecuentes sobre Event Hubs

Importante

Debe establecer alertas para notificar y así ayudar a evitar que se pause la entrada. La pérdida de datos es posible, ya que la retención predeterminada es de 1 día para los orígenes de eventos de Azure. Por lo tanto, una vez que se pausa la entrada, es probable que pierdas los datos más recientes a menos que se tomen medidas adicionales. Debe aumentar la capacidad o cambiar el comportamiento a Purgar datos antiguos para evitar la posible pérdida de datos.

En los Event Hubs afectados, considere ajustar la propiedad de retención de mensajes para minimizar la pérdida de datos cuando se produce una interrupción en la entrada de datos en Azure Time Series Insights.

retención de mensajes del centro de eventos

Si no hay propiedades configuradas en el origen del evento (timeStampPropertyName), Azure Time Series Insights tiene como valor predeterminado la marca de tiempo de llegada al centro de eventos como eje X. Si timeStampPropertyName está configurado para que sea algo más, el entorno busca el timeStampPropertyName configurado en el paquete de datos cuando se analizan los eventos.

Consulte Cómo escalar su entorno de Azure Time Series Insights para adaptar el entorno a capacidad adicional o extender el período de retención.

Pasos siguientes