Compartir vía


Ajuste del vaciado automático en Azure Database for PostgreSQL: servidor flexible

SE APLICA A: Azure Database for PostgreSQL con servidor flexible

En este artículo se proporciona información general sobre la característica de vaciado automático para el servidor flexible de Azure Database for PostgreSQL y las guías de solución de problemas de características que están disponibles para supervisar el sobredimensionamiento de la base de datos y los bloqueadores de vaciado automático. También proporciona información sobre la distancia que tiene la base de datos de una situación de emergencia o de solución encapsulada.

¿Qué es el vaciado automático?

El vaciado automático es un proceso en segundo plano de PostgreSQL que limpia automáticamente las tuplas inactivas y actualiza las estadísticas. Ayuda a mantener el rendimiento de la base de datos ejecutando automáticamente dos tareas de mantenimiento clave:

  • VACIADO: libera espacio en disco quitando tuplas inactivas.
  • ANALIZAR: recopila estadísticas para ayudar al optimizador de PostgreSQL a elegir las mejores rutas de ejecución para las consultas.

Para asegurarse de que el vaciado automático funciona correctamente, el parámetro del servidor de vaciado automático siempre debe establecerse en ON. Cuando está habilitada, PostgreSQL decide automáticamente cuándo ejecutar VACIADO o ANALIZAR en una tabla, lo que garantiza que la base de datos siga siendo eficaz y optimizada.

Aspectos internos del vaciado automático

El vaciado automático lee páginas buscando tuplas inactivas y, si no encuentra ninguna, descarta la página. Cuando el vaciado automático encuentra tuplas inactivas, las quita. El costo se basa en:

Parámetro Descripción
vacuum_cost_page_hit Coste de leer una página que ya está en búferes compartidos y no necesita una lectura de disco. El valor predeterminado se establece en 1.
vacuum_cost_page_miss Coste de capturar una página que no está en búferes compartidos. El valor predeterminado se establece en 10.
vacuum_cost_page_dirty Coste de escribir en una página cuando se encuentran tuplas inactivas en ella. El valor predeterminado se establece en 20.

La cantidad de rendimiento de vaciado automático de trabajo depende de dos parámetros:

Parámetro Descripción
autovacuum_vacuum_cost_limit La cantidad de trabajo que el vaciado automático hace en una sola vez.
autovacuum_vacuum_cost_delay El número de milisegundos que el vaciado automático está en suspensión después de alcanzar el límite de costos especificado por el parámetro autovacuum_vacuum_cost_limit.

En todas las versiones admitidas actualmente de Postgres, el valor predeterminado de autovacuum_vacuum_cost_limit es 200 (en realidad, se establece en -1, lo que hace que sea igual al valor de vacuum_cost_limit normal que, de manera predeterminada, es 200).

En cuanto a autovacuum_vacuum_cost_delay, en la versión 11 de Postgres, el valor predeterminado es de 20 milisegundos, mientras que en la versión 12 y posteriores, el valor predeterminado es de 2 milisegundos.

El vaciado automático se reactiva 50 veces (50*20 ms=1000 ms) cada segundo. Cada vez que se activa, el vaciado automático lee 200 páginas.

Esto significa que, en un segundo, el vaciado automático puede hacer lo siguiente:

  • ~80 MB/s [ (200 páginas/vacuum_cost_page_hit) * 50 * 8 KB por página] si todas las páginas con tuplas inactivas se encuentran en búferes compartidos.
  • ~8 MB/s [ (200 páginas/vacuum_cost_page_miss) * 50 * 8 KB por página] si todas las páginas con tuplas inactivas se leen del disco.
  • ~4 MB/s [ (200 páginas/vacuum_cost_page_dirty) * 50 * 8 KB por página] el vaciado automático puede escribir hasta 4 MB/s.

Supervisión del vaciado automático

Use las siguientes consultas para supervisar el vaciado automático:

select schemaname,relname,n_dead_tup,n_live_tup,round(n_dead_tup::float/n_live_tup::float*100) dead_pct,autovacuum_count,last_vacuum,last_autovacuum,last_autoanalyze,last_analyze from pg_stat_all_tables where n_live_tup >0;

Las columnas siguientes ayudan a determinar si el vaciado automático está alcanzando a la actividad de la tabla:

Parámetro Descripción
dead_pct Porcentaje de tuplas inactivas en comparación con las tuplas activas.
last_autovacuum La fecha de la última vez que se vació automáticamente la tabla.
last_autoanalyze La fecha de la última vez que se analizó automáticamente la tabla.

Desencadenamiento del vaciado automático

Una acción de vaciado automático (ANALYZE o VACUUM) se desencadena cuando el número de tuplas inactivas supera un número determinado que depende de dos factores: el recuento total de filas de una tabla, más un umbral fijo. ANALIZAR, de forma predeterminada, se desencadena cuando cambia el 10 % de la tabla más 50 filas, mientras que VACIADO se desencadena cuando cambia el 20 % de la tabla más 50 filas. Como el umbral VACUUM es el doble de alto que el umbral ANALYZE, ANALYZE se desencadena antes que VACUUM. Para las versiones de PG > =13; ANALIZAR de forma predeterminada, se desencadena cuando se inserta un 20 % de la tabla más 1000 filas.

Las ecuaciones exactas de cada acción son:

  • Autoanalyze = autovacuum_analyze_scale_factor * tuplas + autovacuum_analyze_threshold o autovacuum_vacuum_insert_scale_factor * tuplas + autovacuum_vacuum_insert_threshold (Para versiones de pg >= 13)
  • Vaciado automático = factor_escala_vaciado_vaciado automático * tuplas + umbral_vaciado_vaciado automático

Por ejemplo, si tenemos una tabla con 100 filas. A continuación, la ecuación siguiente proporciona la información sobre cuándo se desencadena el análisis y el vacío:

Para actualizaciones o eliminaciones: Autoanalyze = 0.1 * 100 + 50 = 60
Autovacuum = 0.2 * 100 + 50 = 70

Analice los desencadenadores después de cambiar 60 filas en una tabla y los desencadenadores de vacío cuando se cambien 70 filas en una tabla.

Para inserciones: Autoanalyze = 0.2 * 100 + 1000 = 1020

Análisis de desencadenadores después de insertar 1020 filas en una tabla

Esta es la descripción de los parámetros usados en la ecuación:

Parámetro Descripción
autovacuum_analyze_scale_factor Porcentaje de inserciones, actualizaciones o eliminaciones que desencadena ANALIZAR en la tabla.
autovacuum_analyze_threshold Especifica el número mínimo de tuplas insertadas, actualizadas o eliminadas para ANALIZAR una tabla.
autovacuum_vacuum_insert_scale_factor Porcentaje de inserciones que desencadena ANÁLISIS en la tabla.
autovacuum_vacuum_insert_threshold Especifica el número mínimo de tuplas insertadas para ANALIZAR una tabla.
autovacuum_vacuum_scale_factor Porcentaje de actualizaciones o eliminaciones que desencadena VACIADO en la tabla.

Use la siguiente consulta para enumerar las tablas de una base de datos e identificar las tablas que cumplen los requisitos para el proceso de vaciado automático:

 SELECT *
      ,n_dead_tup > av_threshold AS av_needed
      ,CASE
        WHEN reltuples > 0
          THEN round(100.0 * n_dead_tup / (reltuples))
        ELSE 0
        END AS pct_dead
    FROM (
      SELECT N.nspname
        ,C.relname
        ,pg_stat_get_tuples_inserted(C.oid) AS n_tup_ins
        ,pg_stat_get_tuples_updated(C.oid) AS n_tup_upd
        ,pg_stat_get_tuples_deleted(C.oid) AS n_tup_del
        ,pg_stat_get_live_tuples(C.oid) AS n_live_tup
        ,pg_stat_get_dead_tuples(C.oid) AS n_dead_tup
        ,C.reltuples AS reltuples
        ,round(current_setting('autovacuum_vacuum_threshold')::INTEGER + current_setting('autovacuum_vacuum_scale_factor')::NUMERIC * C.reltuples) AS av_threshold
        ,date_trunc('minute', greatest(pg_stat_get_last_vacuum_time(C.oid), pg_stat_get_last_autovacuum_time(C.oid))) AS last_vacuum
        ,date_trunc('minute', greatest(pg_stat_get_last_analyze_time(C.oid), pg_stat_get_last_autoanalyze_time(C.oid))) AS last_analyze
      FROM pg_class C
      LEFT JOIN pg_namespace N ON (N.oid = C.relnamespace)
      WHERE C.relkind IN (
          'r'
          ,'t'
          )
        AND N.nspname NOT IN (
          'pg_catalog'
          ,'information_schema'
          )
        AND N.nspname !~ '^pg_toast'
      ) AS av
    ORDER BY av_needed DESC ,n_dead_tup DESC;

Nota

La consulta no tiene en cuenta que el vaciado automático se puede configurar por tabla mediante el comando de DDL "alter table".

Problemas comunes del vaciado automático

Revise la siguiente lista de posibles problemas comunes con el proceso de vaciado automático.

No seguimiento del ritmo de un servidor con mucha actividad

El proceso de vaciado automático calcula el costo de cada operación de E/S, acumula un total para cada operación que realiza y se pausa una vez alcanzado el límite superior del costo. autovacuum_vacuum_cost_delay y autovacuum_vacuum_cost_limit son los dos parámetros de servidor que se usan en el proceso.

De forma predeterminada, autovacuum_vacuum_cost_limit se establece en –1, lo que significa que el límite de costos del vaciado automático es el mismo valor que el parámetro vacuum_cost_limit, que tiene como valor predeterminado 200. vacuum_cost_limit es el costo de un vaciado manual.

Si autovacuum_vacuum_cost_limit se establece en -1, el vaciado automático usa el parámetro vacuum_cost_limit, pero si autovacuum_vacuum_cost_limit se establece en un número mayor que -1, se considera el parámetro autovacuum_vacuum_cost_limit.

En caso de que el vaciado automático no mantenga el ritmo, se podrían cambiar los parámetros siguientes:

Parámetro Descripción
autovacuum_vacuum_cost_limit Predeterminado: 200. El límite de los costos podría aumentar. El uso de CPU y E/S en la base de datos debe supervisarse antes y después de realizar cambios.
autovacuum_vacuum_cost_delay Valor predeterminado de la versión 11 de Postgres: 20 ms. El parámetro se podría reducir a 2-10 ms.
Versiones 12 y posteriores de Postgres : valor predeterminado: 2 ms.

Nota:

  • El valor autovacuum_vacuum_cost_limit se distribuye proporcionalmente entre los trabajos de vaciado automático en ejecución, de modo que, si hay más de uno, la suma de los límites de cada trabajo no supere el valor del parámetro autovacuum_vacuum_cost_limit.
  • autovacuum_vacuum_scale_factor es otro parámetro que podría desencadenar el vacío en una tabla en función de la acumulación de tupla inactiva. Valor predeterminado: 0.2, Intervalo permitido: 0.05 - 0.1. El factor de escala es específico de la carga de trabajo y debe establecerse en función de la cantidad de datos de las tablas. Antes de cambiar el valor, investigue la carga de trabajo y los volúmenes de tabla individuales.

Ejecución permanente del vaciado automático

La ejecución continua del vaciado automático podría afectar al uso de CPU y E/S en el servidor. Estas son algunas de las posibles razones:

maintenance_work_mem

El demonio del vaciado automático usa autovacuum_work_mem, que está establecido de forma predeterminada en -1, lo que signiffica que autovacuum_work_mem tendría el mismo valor que el parámetro maintenance_work_mem. En este documento se da por supuesto que autovacuum_work_mem está establecido en -1 y maintenance_work_mem lo usa el demonio del vaciado automático.

Si maintenance_work_mem es bajo, puede aumentarse hasta 2 GB en el servidor flexible de Azure Database for PostgreSQL. Una regla general es asignar 50 MB a maintenance_work_mem por cada 1 GB de RAM.

Gran número de bases de datos

El vaciado automático intenta iniciar un trabajo en cada base de datos cada autovacuum_naptime segundos.

Por ejemplo, si un servidor tiene 60 bases de datos y autovacuum_naptime se establece en 60 segundos, el trabajo de vaciado automático se inicia cada segundo [autovacuum_naptime/Number of databases].

Es recomendable aumentar autovacuum_naptime si hay más bases de datos en un clúster. Al mismo tiempo, el proceso de vaciado automático se puede hacer más agresivo aumentando autovacuum_cost_limit y disminuyendo los parámetros autovacuum_cost_delay y aumentando autovacuum_max_workers del valor predeterminado de 3 a 4 o 5.

Errores de memoria insuficiente

Los valores maintenance_work_mem demasiado agresivos podrían provocar periódicamente errores de memoria insuficiente en el sistema. Es importante comprender la RAM disponible en el servidor antes de realizar cualquier cambio en el parámetro maintenance_work_mem.

Exceso de interrupciones del vaciado automático

Si el vaciado automático consume más recursos, se pueden realizar las siguientes acciones:

Parámetros de vaciado automático

Evalúe los parámetros autovacuum_vacuum_cost_delay, autovacuum_vacuum_cost_limit, autovacuum_max_workers. La configuración incorrecta de los parámetros del vaciado automático podría provocar escenarios en los que el vaciado automático se vuelve demasiado perjudicial.

Si el vaciado automático es demasiado perturbador, tenga en cuenta las siguientes acciones:

  • Aumente autovacuum_vacuum_cost_delay y reduzca autovacuum_vacuum_cost_limit si se establece por encima del valor predeterminado de 200.
  • Reduzca el número de autovacuum_max_workers si está por encima que el valor predeterminado de 3.

Exceso de trabajos de vaciado automático

Aumentar el número de trabajos de vaciado automático no aumenta la velocidad de vaciado. No se recomienda tener un gran número de trabajos de vaciado automático.

Aumentar el número de trabajos de vaciado automático da como resultado un mayor consumo de memoria y, en función del valor de maintenance_work_mem, podría provocar una degradación del rendimiento.

Cada proceso de trabajador de vaciado automático solo recibe (1/trabajos_máximos_de_vaciado automático ) del total autovacuum_cost_limit, por lo que tener un número elevado de trabajos hace que cada uno vaya más lento.

Si aumenta el número de trabajos, también debe aumentarse autovacuum_vacuum_cost_limit o reducirse autovacuum_vacuum_cost_delay para que el proceso de vaciado sea más rápido.

Sin embargo, si hemos fijado el parámetro al nivel de tabla autovacuum_vacuum_cost_delay o autovacuum_vacuum_cost_limit, los trabajos que se ejecutan en esas tablas están exentos de tenerse en cuenta en el algoritmo de equilibrio [autovacuum_cost_limit/autovacuum_max_workers].

Protección del ajuste del identificador de transacción de vaciado automático (TXID)

Cuando una base de datos se ejecuta en la protección del ajuste del identificador de transacción, se puede observar un mensaje de error como el siguiente:

Database isn't accepting commands to avoid wraparound data loss in database 'xx'
Stop the postmaster and vacuum that database in single-user mode.

Nota:

Este mensaje de error es un descuido de hace tiempo. Normalmente, no es necesario cambiar al modo de usuario único. En su lugar, puede ejecutar los comandos VACUUM necesarios y realizar el ajuste para que VACUUM se ejecute rápidamente. Aunque no puede ejecutar ningún lenguaje de manipulación de datos (DML), todavía puede ejecutar VACUUM.

El problema de encapsulado se produce cuando la base de datos no se ha vaciado, o bien hay demasiadas tuplas inactivas que no se han quitado mediante el vaciado automático.

Las posibles razones de este problema podrían ser las siguientes:

Carga de trabajo pesada

La carga de trabajo podría provocar demasiadas tuplas inactivas en un breve período, lo que dificulta la puesta al día del vaciado automático. Las tuplas muertas en el sistema se acumulan a lo largo de un periodo, lo que provoca una degradación del rendimiento de la consulta y lleva a una situación de ajuste. Una de las razones para que se produzca esta situación puede ser que los parámetros de vaciado automático no estén configurados adecuadamente y no se mantenga el ritmo de un servidor con mucha actividad.

Transacciones de ejecución prolongada

Las transacciones de larga duración en el sistema no permiten quitar tuplas inactivas mientras se ejecuta el vaciado automático. Son un bloqueador para el proceso de vaciado. Al quitar las transacciones de larga duración, se liberan tuplas inactivas para su eliminación cuando se ejecuta el vaciado automático.

Las transacciones de ejecución prolongada se pueden detectar mediante la siguiente consulta:

    SELECT pid, age(backend_xid) AS age_in_xids,
    now () - xact_start AS xact_age,
    now () - query_start AS query_age,
    state,
    query
    FROM pg_stat_activity
    WHERE state != 'idle'
    ORDER BY 2 DESC
    LIMIT 10;

Instrucciones preparadas

Si hay instrucciones preparadas sin confirmar, impedirían que se quiten las tuplas inactivas.
La consulta siguiente ayuda a buscar instrucciones preparadas sin confirmar:

    SELECT gid, prepared, owner, database, transaction
    FROM pg_prepared_xacts
    ORDER BY age(transaction) DESC;

Use COMMIT PREPARED o ROLLBACK PREPARED para confirmar o revertir estas instrucciones.

Ranuras de replicación sin usar

Las ranuras de replicación sin usar impiden que el vaciado automático reclame tuplas inactivas. La consulta siguiente ayuda a identificar las ranuras de replicación sin usar:

    SELECT slot_name, slot_type, database, xmin
    FROM pg_replication_slots
    ORDER BY age(xmin) DESC;

Use pg_drop_replication_slot() para eliminar ranuras de replicación sin usar.

Cuando la base de datos se ejecute con la protección de ajuste del identificador de la transacción, compruebe si hay algún bloqueador, como se ha mencionado anteriormente, y elimínelo manualmente para que el vaciado automático continúe y se complete. También puede aumentar la velocidad del vaciado automático si establece autovacuum_cost_delay en 0 y aumentan autovacuum_cost_limit en un valor mayor de 200. Pero los cambios en estos parámetros no se aplican a los trabajos de vaciado automático existentes. Reinicie la base de datos o elimine los trabajos existentes manualmente para aplicar los cambios de parámetro.

Requisitos específicos de la tabla

Es posible establecer parámetros de vaciado automático para tablas individuales. Es especialmente importante para tablas pequeñas y grandes. Por ejemplo, para una tabla pequeña que contiene solo 100 filas, el vaciado automático desencadena la operación VACUUM cuando cambian 70 filas (como se calculó anteriormente). Si esta tabla se actualiza con frecuencia, es posible que vea cientos de operaciones de vaciado automático al día, lo que impide que el vaciado automático mantenga otras tablas en las que el porcentaje de cambios no sea tan significativo. Alternativamente, una tabla que contiene mil millones de filas debe cambiar 200 millones de filas para desencadenar operaciones de vaciado automático. El establecimiento de los parámetros de vaciado automático correctamente impide estos escenarios.

Para establecer la configuración de vaciado automático por tabla, cambie los parámetros del servidor como los ejemplos siguientes:

    ALTER TABLE <table name> SET (autovacuum_analyze_scale_factor = xx);
    ALTER TABLE <table name> SET (autovacuum_analyze_threshold = xx);
    ALTER TABLE <table name> SET (autovacuum_vacuum_scale_factor = xx);
    ALTER TABLE <table name> SET (autovacuum_vacuum_threshold = xx);
    ALTER TABLE <table name> SET (autovacuum_vacuum_cost_delay = xx);
    ALTER TABLE <table name> SET (autovacuum_vacuum_cost_limit = xx);

Cargas de trabajo de solo inserción

En versiones de PostgreSQL <= 13, el vaciado automático no se ejecuta en tablas con una carga de trabajo de solo inserción, ya que no hay tuplas inactivas y ningún espacio disponible que se necesite recuperar. Pero se ejecuta el análisis automático para cargas de trabajo de solo inserción, ya que hay datos nuevos. Las desventajas de esto son:

  • El mapa de visibilidad de las tablas no se actualiza y, por tanto, el rendimiento de las consultas, especialmente cuando hay exámenes de solo índice, comienza a sufrir con el tiempo.
  • La base de datos puede encontrarse con la protección de ajuste del identificador de transacción.
  • No se establecen bits de sugerencia.

Soluciones

Versiones de Postgres <=13

Con la extensión pg_cron, se puede configurar un trabajo cron para programar un análisis de vaciado periódico en la tabla. La frecuencia del trabajo cron depende de la carga de trabajo.

Para obtener instrucciones, consulte Consideraciones especiales acerca del uso de pg_cron en el servidor flexible de Azure Database for PostgreSQL.

Postgres 13 y versiones posteriores

El vaciado automático se ejecuta en tablas con una carga de trabajo de solo inserción. Dos nuevos parámetros de servidor autovacuum_vacuum_insert_threshold y autovacuum_vacuum_insert_scale_factor ayudan a controlar cuándo se puede activar el vaciado automático en las tablas de solo inserción.

Guías de solución de problemas

Con las guías de solución de problemas de características, que están disponibles en el portal de Azure Database for PostgreSQL: servidor flexible, es posible supervisar el sobredimensionamiento en la base de datos o en el nivel de esquema individual junto con la identificación de posibles bloqueadores para el proceso de vaciado automático. Hay dos guías de solución de problemas disponibles; la primera es la supervisión del vaciado automático que se puede usar para supervisar el sobredimensionamiento en la base de datos o en el nivel de esquema individual. La segunda guía de solución de problemas es bloqueadores de vaciado automático y soluciones alternativas, lo que ayuda a identificar posibles bloqueadores de vaciado automático. También proporciona información sobre la distancia que tienen las bases de datos en el servidor desde la solución de ajuste o la situación de emergencia. Las guías de solución de problemas también comparten recomendaciones para mitigar posibles problemas. Para ver cómo configurar las guías de solución de problemas para usarlas, siga las guías de solución de problemas de configuración.

Recomendaciones de Azure Advisor

Las recomendaciones de Azure Advisor son una manera proactiva de identificar si un servidor tiene una relación de hinchazón alta o el servidor se aproxima a un escenario de solución de ajuste de transacciones. También puede crear alertas de Azure Advisor para las recomendaciones.

Las recomendaciones son:

  • Índice de hinchazón alta: un índice de hinchazón alta puede afectar al rendimiento del servidor de varias maneras. Un problema importante es que el optimizador de motor de PostgreSQL podría tener dificultades para seleccionar el mejor plan de ejecución, lo que provocaba una degradación del rendimiento de las consultas. Por lo tanto, se desencadena una recomendación cuando el porcentaje de hinchazón en un servidor alcanza un umbral determinado para evitar estos problemas de rendimiento.

  • Ajuste de transacciones: este escenario es uno de los problemas más graves que puede encontrar un servidor. Una vez que el servidor está en este estado, podría dejar de aceptar más transacciones, lo que hace que el servidor se convierta en de solo lectura. Por tanto, se desencadena una recomendación cuando se ve que el servidor supera el umbral de mil millones de transacciones.