Compartir a través de


Guía de optimización del rendimiento para el grupo de SQL sin servidor de Azure Synapse Analytics

Se aplica a: Azure Synapse Analytics

Este artículo le ayuda a mejorar el rendimiento del grupo de SQL sin servidor de Azure Synapse Analytics.

Nota:

Revise la lista de problemas conocidos que están actualmente activos o resueltos recientemente en Azure Synapse Analytics.

Consulte las secciones siguientes para obtener información sobre cómo lograr un rendimiento óptimo y evitar errores relacionados con restricciones de recursos en los grupos de SQL sin servidor de Azure Synapse Analytics.

Procedimientos recomendados y guías de solución de problemas

La información y las estrategias de los siguientes artículos pueden ayudarle a sacar el mejor rendimiento del grupo de SQL sin servidor. Se recomienda usar estos artículos para revisar los casos de uso y solucionar problemas comunes.

Descripción del escalado en un grupo de SQL sin servidor

Los grupos de SQL sin servidor no requieren que seleccione manualmente el tamaño correcto. El sistema ajusta automáticamente el tamaño en función de los requisitos de consulta y, por tanto, administra la infraestructura y selecciona el tamaño adecuado para la solución.

Guía de optimización del rendimiento para archivos de Delta Lake

Para obtener más información sobre el ajuste del rendimiento de los archivos de Delta Lake, consulte los siguientes recursos:

Guía de optimización del rendimiento para archivos CSV

Al consultar archivos CSV en un grupo de SQL sin servidor, la tarea más importante para garantizar el alto rendimiento es crear estadísticas en las tablas externas. Aunque las estadísticas se crean automáticamente en archivos Parquet y CSV, y se accede a ellos mediante OPENQUERY(), para leer los archivos CSV mediante tablas externas es necesario crear manualmente estadísticas.

Para obtener información más detallada sobre el rol de las estadísticas en la consulta de archivos CSV en grupos de SQL sin servidor, consulte los siguientes artículos:

Recomendaciones para usar Power BI y otras herramientas de informes

Se recomiendan los siguientes procedimientos recomendados al usar Power BI y otras herramientas de informes:

  • Compruebe siempre la ubicación del inquilino.
  • Configure una memoria caché para mejorar la experiencia del usuario.
  • Evite que se devuelvan millones de registros a un panel.
  • Use actualizaciones programadas para evitar ejecuciones de consultas paralelas que agoten los recursos del grupo sin servidor de SQL.
  • Use Spark para agregar previamente consultas analíticas comunes. Este enfoque de "escritura una vez/lectura muchos" puede evitar consultas intensivas que se ejecutan continuamente.
  • Para las combinaciones entre diferentes almacenes de datos: use filtros para evitar volúmenes de macrodatos que se movieron a través de la infraestructura de Azure.
  • Use Latin1_General_100_BIN2_UTF8 la intercalación para los tipos de datos de caracteres. Esta intercalación evita transferir todos los datos del almacenamiento al grupo de SQL sin servidor mediante la inserción de filtros cuando las herramientas leen del almacenamiento.
  • Use el tamaño más óptimo, si va a convertir o convertir datos en char o varchar al ejecutar una consulta. Cuando sea posible, evite usar VARCHAR(MAX).
  • La inferencia automática convierte los tipos de datos en un formato que podría no ser óptimo. Utilice la cláusula WITH para optimizar los tipos de datos.
  • Los recursos del grupo sin servidor de Sql de Azure Synapse tienen límites. La ejecución de consultas simultáneamente consumirá recursos. Es habitual ver que los paneles de Power BI (PBI) alcanzan los límites de recursos cuando se producen varias actualizaciones en paralelo. Las actualizaciones programadas y las pruebas de carga pueden ayudar a evitar este problema. Además, el uso de varias áreas de trabajo de Azure Synapse puede abordar mayores requisitos de simultaneidad.
  • Puede ejecutar la consulta sys.columns o usar sp_describe_first_result_set y select top 0 from <view> para comprobar los tipos de datos después de crear una vista. Este enfoque es más rápido y menos costoso que usar SELECT * FROM....
  • Utilice el generador de instrucciones para crear automáticamente formatos de columna óptimos para la consulta.
  • Use la OPENJSON función para exponer datos JSON anidados como columnas. Pero si también usa el AS JSON comando , el tipo de columna debe ser NVARCHAR(MAX). Este enfoque no es ideal para el rendimiento. La mejor opción es usar la cláusula WITH para exponer matrices anidadas como columnas.
  • La clave de partición del almacén transaccional de Cosmos DB no se usa en el almacén analítico. En Azure Synapse Link, ahora puede modelar los datos transaccionales para optimizar la ingesta de datos y las lecturas puntuales.

Instrucciones adicionales y procedimientos recomendados

Category Acciones o documentación recomendadas
Exploración de datos Almacenamiento de Azure
Almacenamiento de los resultados de la consulta en Azure Storage
Almacenamiento de datos lógico
OPENROWSET y tablas externas Función OPENROWSET
Tablas externas
Procedimientos almacenados
Vistas
Transformaciones de datos
Características de T-SQL disponibles en grupos de SQL sin servidor Características de Transact-SQL compatibles en Azure Synapse SQL

Aviso de declinación de responsabilidades sobre la información de terceros

Los productos de otros fabricantes que se mencionan en este artículo han sido creados por compañías independientes de Microsoft. Microsoft no ofrece ninguna garantía, ya sea implícita o de otro tipo, sobre la confiabilidad o el rendimiento de dichos productos.