Guía de optimización del rendimiento para el grupo de SQL sin servidor de Azure Synapse Analytics
Se aplica a: Azure Synapse Analytics
Este artículo le ayuda a mejorar el rendimiento del grupo de SQL sin servidor de Azure Synapse Analytics.
Nota:
Revise la lista de problemas conocidos que están actualmente activos o resueltos recientemente en Azure Synapse Analytics.
Consulte las secciones siguientes para obtener información sobre cómo lograr un rendimiento óptimo y evitar errores relacionados con restricciones de recursos en los grupos de SQL sin servidor de Azure Synapse Analytics.
Procedimientos recomendados y guías de solución de problemas
La información y las estrategias de los siguientes artículos pueden ayudarle a sacar el mejor rendimiento del grupo de SQL sin servidor. Se recomienda usar estos artículos para revisar los casos de uso y solucionar problemas comunes.
- Procedimientos recomendados para el grupo de SQL sin servidor en Azure Synapse Analytics
- Solución de problemas de grupos de SQL sin servidor en Azure Synapse Analytics
Descripción del escalado en un grupo de SQL sin servidor
Los grupos de SQL sin servidor no requieren que seleccione manualmente el tamaño correcto. El sistema ajusta automáticamente el tamaño en función de los requisitos de consulta y, por tanto, administra la infraestructura y selecciona el tamaño adecuado para la solución.
Guía de optimización del rendimiento para archivos de Delta Lake
Para obtener más información sobre el ajuste del rendimiento de los archivos de Delta Lake, consulte los siguientes recursos:
- Página de documentación de Delta Lake.
- ¿Qué es Delta Lake?
- Consulta de archivos de Delta Lake mediante un grupo de SQL sin servidor en Azure Synapse Analytics
Guía de optimización del rendimiento para archivos CSV
Al consultar archivos CSV en un grupo de SQL sin servidor, la tarea más importante para garantizar el alto rendimiento es crear estadísticas en las tablas externas. Aunque las estadísticas se crean automáticamente en archivos Parquet y CSV, y se accede a ellos mediante OPENQUERY()
, para leer los archivos CSV mediante tablas externas es necesario crear manualmente estadísticas.
Para obtener información más detallada sobre el rol de las estadísticas en la consulta de archivos CSV en grupos de SQL sin servidor, consulte los siguientes artículos:
- Consulta de archivos CSV
- Estadísticas en el grupo de SQL sin servidor
- Creación manual de estadísticas para archivos .csv
- Tiempo de espera de consulta expirado
Recomendaciones para usar Power BI y otras herramientas de informes
Se recomiendan los siguientes procedimientos recomendados al usar Power BI y otras herramientas de informes:
- Compruebe siempre la ubicación del inquilino.
- Configure una memoria caché para mejorar la experiencia del usuario.
- Evite que se devuelvan millones de registros a un panel.
- Use actualizaciones programadas para evitar ejecuciones de consultas paralelas que agoten los recursos del grupo sin servidor de SQL.
- Use Spark para agregar previamente consultas analíticas comunes. Este enfoque de "escritura una vez/lectura muchos" puede evitar consultas intensivas que se ejecutan continuamente.
- Para las combinaciones entre diferentes almacenes de datos: use filtros para evitar volúmenes de macrodatos que se movieron a través de la infraestructura de Azure.
- Use
Latin1_General_100_BIN2_UTF8
la intercalación para los tipos de datos de caracteres. Esta intercalación evita transferir todos los datos del almacenamiento al grupo de SQL sin servidor mediante la inserción de filtros cuando las herramientas leen del almacenamiento. - Use el tamaño más óptimo, si va a convertir o convertir datos en
char
ovarchar
al ejecutar una consulta. Cuando sea posible, evite usarVARCHAR(MAX)
. - La inferencia automática convierte los tipos de datos en un formato que podría no ser óptimo. Utilice la cláusula
WITH
para optimizar los tipos de datos. - Los recursos del grupo sin servidor de Sql de Azure Synapse tienen límites. La ejecución de consultas simultáneamente consumirá recursos. Es habitual ver que los paneles de Power BI (PBI) alcanzan los límites de recursos cuando se producen varias actualizaciones en paralelo. Las actualizaciones programadas y las pruebas de carga pueden ayudar a evitar este problema. Además, el uso de varias áreas de trabajo de Azure Synapse puede abordar mayores requisitos de simultaneidad.
- Puede ejecutar la consulta
sys.columns
o usarsp_describe_first_result_set
yselect top 0 from <view>
para comprobar los tipos de datos después de crear una vista. Este enfoque es más rápido y menos costoso que usarSELECT * FROM...
. - Utilice el generador de instrucciones para crear automáticamente formatos de columna óptimos para la consulta.
- Use la
OPENJSON
función para exponer datos JSON anidados como columnas. Pero si también usa elAS JSON
comando , el tipo de columna debe serNVARCHAR(MAX)
. Este enfoque no es ideal para el rendimiento. La mejor opción es usar la cláusulaWITH
para exponer matrices anidadas como columnas. - La clave de partición del almacén transaccional de Cosmos DB no se usa en el almacén analítico. En Azure Synapse Link, ahora puede modelar los datos transaccionales para optimizar la ingesta de datos y las lecturas puntuales.
Instrucciones adicionales y procedimientos recomendados
Category | Acciones o documentación recomendadas |
---|---|
Exploración de datos | Almacenamiento de Azure Almacenamiento de los resultados de la consulta en Azure Storage Almacenamiento de datos lógico |
OPENROWSET y tablas externas | Función OPENROWSET Tablas externas Procedimientos almacenados Vistas Transformaciones de datos |
Características de T-SQL disponibles en grupos de SQL sin servidor | Características de Transact-SQL compatibles en Azure Synapse SQL |
Aviso de declinación de responsabilidades sobre la información de terceros
Los productos de otros fabricantes que se mencionan en este artículo han sido creados por compañías independientes de Microsoft. Microsoft no ofrece ninguna garantía, ya sea implícita o de otro tipo, sobre la confiabilidad o el rendimiento de dichos productos.