Descripción de las capacidades y los casos de uso de los grupos de SQL sin servidor de Azure Synapse
Azure Synapse Analytics es un servicio de análisis integrado que reúne una amplia gama de tecnologías de uso común para procesar y analizar datos a escala. Una de las tecnologías más comunes usadas en las soluciones de datos es SQL, un lenguaje estándar del sector para consultar y manipular datos.
Grupos de SQL sin servidor en Azure Synapse Analytics
Azure Synapse SQL es un sistema de consultas distribuido en Azure Synapse Analytics que ofrece dos tipos de entornos en tiempo de ejecución:
- Grupo de SQL sin servidor: procesamiento de consultas SQL bajo demanda, que se usa principalmente para trabajar con datos en un lago de datos.
- Grupo de SQL dedicado: instancias de bases de datos relacionales a escala empresarial que se usan para hospedar almacenes de datos en los que los datos se almacenan en tablas relacionales.
En este módulo, nos centraremos en el grupo de SQL sin servidor, que proporciona un punto de conexión de pago por consulta para consultar los datos del lago de datos. Entre las ventajas de usar el grupo de SQL sin servidor se incluyen:
- Una sintaxis Transact-SQL conocida para consultar los datos activos sin necesidad de copiarlos ni cargarlos en un almacén especializado.
- Conectividad integrada de una amplia gama de herramientas de inteligencia empresarial y consulta ad hoc, entre las que se incluyen los controladores más populares.
- Procesamiento de consultas distribuido creado para datos a gran escala y funciones de cálculo, lo que da lugar a un rápido rendimiento de las consultas.
- Tolerancia a errores integrada en la ejecución de consultas, que ofrece una alta confiabilidad y un alto índice de éxito incluso para consultas de ejecución prolongada que implican grandes conjuntos de datos.
- No hay infraestructura que configurar ni clústeres que mantener. Se proporciona un punto de conexión integrado para este servicio en cada área de trabajo de Azure Synapse, por lo que puede empezar a consultar datos tan pronto como se crea el área de trabajo.
- No se cobra por los recursos reservados, solo se cobra por los datos procesados por las consultas que ejecute.
Cuándo usar grupos de SQL sin servidor
El grupo de SQL sin servidor se adapta para consultar los datos contenidos en el lago de datos, por lo que, además de eliminar la carga de administración, elimina la necesidad de preocuparse por la ingesta de datos en el sistema. Solo tiene que dirigir la consulta a los datos que ya están en el lago y ejecutarla.
El modelo de recursos sin servidor Synapse SQL es ideal para cargas de trabajo no planeadas o repentinas que se pueden procesar con el punto de conexión de SQL sin servidor siempre activo en su área de trabajo de Azure Synapse Analytics. El uso del grupo sin servidor es útil cuando necesita conocer el costo exacto de cada consulta ejecutada para supervisar y atribuir los costos.
Nota:
El grupo de SQL sin servidor es un sistema de análisis y no se recomiendan cargas de trabajo para OLTP, como bases de datos usadas por aplicaciones para almacenar datos de transacciones. Las cargas de trabajo que requieren tiempos de respuesta en milisegundos y buscan localizar una sola fila de un conjunto de datos no son adecuadas para el grupo de SQL sin servidor.
Entre los casos de uso habituales de grupos de SQL sin servidor se incluyen:
- Exploración de datos: la exploración de datos le permite examinar el lago de datos y obtener información inicial sobre los datos, y se puede realizar fácilmente mediante Azure Synapse Studio. Puede examinar los archivos del almacenamiento del lago de datos vinculado y usar el grupo de SQL sin servidor integrado para generar automáticamente un script de SQL y seleccionar las 100 filas superiores de un archivo o carpeta, al igual que lo haría con una tabla de SQL Server. A partir de ese punto, puede aplicar proyecciones, filtrados, agrupaciones y la mayoría de las operaciones en los datos como si estuvieran en una tabla de SQL Server normal.
- Transformación de datos: Azure Synapse Analytics proporciona excelentes capacidades de transformaciones de datos con Synapse Spark. Sin embargo, a algunos ingenieros de datos puede resultarles más fácil realizar la transformación de datos mediante SQL. El grupo de SQL sin servidor le permite realizar transformaciones de datos basadas en SQL, ya sea de forma interactiva o como parte de una canalización de datos automatizada.
- Almacenamiento de datos lógico: después de la exploración inicial de los datos en el lago de datos, puede definir objetos externos como tablas y vistas en una base de datos de SQL sin servidor. Los datos permanecen almacenados en los archivos del lago de datos, pero se abstraen mediante un esquema relacional que pueden usar las aplicaciones cliente y las herramientas analíticas para consultar los datos como lo harían en una base de datos relacional hospedada en SQL Server.