Diretrizes de ajuste de desempenho para o pool de SQL sem servidor do Azure Synapse Analytics
Aplica-se ao: Azure Synapse Analytics
Este artigo ajuda você a melhorar o desempenho do pool de SQL sem servidor do Azure Synapse Analytics.
Observação
Examine a lista de problemas conhecidos que estão ativos ou resolvidos recentemente no Azure Synapse Analytics.
Consulte as próximas seções para obter informações sobre como obter o desempenho ideal e evitar falhas relacionadas a restrições de recursos em seus pools de SQL sem servidor do Azure Synapse Analytics.
Práticas recomendadas e guias de solução de problemas
As informações e estratégias nos artigos a seguir podem ajudá-lo a obter o melhor desempenho do pool de SQL sem servidor. Recomendamos que você use esses artigos para analisar casos de uso e solucionar problemas comuns.
- Práticas recomendadas para pool de SQL sem servidor no Azure Synapse Analytics
- Solucionar problemas de pool de SQL sem servidor no Azure Synapse Analytics
Entender o dimensionamento no pool de SQL sem servidor
Os pools de SQL sem servidor não exigem que você selecione manualmente o tamanho certo. O sistema ajusta automaticamente o tamanho com base em seus requisitos de consulta e, assim, gerencia a infraestrutura e seleciona o tamanho certo para sua solução.
Diretrizes de ajuste de desempenho para arquivos do Delta Lake
Para obter mais informações sobre o ajuste de desempenho para arquivos do Delta Lake, consulte os seguintes recursos:
- Página de documentação do Delta Lake.
- O que é o Delta Lake
- Consultar arquivos Delta Lake usando o pool de SQL sem servidor no Azure Synapse Analytics
Diretrizes de ajuste de desempenho para arquivos CSV
Quando você consulta arquivos CSV em um pool de SQL sem servidor, a tarefa mais importante para garantir o alto desempenho é criar estatísticas nas tabelas externas. Embora as estatísticas sejam criadas automaticamente em arquivos Parquet e CSV e acessadas usando OPENQUERY()
o , a leitura dos arquivos CSV usando tabelas externas exige que você crie estatísticas manualmente.
Para obter informações mais detalhadas sobre a função das estatísticas na consulta de arquivos CSV em pools de SQL sem servidor, consulte os seguintes artigos:
- Consultando arquivos CSV
- Estatísticas no pool de SQL sem servidor
- Criar manualmente estatísticas para arquivos CSV
- Tempo limite da consulta expirado
Recomendações para usar o Power BI e outras ferramentas de relatório
Recomendamos as seguintes práticas recomendadas ao usar o Power BI e outras ferramentas de relatório:
- Sempre verifique o local do locatário.
- Configure um cache para uma melhor experiência do usuário.
- Evite retornar milhões de registros a um painel.
- Use atualizações agendadas para evitar execuções de consulta paralelas que drenam os recursos do pool sem servidor do SQL.
- Use o Spark para pré-agregar consultas analíticas comuns. Essa abordagem "escrever uma vez/ler muitas" pode evitar consultas pesadas que são executadas continuamente.
- Para junções entre diferentes armazenamentos de dados: use filtros para evitar volumes de Big Data que foram movidos pela infraestrutura do Azure.
- Use
Latin1_General_100_BIN2_UTF8
ordenação para tipos de dados de caracteres. Essa ordenação evita a transferência de todos os dados do armazenamento para o pool de SQL sem servidor, enviando filtros por push quando as ferramentas leem do armazenamento. - Use o tamanho ideal se você estiver convertendo ou convertendo dados para
char
ouvarchar
durante a execução de uma consulta. Quando possível, evite usar oVARCHAR(MAX)
. - A inferência automática converte tipos de dados em um formato que pode não ser o ideal. Use a cláusula
WITH
para otimizar os tipos de dados. - Os recursos do pool sem servidor do SQL do Azure Synapse têm limites. A execução de consultas simultaneamente consumirá recursos. É comum ver painéis do Power BI (PBI) atingindo limites de recursos quando várias atualizações ocorrem em paralelo. Atualizações agendadas e testes de carga podem ajudar a evitar esse problema. Além disso, o uso de vários workspaces do Azure Synapse pode atender a requisitos de simultaneidade maiores.
- Você pode executar a consulta
sys.columns
ou usarsp_describe_first_result_set
eselect top 0 from <view>
verificar os tipos de dados depois de criar uma exibição. Essa abordagem é mais rápida e menos dispendiosa do que usarSELECT * FROM...
o . - Use o gerador de instruções para criar automaticamente formatos de coluna otimizados para sua consulta.
- Use a
OPENJSON
função para expor dados JSON aninhados como colunas. Mas se você também usar oAS JSON
comando, o tipo de coluna deve serNVARCHAR(MAX)
. Essa abordagem não é ideal para o desempenho. A melhor opção é usar a cláusulaWITH
para expor matrizes aninhadas como colunas. - A chave de partição do repositório transacional do Cosmos DB não é usada no repositório analítico. No Link do Azure Synapse, agora você pode modelar seus dados transacionais para otimizar a ingestão de dados e as leituras pontuais.
Orientação extra e práticas recomendadas
Categoria | Ações ou documentação recomendadas |
---|---|
Exploração de dados | Armazenamento do Azure Armazenar resultados de consulta no armazenamento do Azure Data warehouse lógico |
OPENROWSET e Tabelas Externas | Função OPENROWSET Tabelas externas Procedimentos armazenados Exibições Transformações de dados |
Recursos do T-SQL disponíveis nos pools de SQL sem servidor | Recursos do T-SQL em pools do Azure Synapse |
Aviso de isenção de responsabilidade para informações de terceiros
Os produtos de terceiros mencionados neste artigo são produzidos por empresas independentes da Microsoft. A Microsoft não oferece nenhuma garantia, implícita ou não, do desempenho ou da confiabilidade desses produtos.