Partilhar via


Diretrizes de ajuste de desempenho para o pool de SQL sem servidor do Azure Synapse Analytics

Aplica-se ao: Azure Synapse Analytics

Este artigo ajuda você a melhorar o desempenho do pool de SQL sem servidor do Azure Synapse Analytics.

Observação

Examine a lista de problemas conhecidos que estão ativos ou resolvidos recentemente no Azure Synapse Analytics.

Consulte as próximas seções para obter informações sobre como obter o desempenho ideal e evitar falhas relacionadas a restrições de recursos em seus pools de SQL sem servidor do Azure Synapse Analytics.

Práticas recomendadas e guias de solução de problemas

As informações e estratégias nos artigos a seguir podem ajudá-lo a obter o melhor desempenho do pool de SQL sem servidor. Recomendamos que você use esses artigos para analisar casos de uso e solucionar problemas comuns.

Entender o dimensionamento no pool de SQL sem servidor

Os pools de SQL sem servidor não exigem que você selecione manualmente o tamanho certo. O sistema ajusta automaticamente o tamanho com base em seus requisitos de consulta e, assim, gerencia a infraestrutura e seleciona o tamanho certo para sua solução.

Diretrizes de ajuste de desempenho para arquivos do Delta Lake

Para obter mais informações sobre o ajuste de desempenho para arquivos do Delta Lake, consulte os seguintes recursos:

Diretrizes de ajuste de desempenho para arquivos CSV

Quando você consulta arquivos CSV em um pool de SQL sem servidor, a tarefa mais importante para garantir o alto desempenho é criar estatísticas nas tabelas externas. Embora as estatísticas sejam criadas automaticamente em arquivos Parquet e CSV e acessadas usando OPENQUERY()o , a leitura dos arquivos CSV usando tabelas externas exige que você crie estatísticas manualmente.

Para obter informações mais detalhadas sobre a função das estatísticas na consulta de arquivos CSV em pools de SQL sem servidor, consulte os seguintes artigos:

Recomendações para usar o Power BI e outras ferramentas de relatório

Recomendamos as seguintes práticas recomendadas ao usar o Power BI e outras ferramentas de relatório:

  • Sempre verifique o local do locatário.
  • Configure um cache para uma melhor experiência do usuário.
  • Evite retornar milhões de registros a um painel.
  • Use atualizações agendadas para evitar execuções de consulta paralelas que drenam os recursos do pool sem servidor do SQL.
  • Use o Spark para pré-agregar consultas analíticas comuns. Essa abordagem "escrever uma vez/ler muitas" pode evitar consultas pesadas que são executadas continuamente.
  • Para junções entre diferentes armazenamentos de dados: use filtros para evitar volumes de Big Data que foram movidos pela infraestrutura do Azure.
  • Use Latin1_General_100_BIN2_UTF8 ordenação para tipos de dados de caracteres. Essa ordenação evita a transferência de todos os dados do armazenamento para o pool de SQL sem servidor, enviando filtros por push quando as ferramentas leem do armazenamento.
  • Use o tamanho ideal se você estiver convertendo ou convertendo dados para char ou varchar durante a execução de uma consulta. Quando possível, evite usar o VARCHAR(MAX).
  • A inferência automática converte tipos de dados em um formato que pode não ser o ideal. Use a cláusula WITH para otimizar os tipos de dados.
  • Os recursos do pool sem servidor do SQL do Azure Synapse têm limites. A execução de consultas simultaneamente consumirá recursos. É comum ver painéis do Power BI (PBI) atingindo limites de recursos quando várias atualizações ocorrem em paralelo. Atualizações agendadas e testes de carga podem ajudar a evitar esse problema. Além disso, o uso de vários workspaces do Azure Synapse pode atender a requisitos de simultaneidade maiores.
  • Você pode executar a consulta sys.columns ou usar sp_describe_first_result_set e select top 0 from <view> verificar os tipos de dados depois de criar uma exibição. Essa abordagem é mais rápida e menos dispendiosa do que usar SELECT * FROM...o .
  • Use o gerador de instruções para criar automaticamente formatos de coluna otimizados para sua consulta.
  • Use a OPENJSON função para expor dados JSON aninhados como colunas. Mas se você também usar o AS JSON comando, o tipo de coluna deve ser NVARCHAR(MAX). Essa abordagem não é ideal para o desempenho. A melhor opção é usar a cláusula WITH para expor matrizes aninhadas como colunas.
  • A chave de partição do repositório transacional do Cosmos DB não é usada no repositório analítico. No Link do Azure Synapse, agora você pode modelar seus dados transacionais para otimizar a ingestão de dados e as leituras pontuais.

Orientação extra e práticas recomendadas

Categoria Ações ou documentação recomendadas
Exploração de dados Armazenamento do Azure
Armazenar resultados de consulta no armazenamento do Azure
Data warehouse lógico
OPENROWSET e Tabelas Externas Função OPENROWSET
Tabelas externas
Procedimentos armazenados
Exibições
Transformações de dados
Recursos do T-SQL disponíveis nos pools de SQL sem servidor Recursos do T-SQL em pools do Azure Synapse

Aviso de isenção de responsabilidade para informações de terceiros

Os produtos de terceiros mencionados neste artigo são produzidos por empresas independentes da Microsoft. A Microsoft não oferece nenhuma garantia, implícita ou não, do desempenho ou da confiabilidade desses produtos.