Melhores práticas para utilizar camadas de acesso a blobs
Este artigo fornece diretrizes de melhores práticas que o ajudam a utilizar camadas de acesso para otimizar o desempenho e reduzir os custos. Para saber mais sobre as camadas de acesso, veja Camadas de acesso para dados de blobs.
Escolher as camadas de acesso mais económicas
Pode reduzir os custos ao colocar dados de blobs nas camadas de acesso mais económicas. Escolha entre três camadas concebidas para otimizar os seus custos em torno da utilização de dados. Por exemplo, a camada de acesso frequente tem um custo de armazenamento mais elevado, mas um custo de leitura mais baixo. Por conseguinte, se planear aceder frequentemente aos dados, a camada de acesso frequente poderá ser a escolha mais económica. Se planear ler dados com menos frequência, a camada esporádica, fria ou de arquivo poderá fazer mais sentido porque aumenta o custo da leitura de dados, ao mesmo tempo que reduz o custo do armazenamento de dados.
Para identificar a camada de acesso mais ideal, tente estimar a percentagem dos dados que serão lidos mensalmente. O gráfico seguinte mostra o impacto nas despesas mensais, dadas as várias percentagens de leitura.
Para modelar e analisar o custo da utilização de armazenamento esporádico ou frio versus armazenamento de arquivo, veja Arquivo versus frio e esporádico. Pode aplicar técnicas de modelação semelhantes para comparar o custo de frequente a esporádico, frio ou arquivo.
Migrar dados diretamente para as camadas de acesso mais económicas
Escolher o escalão mais ideal à frente pode reduzir os custos. Se alterar a camada de um blob de blocos que já carregou, pagará o custo de escrita no escalão inicial quando carregar o blob pela primeira vez e, em seguida, pagará o custo de escrita para o escalão pretendido. Se alterar os escalões utilizando uma política de gestão do ciclo de vida, essa política exigirá um dia para entrar em vigor e um dia para concluir a execução. Também irá incorrer no custo de capacidade do armazenamento de dados na camada inicial antes da alteração da camada.
Para obter orientações sobre como carregar para uma camada de acesso específica, veja Definir a camada de acesso de um blob.
Para obter o movimento de dados offline para a camada pretendida, veja Azure Data Box.
Mover dados para as camadas de acesso mais económicas
Após o carregamento dos dados, deve analisar periodicamente os seus contentores e blobs para compreender como são armazenados, organizados e utilizados na produção. Em seguida, utilize políticas de gestão do ciclo de vida para mover dados para os escalões mais económicos. Por exemplo, os dados que não foram acedidos há mais de 30 dias poderão ser mais económicos se forem colocados na camada esporádica. Considere arquivar dados que não são acedidos há mais de 180 dias.
Para recolher telemetria, ative os relatórios de inventário de blobs e ative o controlo da hora do último acesso. Analise padrões de utilização com base na última hora de acesso ao utilizar ferramentas como Azure Synapse ou o Azure Databricks. Para saber mais sobre formas de analisar os seus dados, veja qualquer um destes artigos:
Apêndice de camadas e blobs de página
A sua análise pode revelar blobs de acréscimo ou página que não são utilizados ativamente. Por exemplo, pode ter ficheiros de registo (blobs de acréscimo) que já não estão a ser lidos ou escritos, mas que pretende armazená-los por motivos de conformidade. Da mesma forma, poderá querer criar cópias de segurança de discos ou instantâneos de disco (blobs de páginas). Também pode mover estes blobs para camadas mais frias. No entanto, primeiro tem de convertê-los em blobs de blocos.
Para obter informações sobre como converter blobs de acréscimo e páginas em blobs de blocos, veja Converter blobs de acréscimo e blobs de páginas em blobs de blocos.
Embale ficheiros pequenos antes de mover dados para camadas mais frias
Cada operação de leitura ou escrita implica um custo. Para reduzir o custo de leitura e escrita de dados, considere empacotar ficheiros pequenos em ficheiros maiores utilizando formatos de ficheiro, como TAR ou ZIP. Menos ficheiros reduzem o número de operações necessárias para transferir dados.
O gráfico seguinte mostra o impacto relativo dos ficheiros de embalagem para a camada esporádica. O custo de leitura pressupõe uma percentagem de leitura mensal de 30%.
O gráfico seguinte mostra o impacto relativo dos ficheiros de embalagem para a camada de arquivo. O custo de leitura pressupõe uma percentagem de leitura mensal de 30%.
Para modelar e analisar a poupança de custos dos ficheiros de embalagem, consulte o separador Guardar a Embalagem neste livro.
Dica
Para facilitar cenários de pesquisa e leitura, considere criar um índice que mapeie caminhos de ficheiros embalados com caminhos de ficheiro originais e, em seguida, armazene estes índices como blobs de blocos na camada de acesso frequente.