Compartilhar via


Atualizar o Armazenamento de Blobs do Azure com os recursos do Azure Data Lake Storage

Este artigo ajuda você a habilitar um namespace hierárquico e desbloquear recursos como segurança no nível de arquivo e de diretório e operações mais rápidas. Esses recursos são amplamente utilizados por cargas de trabalho de análise de Big Data e são chamados coletivamente de Azure Data Lake Storage.

Para saber mais sobre esses recursos e avaliar o impacto dessa atualização nas cargas de trabalho, aplicativos, custos, integrações de serviço, ferramentas, recursos e documentação, consulte Atualizar o Armazenamento de Blobs do Azure com recursos do Azure Data Lake Storage.

Importante

A atualização é unidirecional. Não há como reverter sua conta depois de fazer a atualização. Recomendamos que você valide a atualização em um ambiente de não produção.

Prepare-se para atualizar

Para se preparar para atualizar sua conta de armazenamento para Data Lake Storage:

Revisar suporte do recurso

Sua conta de armazenamento pode estar configurada para usar recursos que ainda não têm suporte em contas habilitadas para Data Lake Storage. Se a conta estiver usando esses recursos, a atualização não passará na etapa de validação. Revise o artigo Suporte ao recurso de Armazenamento de Blobs em contas do Armazenamento do Azure para identificar os recurso sem suporte. Se você estiver usando qualquer um desses recursos em sua conta, desabilite-os antes de iniciar a atualização.

Os seguintes recursos têm suporte para contas Data Lake Storage, mas não têm suporte no processo de atualização:

  • Instantâneos de blobs
  • Escopos de criptografia
  • Armazenamento imutável
  • Controle de tempo do último acesso para o gerenciamento do ciclo de vida
  • Exclusão reversível para blobs
  • Exclusão reversível para contêineres

Se sua conta de armazenamento tiver esses recursos habilitados, você deverá desabilitá-los antes de executar a atualização. Se você quiser continuar usando os recursos após a conclusão da atualização, habilite-os novamente.

Em alguns casos, você terá que dar tempo para operações de limpeza depois que um recurso for desabilitado antes da atualização. Um exemplo é o recurso de exclusão temporária de blob. Desabilite a exclusão temporária de blob e permita que todos os blobs de exclusão temporária expirem antes de atualizar a conta.

Importante

Não é possível atualizar uma conta de armazenamento para Data Lake Storage que teve o recurso de feed de alterações habilitado. Simplesmente desabilitar o feed de alterações não permitirá que você execute uma atualização. Em vez disso, você deve criar uma conta com o recurso de namespace hierárquico habilitado e, em seguida, mover e transferir seus dados para essa conta.

Remover blobs de páginas da conta de armazenamento

Não é possível atualizar uma conta de armazenamento que contenha blobs de páginas. Certifique-se de remover blobs de páginas da conta de armazenamento antes de executar a atualização.

Verifique se os segmentos de cada caminho de blob são nomeados

O processo de migração cria um diretório para cada segmento de caminho de um blob. Os diretórios do Data Lake Storage devem ter um nome para que a migração seja bem-sucedida, cada segmento de caminho em um diretório virtual deve ter um nome. O mesmo requisito é verdadeiro para segmentos que são nomeados apenas com um caractere de espaço. Se os segmentos de caminho não tiverem nome (//) ou nomeados apenas com um caractere de espaço (_), antes de prosseguir com a migração, você deverá copiar esses blobs para um novo caminho compatível com esses requisitos de nomenclatura.

Impedir a atividade de gravação na conta de armazenamento

A atualização poderá falhar se um aplicativo gravar na conta de armazenamento durante a atualização. Para evitar essa atividade de gravação:

  1. Verifique todos os aplicativos ou serviços que possam executar operações de gravação.

  2. Libere ou interrompa as concessões existentes em contêineres e blobs na conta de armazenamento.

Depois que a atualização for concluída, interrompa as concessões criadas para retomar, permitindo o acesso de gravação aos contêineres e blobs.

Aviso

Interromper uma concessão ativa sem desabilitar normalmente aplicativos ou máquinas virtuais que estão acessando esses recursos no momento pode ter resultados inesperados. Certifique-se de confirmar as atividades de gravação atuais antes de interromper as concessões atuais.

Realizar a atualização

  1. Entre no portal do Azure para começar.

  2. Localize sua conta de armazenamento e exiba a visão geral dela.

  3. Selecione Migração do Data Lake Gen2.

    A página de configuração Atualizar para uma conta de armazenamento com funcionalidades do Azure Data Lake Gen2 aparecerá.

    Página de Configuração

  4. Expanda a seção Etapa 1: Revisar alterações de conta antes de atualizar e clique em Revisar e concordar com as alterações.

  5. Na página Revisar alterações de conta, marque a caixa de seleção e clique em Concordar com as alterações.

  6. Expanda a seção Etapa 2: Validar conta antes de atualizar e clique em Iniciar validação.

    Se a validação falhar, um erro aparecerá na página. Em alguns casos, aparece um link Exibir erros. Se esse link for exibido, selecione-o.

    Exibir o link de erros

    Em seguida, no menu de contexto do arquivo error.json, selecione Baixar.

    Página de erro de json

    Abra o arquivo baixado para determinar por que a conta não passou na etapa de validação. O JSON a seguir indica que um recurso incompatível está habilitado na conta. Nesse caso, você desabilitaria o recurso e iniciaria o processo de validação novamente.

    {
     "startTime": "2021-08-04T18:40:31.8465320Z",
     "id": "45c84a6d-6746-4142-8130-5ae9cfe013a0",
     "incompatibleFeatures": [
         "Blob Delete Retention Enabled"
     ],
     "blobValidationErrors": [],
     "scannedBlobCount": 0,
     "invalidBlobCount": 0,
     "endTime": "2021-08-04T18:40:34.9371480Z"
    }
    
  7. Depois que sua conta tiver sido validada com êxito, expanda a seção Etapa 3: Atualizar conta e clique em Iniciar atualização.

    Importante

    As operações de gravação são desabilitadas enquanto sua conta está sendo atualizada. As operações de leitura não estão desabilitadas, mas é altamente recomendável suspendê-las, pois elas podem desestabilizar o processo de atualização.

    Quando a migração for concluída com êxito, uma mensagem semelhante à seguinte será exibida.

    Página de Migração concluída

Parar a atualização

Você pode interromper a migração antes que ela seja concluída.

Para interromper a atualização antes da conclusão, selecione Cancelar atualização enquanto a atualização estiver em andamento.

Cancelar a atualização

Migrar dados, cargas de trabalho e aplicativos

  1. Configure os serviços em suas cargas de trabalho para apontar para o ponto de extremidade do serviço Blob ou para o ponto de extremidade de Armazenamento do Data Lake.

    Pontos de extremidade da conta

  2. Para as cargas de trabalho do Hadoop que usam o driver do Azure Storage Blob do Windows ou o driver do WASB, certifique-se de modificá-las para usar o driver do Azure Blob File System (ABFS). Ao contrário do driver do WASB, que faz solicitações para o ponto de extremidade do serviço Blob, o driver do ABFS fará solicitações para o ponto de extremidade do Data Lake Storage de sua conta.

  3. Teste aplicativos personalizados para garantir que eles funcionem conforme o esperado com sua conta atualizada.

    O Acesso de vários protocolos no Data Lake Storage permite que a maioria dos aplicativos continue usando APIs de Blob sem modificação. Se você encontrar problemas ou se quiser usar APIs para trabalhar com operações de diretório e ACLs, considere mover parte do seu código para usar as APIs do Data Lake Storage. Consulte as diretrizes para .NET, Java, Python, Node.js e REST.

  4. Teste qualquer script personalizado para garantir que eles funcionem conforme o esperado com sua conta atualizada.

    Como é o caso das APIs de BLOB, muitos de seus scripts provavelmente funcionarão sem precisar que você os modifique. No entanto, se necessário, é possível atualizar os arquivo de script para usar cmdlets do PowerShell do Data Lake Storage e comandos da CLI do Azure.

Confira também

Introdução ao Azure Data Lake Storage