Compartilhar via


Configurar pontos de extremidade de fluxo de dados para o Azure Data Lake Storage Gen2

Importante

A Versão Prévia das Operações da Internet das Coisas do Azure – habilitadas pelo Azure Arc – está atualmente em versão prévia. Você não deve usar esse software em versão prévia em ambientes de produção.

Você precisará implantar uma nova instalação das Operações do Azure IoT quando uma versão estiver disponibilidade geral. Você não poderá atualizar uma instalação de versão prévia.

Para os termos legais que se aplicam aos recursos do Azure que estão em versão beta, versão prévia ou que, de outra forma, ainda não foram lançados em disponibilidade geral, confira os Termos de Uso Complementares para Versões Prévias do Microsoft Azure.

Para enviar dados para o Azure Data Lake Storage Gen2 no Azure IoT Operations Preview, você pode configurar um ponto de extremidade de fluxo de dados. Essa configuração permite que você especifique o ponto de extremidade de destino, o método de autenticação, a tabela e outras configurações.

Pré-requisitos

Criar um ponto de extremidade de fluxo de dados do Azure Data Lake Storage Gen2

Para configurar um ponto de extremidade de fluxo de dados para o Azure Data Lake Storage Gen2, sugerimos usar a identidade gerenciada do cluster Kubernetes habilitado para Azure Arc. Essa abordagem é segura e elimina a necessidade de gerenciamento secreto. Como alternativa, você pode se autenticar na conta de armazenamento usando um token de acesso. Ao usar um token de acesso, você precisará criar um segredo do Kubernetes contendo o token SAS.

  1. No portal de Operações de IoT, selecione a guia Pontos de extremidade de fluxo de dados.

  2. Em Criar ponto de extremidade de fluxo de dados, selecione Azure Data Lake Storage (2ª geração)>Novo.

    Captura de tela usando a experiência de operações para criar um ponto de extremidade de fluxo de dados ADLS V2.

  3. Insira as configurações a seguir para o ponto de extremidade:

    Configuração Descrição
    Nome O nome do ponto de extremidade do fluxo de dados.
    Host O nome do host do ponto de extremidade do Azure Data Lake Storage Gen2 no formato <account>.blob.core.windows.net. Substitua o espaço reservado da conta pelo nome da conta do ponto de extremidade.
    Método de autenticação O método usado para autenticação. Selecione Identidade gerenciada atribuída pelo sistema, Identidade gerenciada atribuída pelo usuário ou Token de acesso.
    ID do Cliente A ID do cliente da identidade gerenciada atribuída pelo usuário. Necessário se estiver usando a Identidade gerenciada atribuída pelo usuário.
    ID do locatário A ID do locatário de uma identidade gerenciada atribuída pelo usuário. Necessário se estiver usando a Identidade gerenciada atribuída pelo usuário.
    Nome do segredo do token de acesso O nome do segredo do Kubernetes que contém o token SAS. Necessário se estiver usando o Token de acesso.
  4. Selecione Aplicar para provisionar o ponto de extremidade.

Se você precisar substituir o público de identidade gerenciada atribuída pelo sistema, veja a seção Identidade gerenciada atribuída pelo sistema.

Usar autenticação de token de acesso

Siga as etapas na seção token de acesso para obter um token SAS para a conta de armazenamento e armazená-lo em um segredo do Kubernetes.

Em seguida, crie o recurso DataflowEndpoint e especifique o método de autenticação do token de acesso. Aqui, substitua <SAS_SECRET_NAME> pelo nome do segredo que contém o token SAS, bem como outros valores de espaço reservado.

  1. No portal de Operações de IoT, selecione a guia Pontos de extremidade de fluxo de dados.

  2. Em Criar ponto de extremidade de fluxo de dados, selecione Azure Data Lake Storage (2ª geração)>Novo.

  3. Insira as configurações a seguir para o ponto de extremidade:

    Configuração Descrição
    Nome O nome do ponto de extremidade do fluxo de dados.
    Host O nome do host do ponto de extremidade do Azure Data Lake Storage Gen2 no formato <account>.blob.core.windows.net. Substitua o espaço reservado da conta pelo nome da conta do ponto de extremidade.
    Método de autenticação O método usado para autenticação. Escolha Token de acesso.
    Nome do segredo sincronizado O nome do segredo do Kubernetes que é sincronizado com o ponto de extremidade ADLSv2.
    Nome do segredo do token de acesso O nome do segredo do Kubernetes que contém o token SAS.
  4. Selecione Aplicar para provisionar o ponto de extremidade.

Métodos de autenticação disponíveis

Os seguintes métodos de autenticação estão disponíveis para pontos de extremidade do Azure Data Lake Storage Gen2.

Para obter mais informações sobre como habilitar configurações seguras configurando um Azure Key Vault e habilitando identidades de carga de trabalho, veja Habilitar configurações seguras na implantação de visualização do Azure IoT Operations.

Identidade gerenciada atribuída pelo sistema

Usar a identidade gerenciada atribuída pelo sistema é o método de autenticação recomendado para Operações do Azure IoT. O Operações do Azure IoT cria automaticamente a identidade gerenciada e a atribui ao cluster Kubernetes habilitado para Azure Arc. Ele elimina a necessidade de gerenciamento secreto e permite autenticação perfeita.

Antes de criar o ponto de extremidade do fluxo de dados, atribua uma função à identidade gerenciada que tenha permissão de gravação na conta de armazenamento. Por exemplo, você pode atribuir a função Contribuidor de Dados do Blob de Armazenamento. Para saber mais sobre como atribuir funções a blobs, veja Autorizar acesso a blobs usando o Microsoft Entra ID.

  1. No portal do Azure, acesse sua instância do Azure IoT Operations e selecione Visão geral.
  2. Copie o nome da extensão listada após Extensão do Azure IoT Operations Arc. Por exemplo, azure-iot-operations-xxxx7.
  3. Procure a identidade gerenciada no portal do Azure usando o nome da extensão. Por exemplo, pesquise por azure-iot-operations-xxxx7.
  4. Atribua uma função à identidade gerenciada da extensão Azure IoT Operations Arc que conceda permissão para gravar na conta de armazenamento, como Storage Blob Data Contributor. Para saber mais, confira Autorizar o acesso a blobs usando o Microsoft Entra ID.
  5. Crie o recurso DataflowEndpoint e especifique o método de autenticação de identidade gerenciada.

Na página de configurações do ponto de extremidade do fluxo de dados da experiência de operações, selecione a guia Básico e escolha Método de autenticação>Identidade gerenciada atribuída pelo sistema.

Na maioria dos casos, você não precisa especificar um público-alvo do serviço. Não especificar um público cria uma identidade gerenciada com o público padrão limitado à sua conta de armazenamento.

Se precisar substituir o público de identidade gerenciada atribuído pelo sistema, você pode especificar a configuração audience.

Na maioria dos casos, você não precisa especificar um público-alvo do serviço. Não especificar um público cria uma identidade gerenciada com o público padrão limitado à sua conta de armazenamento.

Token de acesso

Usar um token de acesso é um método de autenticação alternativo. Este método exige que você crie um segredo do Kubernetes com o token SAS e faça referência ao segredo no recurso DataflowEndpoint.

Obtenha um token SAS para uma conta do Azure Data Lake Storage Gen2 (ADLSv2). Por exemplo, use o portal do Azure para navegar até sua conta de armazenamento. No menu à esquerda, escolha Segurança + rede>Assinatura de acesso compartilhado. Use a tabela a seguir para definir as permissões necessárias.

Parâmetro Configuração habilitada
Serviços permitidos Blob
Tipos de recursos permitidos Objeto, Contêiner
Permissões aceitas Ler, Gravar, Excluir, Listar, Criar

Para aumentar a segurança e seguir o princípio do menor privilégio, você pode gerar um token SAS para um contêiner específico. Para evitar erros de autenticação, certifique-se de que o contêiner especificado no token SAS corresponda à configuração de destino do fluxo de dados.

Na página de configurações do ponto de extremidade do fluxo de dados da experiência de operações, selecione a guia Básico e escolha Método de autenticação>Token de acesso.

Insira o nome do segredo do token de acesso que você criou no Nome do segredo do token de acesso.

Para saber mais sobre segredos, veja Criar e gerenciar segredos no Azure IoT Operations Preview.

Identidade gerenciada atribuída pelo usuário

Para usar a identidade gerenciada pelo usuário para autenticação, primeiro você deve implantar as Operações do Azure IoT com configurações seguras habilitadas. Para saber mais, consulte Habilitar configurações seguras na implantação da Visualização das Operações do Azure IoT.

Em seguida, especifique o método de autenticação de identidade gerenciada atribuída pelo usuário, juntamente com a ID do cliente, a ID do locatário e o escopo da identidade gerenciada.

Na página de configurações do ponto de extremidade do fluxo de dados da experiência de operações, selecione a guia Básico e escolha Método de autenticação>Identidade gerenciada atribuída pelo usuário.

Insira a ID do cliente de identidade gerenciada atribuída pelo usuário e a ID do locatário nos campos apropriados.

Aqui, o escopo é opcional e o padrão é https://storage.azure.com/.default. Se você precisar substituir o escopo padrão, especifique a configuração scope por meio do manifesto do Bicep ou Kubernetes.

Configurações avançadas

Você pode definir configurações avançadas para o ponto de extremidade do Azure Data Lake Storage Gen2, como latência de lote e contagem de mensagens.

Use as configurações batching para configurar o número máximo de mensagens e a latência máxima antes que as mensagens sejam enviadas ao destino. Essa configuração é útil quando você deseja otimizar a largura de banda da rede e reduzir o número de solicitações ao destino.

Campo Descrição Obrigatório
latencySeconds O número máximo de segundos para aguardar antes de enviar as mensagens ao destino. O valor padrão é 60 segundos. Não
maxMessages O número máximo de mensagens para enviar ao destino. O valor padrão é de 100.000 mensagens. Não

Por exemplo, para configurar o número máximo de mensagens para 1.000 e a latência máxima para 100 segundos, use as seguintes configurações:

Na experiência de operações, selecione a guia Avançado do ponto de extremidade do fluxo de dados.

Captura de tela usando a experiência de operações para definir as configurações avançadas do ADLS V2.

Próximas etapas

Para saber mais sobre fluxos de dados, confira Criar um fluxo de dados.