Exercício - Use a atividade de cópia de fábrica de dados
Quando a criação da instância do Data Factory estiver concluída, você poderá ir para o recurso onde poderá começar a criar seus pipelines de dados clicando no botão Author & Monitor . Isso abrirá a seguinte tela:
A primeira etapa em seu pipeline é criar uma Atividade de cópia que copia dados entre a origem e o destino usando as etapas a seguir.
Abra a tela de criação clicando no ícone de lápis na barra lateral esquerda ou no botão criar pipeline para abrir a tela de criação.
Criar o pipeline. Clique no + botão no painel Recursos de fábrica e selecione Pipeline.
Adicione uma atividade de cópia. No painel Atividades, abra o acordeão Mover e Transformar e arraste a atividade Copiar Dados para a tela do pipeline.
Com a Atividade de cópia adicionada, você começa a definir os dados de origem
Na guia Fonte das configurações de Copiar atividade, clique em + Novo para selecionar uma fonte de dados.
Por exemplo, na lista de armazenamento de dados, selecione o bloco do Amazon S3 e clique em continuar
Na lista de formatos de arquivo, selecione o bloco Formato DelimitedText e clique em continuar
Na janela Definir Propriedades, dê ao seu conjunto de dados um nome compreensível e clique no menu suspenso Serviço Vinculado. Se você não criou o Serviço Vinculado do S3, selecione Novo.
Específico para o painel de configuração do Serviço Vinculado do S3, especifique a chave de acesso e a chave secreta do S3. O serviço Data Factory criptografa credenciais com certificados gerenciados pela Microsoft. Para obter mais informações, consulte Considerações sobre segurança de movimentação de dados. Para verificar se suas credenciais são válidas, clique em Testar Conexão. Clique em Criar quando terminar.
Depois de criar e selecionar o serviço vinculado, especifique o restante das configurações do conjunto de dados. Essas configurações especificam como e onde na sua conexão você deseja extrair os dados. Clique em Concluir depois de concluído.
Para verificar se o conjunto de dados está configurado corretamente, clique em Visualizar Dados na guia Origem da Atividade de Cópia para obter um pequeno instantâneo dos dados.
Com os dados de origem definidos, você definirá o coletor no qual os dados serão carregados. Neste exemplo, o coletor será o Azure Data Lake Storage Gen2 executando as seguintes etapas:
Na guia Coletor, clique em + Novo
Selecione o bloco Azure Data lake Storage Gen2 e clique em continuar
Em Definir navegação lateral Propriedades, dê ao conjunto de dados um nome compreensível e clique na lista suspensa Serviço vinculado. Se você não criou seu Serviço Vinculado ADLS, selecione Novo.
No painel de configuração do serviço vinculado ADLS, selecione seu método de autenticação e insira suas credenciais. No exemplo abaixo, uma chave de conta e selecionou minha conta de armazenamento na lista suspensa.
Depois de configurar o serviço vinculado, insira a configuração do conjunto de dados ADLS. Clique em Concluir depois de concluído.
Neste ponto, você configurou totalmente sua atividade de cópia.
Para testá-lo, clique no botão Depurar na parte superior da tela do pipeline. Isso iniciará uma execução de depuração de pipeline.
Para monitorar o progresso de uma execução de depuração de pipeline, clique na guia Saída do pipeline
Para visualizar uma descrição mais detalhada da saída da atividade, clique no ícone de óculos. Isso abrirá a tela de monitoramento de cópias, que fornece métricas úteis, como dados lidos/gravados, taxa de transferência e estatísticas detalhadas de duração.
Para verificar se a cópia funcionou conforme o esperado, abra sua conta de armazenamento ADLS gen2 e verifique se o arquivo foi escrito conforme o esperado