Compartilhar via


Migrar do Azure Data Factory para o Data Factory no Microsoft Fabric

Este artigo tem como destino os criadores de pipeline do Azure Data Factory e do Synapse Gen2. Fornece orientação e lógica para ajudar a modernizar e migrar seus pipelines para o Data Factory para Microsoft Fabric.

Contexto

O Microsoft Fabric é uma plataforma integrada para dados corporativos gerenciados por TI e de autoatendimento. Com o crescimento exponencial em volumes de dados e complexidade, os clientes do Fabric exigem soluções empresariais que dimensionam, são seguras, fáceis de gerenciar e acessíveis a todos os usuários na maior das organizações.

Nos últimos anos, a Microsoft investiu um trabalho significativo para fornecer recursos de nuvem escalonáveis aos clientes. Para isso, o Data Factory in Fabric capacita um grande ecossistema de desenvolvedores de integração de dados e soluções de integração de dados criadas ao longo de décadas para usar o conjunto completo de recursos e funcionalidades que vão muito além da funcionalidade comparável disponível nas gerações anteriores.

Naturalmente, os clientes estão perguntando se há uma oportunidade de se consolidar hospedando suas soluções de integração de dados no Fabric. Eles geralmente fazem perguntas como:

  • Todas as funcionalidades das quais dependemos funcionam nos pipelines do Fabric?
  • Quais funcionalidades estão disponíveis somente em pipelines do Fabric?
  • Como migrar pipelines existentes para os pipelines do Fabric?
  • Qual é o roteiro da Microsoft para a ingestão de dados corporativos?

As respostas a muitas dessas perguntas são descritas neste artigo.

Observação

A decisão de migrar para as capacidades do Fabric depende dos requisitos de cada cliente. Os clientes devem avaliar cuidadosamente outros benefícios para tomar uma decisão informada. Esperamos ver uma migração orgânica para os pipelines do Fabric ao longo do tempo, e nossa intenção é que isso aconteça nos termos com os quais cada cliente se sinta confortável.

Para ficar claro, atualmente não há planos para preterir o Azure Data Factory ou o Synapse Gen2 para ingestão de dados. Há uma prioridade em concentrar o investimento em pipelines do Fabric para ingestão de dados corporativos e, assim, o valor adicional fornecido pelas capacidades do Fabric aumentará ao longo do tempo. Os clientes que escolherem as capacidades do Fabric podem esperar se beneficiar do alinhamento com o roteiro de produtos do Microsoft Fabric.

Convergência da integração de dados corporativos e de autoatendimento

A consolidação de itens no Fabric simplifica a descoberta, a colaboração e o gerenciamento colocando recursos. Isso permite que as equipes de TI centrais operacionalizem serviços de transformação e movimentação de dados críticos alinhados com padrões corporativos, incluindo linhagem e monitoramento de dados, ao mesmo tempo em que integram mais facilmente itens populares de autoatendimento.

Para dar suporte às necessidades colaborativas e escalonáveis das organizações, os pipelines do Fabric introduzem atividades do Office 365 e do Teams para enviar mensagens, atualizações perfeitas de modelos semânticos do Power BI e recursos de governança robustos, ajudando as organizações a gerenciar a linhagem de dados e o monitoramento de pipeline. A integração da IA generativa por meio do Copilot aprimora ainda mais a experiência de pipeline oferecendo explicações inteligentes de geração de pipeline e resolução de erros, simplificando a criação e o gerenciamento de soluções complexas.

Ao utilizar uma plataforma comum, o fluxo de trabalho é simplificado, aprimorando o desenvolvimento de soluções entre empresas e TI. Isso capacita as organizações a dimensionar suas soluções de dados para níveis corporativos, garantindo alto desempenho, flexibilidade e eficiência no gerenciamento de grandes quantidades de dados.

Capacidades do Fabric

Devido à arquitetura distribuída, as capacidades do Fabric são menos sensíveis à carga geral, picos temporais e alta simultaneidade. Ao consolidar capacidades em SKUs com maior capacidade do Fabric, os clientes podem alcançar um desempenho e uma taxa de transferência aumentados.

Comparação de recursos

A tabela a seguir lista os recursos compatíveis com o Azure Data Factory e o Fabric Data Factory.

Recurso Azure Data Factory Fábrica de Dados do Fabric
Atividades do pipeline
As atividades de Office 365 e do Teams permitem que você envie mensagens de forma integrada, facilitando a comunicação e colaboração eficientes em toda a sua organização Não Sim
Criação de conexões com o modelo semântico do Power BI e o Dataflow Gen2 para garantir que seus dados sejam atualizados de maneira consistente e estejam atualizados Não Sim
Validação em um pipeline para garantir que o pipeline só continuará a execução depois de validar que a referência do conjunto de dados anexada existe, que ela atende aos critérios especificados ou que ela atingiu o tempo limite Sim Sim1
Executar um pacote do SQL Server Integration Services (SSIS) para realizar operações de integração e transformação de dados. Sim Planejado
Transformação de dados
Transformações de dados visualmente projetadas usando clusters do Apache Spark com Mapping Dataflows para criar e gerenciar processos de transformação de dados por meio de uma interface gráfica. Sim Não2
Transformações de dados projetadas visualmente usando o mecanismo de computação do Fabric com a interface gráfica intuitiva do Power Query no Dataflow Gen2 Não Sim
Conectividade
Suporte para todas as fontes de dados Data Factory Sim Em andamento3
Escalabilidade
Garantia da execução sem problemas de atividades em um pipeline com execuções agendadas Sim Sim
Agendar várias execuções para um só pipeline para um gerenciamento flexível e eficiente de processos Sim Planejado
Utilização de gatilhos de janela em cascata para agendar execuções de pipeline em janelas distintas e não sobrepostas Sim Planejado
Gatilhos de evento para automatizar a execução de execuções de pipeline em resposta a ocorrências de eventos específicas ou relevantes Sim Sim4
Inteligência artificial
Copilot for Data Factory, que fornece geração de fluxos de trabalho automatizada e inteligente para integrar dados de maneira simplificada, além de explicações ajudando a compreender melhor fluxos de trabalho complexos ou oferecer sugestões para mensagens de erro. Não Sim
Gerenciamento de conteúdo
Exibição de linhagem de dados, que ajuda os usuários a entender e avaliar as dependências de pipeline Não Sim
Pipelines de implantação, que gerenciam o ciclo de vida do conteúdo Não Sim
Escalabilidade e resiliência da plataforma
arquitetura de capacidade Premium , que suporta um aumento de escala e desempenho Não Sim
suporte a Multi-Geo, que ajuda os clientes multinacionais a atender aos requisitos regionais, específicos do setor ou organizacionais de localização de dados. Sim Sim
Segurança
Conectividade de rede virtual (gateway de dados da rede virtual), que permite ao Fabric funcionar perfeitamente na rede virtual de uma organização Não Planejado
Conectividade de gateway de dados local, que permite o acesso seguro de dados entre as fontes de dados locais de uma organização e os itens do Fabric Não Sim
Suporte para marcas de serviço do Azure, um grupo definido de endereços IP que é gerenciado automaticamente para minimizar a complexidade de atualizações ou alterações nas regras de segurança de rede Sim Sim
Governança
Endosso de conteúdo , para promover ou certificar itens valiosos e de alta qualidade do Fabric Não Sim
Integração do Microsoft Purview, que ajuda os clientes a gerenciar e controlar itens do Fabric Sim Sim
Rótulos de confidencialidade do MIP (Proteção de Informações da Microsoft) e integração ao Microsoft Defender para Aplicativos de Nuvem para prevenção contra perda de dados Não Sim
Monitoramento e Registro em Log de Diagnóstico
Registrando eventos de execução de pipeline em um repositório de eventos para monitorar, analisar e solucionar problemas de desempenho do pipeline Sim Planejado
Central de monitoramento, que fornece recursos de monitoramento para itens Fabric Não Sim
Aplicativo de Métricas de Capacidade do Microsoft Fabric, que fornece funcionalidades de monitoramento para capacidades do Fabric Não Sim
Log de auditoria, que monitora as atividades do usuário no Fabric e no Microsoft 365 Não Sim

1 Use as atividades Obter metadados, Até e Condição If para recuperação de metadados equivalentes da atividade Validação.

2 Use a função Invocar pipeline remoto para executar as atividades de fluxo de dados de mapeamento. Consulte a atividade Invocar pipeline.

3 Para ver os conectores atualmente com suporte para os pipelines de dados. Consulte Suporte de pipeline.

4 Use fluxos de eventos do Fabric e do Reflex para disparar eventos de execução, confira Gatilhos de eventos de pipeline.

Considerações

Há algumas outras questões a serem levadas em conta em seu planejamento antes de migrar para pipelines do Fabric.

Licenciamento

Os pipelines do Fabric exigem, no mínimo, uma licença do Microsoft Fabric (Gratuito) para a criação em um workspace de capacidade premium. Para saber mais, consulte Licenças do Fabric.

Roteiro

A documentação do plano de lançamento do Microsoft Fabric anuncia as atualizações e cronogramas mais recentes para os clientes, à medida que os recursos são preparados para lançamentos futuros, incluindo novidades e planejamentos para o Data Factory no Microsoft Fabric.

Para obter mais informações, confira a documentação do plano de lançamento do Microsoft Fabric.

Saiba como planejar o plano de migração do ADF para o Fabric Data Factory.