Compartilhar via


Visão geral de fontes de dados

Para configurar o Dynamics 365 Customer Insights - Data, primeiro traga dados fonte para processamento. O Customer Insights - Data oferece diversos tipos de conectores de dados para se conectar a e ingerir dados de um conjunto de fontes abrangente.

Este artigo descreve opções que podem afetar o desempenho da ingestão de dados.

Formato Delta

O formato de dados Delta é o formato de processamento nativo usado pelo Customer Insights – Data. Se você conseguir fornecer dados de origem no formato Delta, haverá muitas vantagens.

  • Melhor eficiência com o Customer Insights - Data: o Customer Insights - Data usa internamente o formato Delta.
  • Ingestão de dados mais rápida: o formato Delta oferece compactação superior tendo em vista transferências de dados mais rápidas.
  • Unificação mais rápida: quando o recurso viagem no tempo Delta é usado, o Customer Insights – Data só unifica os dados alterados. Ele não reprocessa todo o conjunto de dados. Para unificação incremental, todas as entradas de dados na unificação devem estar no formato Delta.
  • Menos problemas de danos nos dados: o formato Delta reduz as partições corrompidas e os problemas de danos comuns nos dados causados por formatos mais antigos, como o formato CSV (valores separados por vírgula).
  • Design do gerenciamento de dados mais confiável: o formato Delta não exige atualizações manuais para manifestos, esquemas e arquivos de partição.
  • Mais validade de dados: o formato Delta oferece transações de atomicidade, consistência, isolamento, durabilidade (ACID), além dos níveis de isolamento no Spark.

Você pode usar o formato Delta com os seguintes conectores:

Delta é um termo introduzido no Delta Lake, o fundamento para armazenar dados e tabelas na plataforma Databricks Lakehouse. Delta Lake é uma camada de armazenamento de código aberto que leva transações ACID (atomicidade, consistência, isolamento e durabilidade) para cargas de trabalho do big data. Para obter mais informações, consulte a Página de documentação do Delta Lake.

Anexo ou importação da fonte de dados

Quando você decide como ingerir os dados, uma consideração-chave é se o conector de dados é anexo aos dados ou faz cópias deles. Ao usar o Customer Insights - Data, recomendamos a você usar um conector anexo aos dados. Assim, os dados são acessados diretamente no momento de processá-los. Se você usar um conector que copie os dados, atrasos podem ocorrer quando os dados são atualizados.

Os seguintes conectores de dados são anexados aos dados:

Se você não conseguir usar um conector anexo aos dados, copie-os usando um dos conectores do Power Query. O Power Query oferece uma maneira útil de transformar os dados.

Criação de perfil de dados

Quando os dados são ingeridos, o Customer Insights – Data realiza uma criação de perfil de dados básicos. Por exemplo, ele cria o perfil da frequência de valores repetidos em uma coluna. Você pode usar dados de perfil para compreender os dados e resolver os problemas. Por exemplo, se estiver comparando a coluna FullName, a criação de perfil dos dados poderá ajudar você a detectar se o valor padrão Inserir o nome é exibido em 10.000 linhas. Por isso, se você comparar esse valor, 10.000 linhas que não devem ser comparadas serão correlacionadas. Ao adicionar o Azure Data Lake, as tabelas Delta ou as fontes de dados do Azure Synapse, você pode habilitar a criação de perfil dos dados para mais colunas.

Depois de ingerir os dados, você poderá exibir os resultados da criação de perfil dos dados.

  1. Vá até Dados>Tabelas e selecione uma tabela. Em seguida, na linha de um campo (por exemplo, DateOfBirth), na coluna Resumo, selecione o ícone Resumo .

    Captura de tela da guia Atributos na página da tabela Cliente, realçando o ícone Resumo do campo DateOfBirth.

  2. Revise os detalhes em busca de erros ou valores não encontrados.

    Captura de tela que mostra o resumo do campo DateOfBirth, inclusive o gráfico dos principais valores por contagem.

Página fontes de dados

A página Fontes de dados lista as fontes de dados em duas seções:

  • Gerenciado por mim: os fluxos de dados do Microsoft Power Platform criados e gerenciados. Outros usuários só podem exibir esses fluxos de dados. Eles não podem atualizar nem editá-los.
  • Gerenciado por outros: os fluxos de dados do Microsoft Power Platform criados por outros administradores. Você só pode exibir esses fluxos de dados. Esta seção mostra o proprietário de cada fluxo de dados, de maneira que você possa entrar em contato com ele caso precise de ajuda.

Observação

Outros usuários podem exibir e usar todas as tabelas. Embora cada fonte de dados seja de propriedade do usuário que a criou, cada usuário do Customer Insights - Data pode usar todas as tabelas resultantes da ingestão de dados.

Captura de tela da página Fontes de dados.

Próximas etapas