Visão geral de fontes de dados
Para configurar o Dynamics 365 Customer Insights - Data, primeiro traga dados fonte para processamento. O Customer Insights - Data oferece diversos tipos de conectores de dados para se conectar a e ingerir dados de um conjunto de fontes abrangente.
Este artigo descreve opções que podem afetar o desempenho da ingestão de dados.
Formato Delta
O formato de dados Delta é o formato de processamento nativo usado pelo Customer Insights – Data. Se você conseguir fornecer dados de origem no formato Delta, haverá muitas vantagens.
- Melhor eficiência com o Customer Insights - Data: o Customer Insights - Data usa internamente o formato Delta.
- Ingestão de dados mais rápida: o formato Delta oferece compactação superior tendo em vista transferências de dados mais rápidas.
- Unificação mais rápida: quando o recurso viagem no tempo Delta é usado, o Customer Insights – Data só unifica os dados alterados. Ele não reprocessa todo o conjunto de dados. Para unificação incremental, todas as entradas de dados na unificação devem estar no formato Delta.
- Menos problemas de danos nos dados: o formato Delta reduz as partições corrompidas e os problemas de danos comuns nos dados causados por formatos mais antigos, como o formato CSV (valores separados por vírgula).
- Design do gerenciamento de dados mais confiável: o formato Delta não exige atualizações manuais para manifestos, esquemas e arquivos de partição.
- Mais validade de dados: o formato Delta oferece transações de atomicidade, consistência, isolamento, durabilidade (ACID), além dos níveis de isolamento no Spark.
Você pode usar o formato Delta com os seguintes conectores:
Delta é um termo introduzido no Delta Lake, o fundamento para armazenar dados e tabelas na plataforma Databricks Lakehouse. Delta Lake é uma camada de armazenamento de código aberto que leva transações ACID (atomicidade, consistência, isolamento e durabilidade) para cargas de trabalho do big data. Para obter mais informações, consulte a Página de documentação do Delta Lake.
Anexo ou importação da fonte de dados
Quando você decide como ingerir os dados, uma consideração-chave é se o conector de dados é anexo aos dados ou faz cópias deles. Ao usar o Customer Insights - Data, recomendamos a você usar um conector anexo aos dados. Assim, os dados são acessados diretamente no momento de processá-los. Se você usar um conector que copie os dados, atrasos podem ocorrer quando os dados são atualizados.
Os seguintes conectores de dados são anexados aos dados:
- Tabelas Delta do Azure Data Lake Storage
- Tabelas Common Data Model do Azure Data Lake Storage
- Microsoft Dataverse
- Azure Synapse Analytics (versão preliminar)
Se você não conseguir usar um conector anexo aos dados, copie-os usando um dos conectores do Power Query. O Power Query oferece uma maneira útil de transformar os dados.
Criação de perfil de dados
Quando os dados são ingeridos, o Customer Insights – Data realiza uma criação de perfil de dados básicos. Por exemplo, ele cria o perfil da frequência de valores repetidos em uma coluna. Você pode usar dados de perfil para compreender os dados e resolver os problemas. Por exemplo, se estiver comparando a coluna FullName
, a criação de perfil dos dados poderá ajudar você a detectar se o valor padrão Inserir o nome é exibido em 10.000 linhas. Por isso, se você comparar esse valor, 10.000 linhas que não devem ser comparadas serão correlacionadas. Ao adicionar o Azure Data Lake, as tabelas Delta ou as fontes de dados do Azure Synapse, você pode habilitar a criação de perfil dos dados para mais colunas.
Depois de ingerir os dados, você poderá exibir os resultados da criação de perfil dos dados.
Vá até Dados>Tabelas e selecione uma tabela. Em seguida, na linha de um campo (por exemplo,
DateOfBirth
), na coluna Resumo, selecione o ícone Resumo .Revise os detalhes em busca de erros ou valores não encontrados.
Página fontes de dados
A página Fontes de dados lista as fontes de dados em duas seções:
- Gerenciado por mim: os fluxos de dados do Microsoft Power Platform criados e gerenciados. Outros usuários só podem exibir esses fluxos de dados. Eles não podem atualizar nem editá-los.
- Gerenciado por outros: os fluxos de dados do Microsoft Power Platform criados por outros administradores. Você só pode exibir esses fluxos de dados. Esta seção mostra o proprietário de cada fluxo de dados, de maneira que você possa entrar em contato com ele caso precise de ajuda.
Observação
Outros usuários podem exibir e usar todas as tabelas. Embora cada fonte de dados seja de propriedade do usuário que a criou, cada usuário do Customer Insights - Data pode usar todas as tabelas resultantes da ingestão de dados.