Conectar-se ao Azure Data Lake Storage
A conexão com o Microsoft Azure Data Lake Storage desbloqueia insights ocultos nos dados. O Azure Data Lake Storage organiza dados usando o sistema de metadados CDM (Common Data Model) em uma conta de armazenamento do Azure.
O uso do Azure Data Lake Storage tem vantagens em comparação com o uso de um sistema BYOD (traga seu próprio banco de dados), inclusive:
- Os dados já estão presentes; portanto, não é necessário realizar uma exportação. A integração do Azure Data Lake Storage gerencia a exportação contínua de dados.
- O custo do armazenamento de dados é reduzido.
- Você pode reverter pipelines downstream e de consumo existentes antes que o processo de exportação ocorra.
O Azure Data Lake Storage armazena dados como arquivos CSV (valores separados por vírgula) em uma conta de armazenamento do Azure.
No momento, a exportação para a funcionalidade do Azure Data Lake Storage não está disponível em ambientes de Nível 1 (desenvolvedor). Você precisa ter um ambiente área restrita de Nível 2 ou superior com base em nuvem para habilitar esse recurso. No entanto, você pode usar um protótipo do Microsoft FastTrack para habilitar o Azure Data Lake Storage para ambientes de Nível 1 (desenvolvimento).
Conectar um ambiente de desenvolvimento hospedado na nuvem ao Azure Data Lake Storage em formato CDM
O GitHub fornece uma solução para conectar um ambiente de desenvolvimento hospedado na nuvem ao Azure Data Lake Storage usando o formato CDM, que é uma entidade padrão que você pode usar para fornecer integração entre sistemas.
Diferentemente de um processo de exportação padrão para o Azure Data Lake Storage, o protótipo do Microsoft FastTrack realiza uma exportação completa. Na exportação padrão para o Azure Data Lake Storage, você pode selecionar entidades para exportação.
Um benefício de usar a exportação para o Azure Data Lake Storage é que o sistema exporta entidades quase em tempo real e você pode exportar tabelas desnormalizadas.
Para usar o protótipo do Microsoft FastTrack que está no GitHub, você deve atender a vários pré-requisitos, inclusive:
- Uma assinatura do Azure.
- Uma conta de armazenamento do Azure.
- Um espaço de trabalho do Microsoft Azure Synapse Analytics.
- Conexão a um ponto de extremidade SQL sob demanda usando uma ferramenta compatível.
- Acesso ao Microsoft Azure Data Factory.
- Microsoft Visual Studio 2019, para criar o projeto de exportação.
Quando estiver pronto para implantar, conclua as seguintes etapas:
- Clone o repositório do GitHub.
- Abra o repositório e crie-o.
- Implante-o como uma Azure Function.
- Habilite os arquivos MSI do Windows Installer criados do repositório.
Para preparar uma conta de armazenamento do Azure, Synapse Analytics e Azure Data Factory para implantação, conclua os seguintes etapas:
- Configure a conta de armazenamento.
- Configure o Azure Synapse Analytics e o SQL sob demanda.
- Colete parâmetros de implantação do Azure Data Factory.
- Implante o modelo do Azure Data Factory do repositório clonado no GitHub.
Para se conectar ao ambiente de desenvolvimento hospedado na nuvem de finanças e operações, conclua as seguintes ações:
- Use os detalhes do Microsoft Dynamics 365 Lifecycle Services e do ambiente. O logon do SQL Server está na seção Gerenciar ambiente.
- Conecte seu Azure Data Factory ao ambiente hospedado na nuvem de finanças e operações criando um runtime de integração auto-hospedado para seu Azure Data Factory.
- Após implementar o modelo do Azure Data Factory, vá para o Azure Data Factory e execute os pipelines. Observe que a estrutura de dados e os metadados são criados no formato CDM. Você também pode criar relatórios usando esse formato e quaisquer ferramentas de relatórios e BI (business intelligence).