Compartilhar via


Transformar dados no data.world (Versão prévia) usando o Azure Data Factory ou o Synapse Analytics

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Dica

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange desde movimentação de dados até ciência de dados, análise em tempo real, business intelligence e relatórios. Saiba como iniciar uma avaliação gratuita!

Este artigo descreve como usar o Fluxo de Dados para transformar dados no data.world (versão prévia). Para saber mais, leia o artigo introdutório do Azure Data Factory ou do Azure Synapse Analytics.

Importante

Atualmente, esse conector está em versão prévia. Você pode experimentá-lo e oferecer comentários. Se você quiser uma dependência de conectores em versão prévia em sua solução, entre em contato com suporte do Azure.

Funcionalidades com suporte

Este conector data.world é compatível com as seguintes atividades:

Funcionalidades com suporte IR
Fluxo de dados de mapeamento (origem/-)

① Runtime de integração do Azure ② Runtime de integração auto-hospedada

Para obter uma lista de armazenamentos de dados com suporte como origens e coletores, confira a tabela Armazenamentos de dados com suporte.

Criar um serviço vinculado do data.world usando a interface do usuário

Use as etapas a seguir para criar um serviço vinculado do data.world na interface do usuário do portal do Azure.

  1. Navegue até a guia Gerenciar no workspace do Azure Data Factory ou do Synapse e selecione Serviços Vinculados. Depois, selecione Novo:

  2. Pesquise data.world (versão prévia) e selecione o conector data.world (versão prévia).

    Captura de tela mostrando a seleção do conector data.world.

  3. Configure os detalhes do serviço, teste a conexão e crie o novo serviço vinculado.

    Captura de tela da configuração do serviço vinculado data.world.

Detalhes da configuração do conector

As seções a seguir fornecem informações sobre propriedades que são usadas para definir entidades dos pipelines do Data Factory e do Synapse específicas do data.world.

Propriedades do serviço vinculado

As propriedades a seguir têm suporte no serviço vinculado do data.world:

Propriedade Descrição Obrigatório
type A propriedade type deve ser definida como data.world. Sim
apiToken Especifique um token de API para o data.world. Marque esse campo como SecureString para armazená-lo com segurança. Você também pode referenciar um segredo armazenado no Azure Key Vault. Sim

Exemplo:

{
    "name": "DataworldLinkedService",
    "properties": {
        "type": "Dataworld",
        "typeProperties": {
            "apiToken": {
                "type": "SecureString",
                "value": "<API token>"
            }
        }
    }
}

Propriedades do fluxo de dados de mapeamento

Ao transformar dados no fluxo de dados de mapeamento, você pode ler tabelas do data.world. Para saber mais, confira a transformação de origem nos fluxos de dados de mapeamento. Você só pode usar um conjunto de dados em linha como o tipo de origem.

Transformação de origem

A tabela abaixo lista as propriedades com suporte por uma data.world. Você pode editar essas propriedades na guia Opções de origem.

Nome Descrição Obrigatório Valores permitidos Propriedade do script do Fluxo de Dados
Nome do conjunto de dados A ID do conjunto de dados no data.world. Sim String datasetId
Nome da tabela A ID da tabela dentro do conjunto de dados no data.world. Não (se query for especificado) String tableId
Consulta Insira uma consulta SQL para buscar dados do data.world. Um exemplo é select * from MyTable. Não (se tableId for especificado) String Consulta
Proprietário O proprietário do conjunto de dados no data.world. Sim String proprietário

Exemplo de script de origem do data.world

Quando você usa o data.world como tipo de origem, o script de fluxo de dados associado é:

source(allowSchemaDrift: true,
	validateSchema: false,
	store: 'dataworld',
	format: 'rest',
	owner: 'owner1',
	datasetId: 'dataset1',
	tableId: 'MyTable') ~> DataworldSource

Para obter uma lista dos armazenamentos de dados com suporte como coletores e fontes da atividade de cópia, confira os Armazenamentos de dados com suporte.