Partilhar via


Formato binário para o Data Factory no Microsoft Fabric

Este artigo descreve como configurar o formato binário no Data Factory.

Capacidades suportadas

O formato binário é suportado para as seguintes atividades e conectores como origem e destino.

Categoria Conector/Atividade
Conector suportado Amazon S3
Compatível com Amazon S3
Armazenamento de Blobs do Azure
Armazenamento do Azure Data Lake Ger1
Azure Data Lake Storage Gen2 (Armazenamento do Azure Data Lake Gen2)
Ficheiros do Azure
Sistema de ficheiros
FTP
Google Cloud Storage
HTTP
Arquivos Lakehouse
Armazenamento em nuvem Oracle
SFTP
Atividade apoiada Atividade de cópia (origem/destino)
Atividade GetMetadata
Excluir atividade

Formato binário na atividade de cópia

Para configurar o formato binário, escolha sua conexão na origem ou no destino da atividade de cópia do pipeline de dados e selecione Binário na lista suspensa de Formato de arquivo. Selecione Configurações para configuração adicional deste formato.

Captura de tela mostrando o botão de configurações de arquivo.

Nota

Ao usar o formato binário em uma atividade de cópia, a origem e o destino devem usar o formato binário.

Binário como fonte

Depois de selecionar Configurações na seção Formato de arquivo na guia Origem , as seguintes propriedades são exibidas na caixa de diálogo pop-up Configurações de formato de arquivo.

Captura de ecrã a mostrar definições de formato de ficheiro.

  • Tipo de compressão: O codec de compressão usado para ler arquivos binários. Você pode escolher entre o tipo Nenhum, bzip2, gzip, deflate, ZipDeflate, TarGzip ou tar na lista suspensa.

    Se você selecionar ZipDeflate como o tipo de compactação, Preservar nome de arquivo zip como pasta será exibido nas Configurações avançadas na guia Origem .

    • Preservar o nome do arquivo zip como pasta: indica se o nome do arquivo zip de origem deve ser preservado como uma estrutura de pasta durante a cópia.
      • Se essa caixa estiver marcada (padrão), o serviço gravará arquivos descompactados em <specified file path>/<folder named as source zip file>/.
      • Se essa caixa estiver desmarcada, o serviço gravará arquivos descompactados diretamente no <specified file path>. Certifique-se de que não tem nomes de ficheiros duplicados em ficheiros zip de origem diferentes para evitar corridas ou comportamentos inesperados.

    Se você selecionar TarGzip/tar como o tipo de compactação, Preservar nome do arquivo de compactação como pasta será exibido nas Configurações avançadas na guia Origem .

    • Preservar o nome do arquivo de compactação como pasta: indica se o nome do arquivo compactado de origem deve ser preservado como uma estrutura de pasta durante a cópia.
      • Se essa caixa estiver marcada (padrão), o serviço gravará arquivos descompactados em <specified file path>/<folder named as source compressed file>/.
      • Se essa caixa estiver desmarcada, o serviço grava arquivos descompactados diretamente no <specified file path>. Certifique-se de que não tem nomes de ficheiros duplicados em ficheiros zip de origem diferentes para evitar corridas ou comportamentos inesperados.
  • Nível de compressão: A taxa de compressão. Você pode escolher entre Optimal ou Fastest.

    • Mais rápido: A operação de compressão deve ser concluída o mais rapidamente possível, mesmo que o ficheiro resultante não esteja comprimido da melhor forma.
    • Ideal: A operação de compressão deve ser compactada de forma ideal, mesmo que a operação demore mais tempo para ser concluída. Para obter mais informações, consulte o artigo Nível decompactação.

Em Configurações avançadas na guia Origem , outras propriedades relacionadas ao formato binário são exibidas.

  • Excluir arquivos após a conclusão: indica se os arquivos binários são excluídos do armazenamento de origem depois de serem movidos com êxito para o repositório de destino. A exclusão do arquivo é por arquivo. Assim, quando uma atividade de cópia falha, alguns arquivos já foram copiados para o destino e excluídos da origem, enquanto outros ainda permanecem no armazenamento de origem.

Binário como destino

Depois de selecionar Configurações na seção Formato de arquivo na guia Destino , as seguintes propriedades são exibidas na caixa de diálogo pop-up Configurações de formato de arquivo.

Captura de tela mostrando a seleção do formato de arquivo.

  • Tipo de compressão: O codec de compressão usado para escrever arquivos binários. Você pode escolher entre o tipo Nenhum, bzip2, gzip, deflate, ZipDeflate, TarGzip ou tar na lista suspensa.

  • Nível de compressão: A taxa de compressão. Você pode escolher entre Optimal ou Fastest.

    • Mais rápido: A operação de compressão deve ser concluída o mais rapidamente possível, mesmo que o ficheiro resultante não esteja comprimido da melhor forma.
    • Ideal: A operação de compressão deve ser compactada de forma ideal, mesmo que a operação demore mais tempo para ser concluída. Para obter mais informações, consulte o artigo Nível de compactação.

Resumo da tabela

Binário como fonte

As propriedades a seguir são suportadas na seção Fonte da atividade de cópia ao usar o formato binário.

Nome Descrição valor Necessário Propriedade de script JSON
Formato do ficheiro O formato de ficheiro que pretende utilizar. Binário Sim tipo (em datasetSettings):
Binário
Tipo de compressão O codec de compressão usado para ler arquivos binários. Escolha entre:
Nenhuma
bzip2
gzip
deflacionar
ZipDeflate
TarGzip
alcatrão
Não tipo (em compression):

bzip2
gzip
deflacionar
ZipDeflate
TarGzip
alcatrão
Nível de compressão A taxa de compressão. Os valores permitidos são Ótimo ou Mais Rápido. Ótimo ou mais rápido Não nível (em compression):
Mais rápido
Ótimo
Preservar o nome do arquivo zip como pasta Indica se o nome do arquivo zip de origem deve ser preservado como uma estrutura de pastas durante a cópia. Selecionado ou desmarcado Não preserveZipFileNameAsFolder
(em compressionProperties->type como ZipDeflateReadSettings)
Preservar o nome do arquivo de compactação como pasta Indica se o nome do arquivo compactado de origem deve ser preservado como uma estrutura de pastas durante a cópia. Selecionado ou desmarcado Não preserveCompressionFileNameAsFolder
(em compressionProperties->type como TarGZipReadSettings ou TarReadSettings)
Excluir arquivos após a conclusão Indica se os arquivos binários são excluídos do repositório de origem depois de serem movidos com êxito para o repositório de destino. Selecionado ou desmarcado Não deleteFilesAfterCompletion:
verdadeiro ou falso

Binário como destino

As propriedades a seguir são suportadas na seção Destino da atividade de cópia ao usar o formato binário.

Nome Descrição valor Necessário Propriedade de script JSON
Formato do ficheiro O formato de ficheiro que pretende utilizar. Binário Sim tipo (em datasetSettings):
Binário
Tipo de compressão O codec de compressão usado para escrever arquivos binários. Escolha entre:
Nenhuma
bzip2
gzip
deflacionar
ZipDeflate
TarGzip
alcatrão
Não tipo (em compression):

bzip2
gzip
deflacionar
ZipDeflate
TarGzip
alcatrão
Nível de compressão A taxa de compressão. Os valores permitidos são Ótimo ou Mais Rápido. Ótimo ou mais rápido Não nível (em compression):
Mais rápido
Ótimo