ORC-muoto Data Factoryssa Microsoft Fabricissa
Tässä artikkelissa kerrotaan, miten voit määrittää ORC-muodon Microsoft Fabricin Data Factoryn tietoputkessa.
Tuetut ominaisuudet
ORC-muotoa tuetaan seuraavissa toiminnoissa ja liittimillä lähteenä ja kohdesijaintina.
Luokka | Liitin/toiminta |
---|---|
Tuettu liitin | Amazon S3 |
Amazon S3 -yhteensopiva | |
Azure Blob -säilö | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Tiedostojärjestelmä | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse-tiedostot | |
Oracle Cloud Storage | |
SFTP | |
Tuettu toiminta | Aktiviteetin kopioiminen (lähde/kohde) |
Hakutoiminta | |
GetMetadata-toiminta | |
Tietojen aktiviteetin poistaminen |
ORC-muoto kopioinnissa
Jos haluat määrittää ORC-muodon, valitse yhteytesi tietoputken kopiointitoiminnon lähteessä tai kohdesijainnissa ja valitse sitten ORC tiedostomuodon avattavasta luettelosta. Valitse Asetukset , jos haluat muuttaa tämän muodon määritystä.
ORC-muoto lähteenä
Kun valitset Tiedostomuoto-osiossa Asetukset, seuraavat ominaisuudet näkyvät Ponnahdusikkunassa Tiedostomuotoasetukset-valintaikkunassa.
- Pakkaustyyppi: Valitse avattavasta luettelosta ORC-tiedostojen lukuun käytettävä pakkauspakkauksenhallinta. Voit valita vaihtoehdon Ei mitään, zlib tai snappy.
ORC-muoto kohteena
Kun olet valinnut Asetukset, seuraavat ominaisuudet näkyvät Ponnahdusikkunassa Tiedostomuotoasetukset-valintaikkunassa.
- Pakkaustyyppi: Valitse avattavasta luettelosta ORC-tiedostojen kirjoittamiseen käytettävä pakkauspakkauksenhallinta. Voit valita vaihtoehdon Ei mitään, zlib tai snappy.
Kohde-välilehden Lisäasetukset-kohdassa näytetään seuraavat ORC-muotoiluun liittyvät ominaisuudet.
- Rivien enimmäismäärä tiedostoa kohden: Kun kirjoitat tietoja kansioon, voit kirjoittaa useisiin tiedostoihin ja määrittää tiedostokohtaisen rivien enimmäismäärän. Määritä kaikki rivit, jotka haluat kirjoittaa tiedostoa kohden.
- Tiedostonimen etuliite: Käytettävissä, kun määritetään rivien enimmäismäärä tiedostoa kohden. Määritä tiedostonimen etuliite, kun kirjoitat tietoja useisiin tiedostoihin. Tuloksena on tämä malli:
<fileNamePrefix>_00000.<fileExtension>
. Jos tätä ei määritetä, tiedostonimen etuliite luodaan automaattisesti. Tämä ominaisuus ei päde, kun lähde on tiedostopohjainen säilö tai osioasetus käytössä oleva tietosäilö.
Taulukon yhteenveto
ORC lähteenä
Seuraavia ominaisuuksia tuetaan Kopioi toiminnon lähde -osassa ORC-muotoa käytettäessä.
Name | Kuvaus | Arvo | Pakollinen | JSON-komentosarjaominaisuus |
---|---|---|---|---|
Tiedostomuoto | Käytettävä tiedostomuoto. | ÖRKKI | Kyllä | tyyppi (alle datasetSettings ):Örkki |
Pakkaustyyppi | ORC-tiedostojen lukemiseen käytettävä pakkauspakkauksenhallinta. | Ei ole zlib tyylikäs |
En | orcCompressionCodec: ei mitään zlib tyylikäs |
ORC kohteena
Seuraavat ominaisuudet ovat tuettuja kopiointiaktiviteetin kohde - osassa, kun käytät ORC-muotoa.
Name | Kuvaus | Arvo | Pakollinen | JSON-komentosarjaominaisuus |
---|---|---|---|---|
Tiedostomuoto | Käytettävä tiedostomuoto. | ÖRKKI | Kyllä | tyyppi (alle datasetSettings ):Örkki |
Pakkaustyyppi | ORC-tiedostojen kirjoittamiseen käytettävä pakkauspakkauksenhallinta. | Ei ole zlib tyylikäs |
En | orcCompressionCodec: ei mitään zlib tyylikäs |
Rivien enimmäismäärä tiedostoa kohden | Kun kirjoitat tietoja kansioon, voit kirjoittaa useisiin tiedostoihin ja määrittää tiedostokohtaisen rivien enimmäismäärän. Määritä kaikki rivit, jotka haluat kirjoittaa tiedostoa kohden. | <rivien enimmäismäärä tiedostoa kohden> | En | maxRowsPerFile |
Tiedostonimen etuliite | Käytettävissä, kun tiedostoa kohden on määritetty enintään riviä. Määritä tiedostonimen etuliite, kun kirjoitat tietoja useisiin tiedostoihin. Tuloksena on tämä malli: <fileNamePrefix>_00000.<fileExtension> . Jos tätä ei määritetä, tiedostonimen etuliite luodaan automaattisesti. Tämä ominaisuus ei päde, kun lähde on tiedostopohjainen säilö tai osioasetus käytössä oleva tietosäilö. |
<tiedostonimen etuliite> | En | fileNamePrefix |