Lataa Delta Lake -taulukkoon
Microsoft Fabricin Lakehouse tarjoaa ominaisuuden, jonka avulla voit ladata tehokkaasti yleisiä tiedostotyyppejä optimoituun Delta-taulukkoon, joka on valmis analysoitaville. Lataa taulukkoon -ominaisuuden avulla käyttäjät voivat ladata yksittäisen tiedoston tai kansion tiedostoja taulukkoon. Tämä ominaisuus parantaa datainsinöörien tuottavuutta, koska he voivat nopeasti käyttää hiiren kakkospainikkeen toimintoa, jonka avulla taulukot voidaan ladata tiedostoihin ja kansioihin. Taulukkoon lataaminen on myös ilman koodia -käyttökokemus, joka alentaa kaikkien persoonaiden syöttöpalkkia.
Lataa taulukkoon -ominaisuuksien yleiskatsaus
Seuraavassa on luettelo ominaisuuksista, jotka otettu käyttöön integroidussa lataaminen taulukkoon -kokemuksessa, jotta käyttäjät voivat olla joustavia ja parantaa samalla tuottavuutta:
Tuetut tiedostotyypit: Tämä ominaisuus tukee tällä hetkellä vain PARQUET- tai CSV-tiedostotyyppien lataamista. Tiedostopäätetapauksella ei ole merkitystä.
Yksittäisen tiedoston lataaminen: Käyttäjät voivat ladata yksittäisen valitsemansa tiedoston jossakin tuetuista muodoista valitsemalla "Lataa Delta-taulukkoon" tiedoston pikavalikkotoiminnossa.
Kansiotason kuormitus: Voit ladata kaikki tiedostot kansion ja sen alikansioiden alle kerralla valitsemalla Lataa Delta-taulukkoon, kun olet napsauttanut kansiota. Tämä ominaisuus kulkee automaattisesti kaikkien tiedostojen läpi ja lataa ne Delta-taulukkoon. On tärkeää huomata, että taulukkoon voi ladata samanaikaisesti vain samantyyppisiä tiedostoja.
Lataa uuteen ja olemassa olevaan taulukkoon: Käyttäjä voi halutessaan ladata tiedostot ja kansiot uuteen taulukkoon tai olemassa olevaan taulukkoon. Jos he päättävät ladata aiemmin luotuun taulukkoon, he voivat joko liittää tai korvata taulukossa olevat tietonsa.
CSV-lähdetiedosto -asetus: CSV-tiedostojen kohdalla annamme käyttäjän määrittää, sisältääkö hänen lähdetiedostonsa otsikot, joita he haluavat käyttää sarakkeiden niminä. Käyttäjät voivat myös määrittää valitsemansa erottimen, joka ohittaa oletusarvoisen pilkkuerottimen.
Ladattu nimellä Delta-taulukot: Taulukot ladataan aina Delta Lake -taulukkomuodossa, jossa V-Order-optimointi on käytössä.
Muistiinpano
Tällä hetkellä et voi määrittää taulukon rakennetta Lakehousen käyttöliittymän kautta. siihen tarkoitukseen on käytettävä muistikirjaa.
Vahvistusohjeet ja säännöt
Seuraava vakio koskee Lataa taulukkoon -käyttökokemusta:
Taulukon nimet voivat sisältää vain aakkosnumeerisia merkkejä ja alaviivoja. Se sallii myös minkä tahansa englanninkielisen kirjaimen, ison tai pienen kirjaimen ja alaviivan (
_
), joiden enimmäispituus on 256 merkkiä. Yhdysmerkkejä (-
) tai välilyöntimerkkejä ei sallita.Tekstitiedostot, joissa ei ole sarakeotsikoita, korvataan vakiomerkinnällä
col#
taulukon sarakkeiden niminä.Sarakenimet mahdollistavat minkä tahansa englanninkielisen kirjaimen, ison tai pienen kirjaimen, alaviivan (
_
) ja muun kielen (esimerkiksi UTF-kielen kiinan) merkit, joiden pituus on enintään 128 merkkiä. Sarakkeiden nimet vahvistetaan lataustoiminnon aikana. Lataa delta -algoritmi korvaa kiellettyjen arvojen allepalkilla (_
). Jos sarakkeen nimeä ei saavuteta vahvistuksen aikana, lataustoiminto epäonnistuu.CSV-tiedostoissa erotin ei voi olla tyhjä, se voi olla enintään 8 merkkiä tai käyttää mitään seuraavista merkeistä:
(
, ,)
[
,]
,{
, ,}
heittomerkki ('
), kaksinkertainen lainausmerkki ("
) ja välilyönti.