Microsoft Fabric -terminologia
Tutustu Microsoft Fabricissa käytettyjen termien määritelmiin, mukaan lukien Fabric Data Warehouseen, Fabric Data Engineeringiin, Fabric Data Scienceen, reaaliaikaiseen tiedusteluun, datatehtaaseen ja Power BI:hin liittyvät termit.
Yleiset ehdot
Kapasiteetti: Kapasiteetti on erillinen resurssijoukko, joka on käytettävissä tiettynä ajankohtana. Kapasiteetti määrittää resurssin mahdollisuuden suorittaa toiminto tai tuottaa tulosta. Eri kohteet kuluttavat eri kapasiteettia tiettynä ajankohtana. Fabric tarjoaa kapasiteettia Fabric SKU:n ja Trials-kokeilujen kautta. Lisätietoja on ohjeartikkelissa Mikä on kapasiteetti?
Käyttökokemus: tämä on kokoelma ominaisuuksia, jotka on kohdistettu tiettyyn toimintoon. Fabric-käyttökokemuksia ovat Fabric-tietovarasto, Fabric-tietotekniikka, Fabric-datatiede, reaaliaikainen älykkyys, datatehdas ja Power BI.
Kohde: Kohde, joka on joukko ominaisuuksia käyttökokemuksessa. Käyttäjät voivat luoda, muokata ja poistaa niitä. Jokainen kohdetyyppi tarjoaa eri ominaisuuksia. Esimerkiksi Tietotekniikka-kokemus sisältää lakehouse-, muistikirja- ja Spark-työmääritelmäkohteet.
Vuokraaja: Vuokraaja on yksi organisaation Fabric-esiintymä, jonka tunnuksena on Microsoft Entra.
Työtila: Työtila on kokoelma kohteita, jotka yhdistävät eri toiminnot yhteen ympäristöön, joka on suunniteltu yhteistyötä varten. Se toimii säilönä, joka käyttää kapasiteettia suoritettavalle työlle ja tarjoaa ohjausobjekteja sille, ketkä voivat käyttää sen kohteita. Esimerkiksi työtilassa käyttäjät luovat raportteja, muistikirjoja, semanttisia malleja jne. Katso lisätietoja artikkelista Työtilat .
Fabric Data Engineering
Lakehouse: Lakehouse on kokoelma tiedostoja, kansioita ja taulukoita, jotka edustavat tietokantaa Data Lake -järvestä, jota Apache Spark -moduuli ja SQL-moduuli käyttävät massadatan käsittelyyn. Lakehouse sisältää parannetut ominaisuudet ACID-tapahtumiin, kun käytetään avoimen lähdekoodin Delta-muotoiltuja taulukoita. Lakehouse-kohdetta isännöidään yksilöllisessä työtilakansiossa Microsoft OneLakessa. Se sisältää tiedostoja eri muodoissa (jäsennetty ja rakenteeton) järjestettynä kansioihin ja alikansioihin. Lisätietoja on kohdassa Mikä lakehouse on?
Notebook: Fabric-muistikirja on monikielinen vuorovaikutteinen ohjelmointityökalu, jossa on monipuolisia funktioita. Näitä ovat esimerkiksi koodin ja markdownin luominen, Spark-työn suorittaminen ja valvonta, tuloksen tarkasteleminen ja visualisointi sekä yhteistyö tiimin kanssa. Sen avulla datainsinöörit ja datatieteilijät voivat tutkia ja käsitellä tietoja sekä kehittää koneoppimiskokeiluja sekä koodissa että vähäisessä koodaamisessa. Se voidaan helposti muuntaa jaksotoiminnaksi orkestroinniksi.
Spark-sovellus: Apache Spark -sovellus on käyttäjän kirjoittama ohjelma, joka käyttää jotakin Sparkin ohjelmointirajapintakielistä (Scala, Python, Spark SQL tai Java) tai Microsoftin lisäämiä kieliä (.NET C#:n kanssa tai F#). Kun sovellus suoritetaan, se jaetaan yhteen tai useampaan Spark-työhän, jotka suoritetaan rinnakkain tietojen käsittelemiseksi nopeammin. Lisätietoja on artikkelissa Spark-sovellusten valvonta.
Apache Spark -työ: Spark-työ on osa Spark-sovellusta, joka suoritetaan rinnakkain sovelluksen muiden töiden kanssa. Työ koostuu useista tehtävistä. Lisätietoja on artikkelissa Spark-työn valvonta.
Apache Spark -työn määritelmä: Spark-työmääritelmä on käyttäjän määrittämä parametrijoukko, joka ilmaisee, miten Spark-sovellus tulisi suorittaa. Sen avulla voit lähettää erä- tai suoratoistotöitä Spark-klusteriin. Jos haluat lisätietoja, katso Mikä on Apache Spark -työn määritelmä?
V-järjestys: Kirjoitusoptimointi parquet-tiedostomuotoon, joka mahdollistaa nopean lukemisen ja tarjoaa kustannustehokkuuden ja paremman suorituskyvyn. Kaikki Fabric-moottorit kirjoittavat oletusarvoisesti v-tilattuja parquet-tiedostoja.
Data Factory
Yhdistin: Data Factory tarjoaa monipuolisen joukon liittimiä, joiden avulla voit muodostaa yhteyden erityyppisiin tietosäilöihin. Kun yhteys on muodostettu, voit muuntaa tiedot. Katso lisätietoja kohdasta Liittimet.
Tietoputki: Data Factoryssa tietojen siirron ja muunnoksen järjestämiseen käytetään tietoputkia. Nämä putket eroavat Fabricin käyttöönottoputkista. Lisätietoja on datatehtaan yleiskatsauksen kohdassa Putket .
Tietovuo Gen2: Tietovuot tarjoavat vähäisen koodin rajapinnan, jonka avulla voit käsitellä tietoja sadoista tietolähteistä ja muuntaa tietojasi. Fabric-tietovoita kutsutaan nimellä Tietovuo Gen2. Tietovuo Gen1 on olemassa Power BI:ssä. Tietovuo Gen2 tarjoaa lisäominaisuuksia verrattuna Azure Data Factoryn tai Power BI:n tietovoihin. Et voi päivittää Gen1:stä Gen2:een. Lisätietoja on Data Factory -yleiskatsauksen kohdassa Tietovuot .
Käynnistin: Data Factoryn automaatio-ominaisuus, joka käynnistää putkia tiettyjen ehtojen, kuten aikataulujen tai tietojen käytettävyyden, perusteella.
Fabric Data Science
Data Wrangler: Data Wrangler on muistikirjapohjainen työkalu, joka tarjoaa käyttäjille mukaansatempaavan kokemuksen tutkivien tietoanalyysien tekemiseen. Ominaisuus yhdistää ruudukon kaltaisen tietojen näytön dynaamisiin yhteenvetotilastoihin ja yleisiin tietojenpuhdistustoimintoihin, jotka ovat kaikki käytettävissä muutamilla valituilla kuvakkeilla. Jokainen toiminto luo koodin, joka voidaan tallentaa takaisin muistikirjaan uudelleenkäytettävänä komentosarjana.
Kokeilu: Koneoppimisen kokeilu on organisaation ja hallinnan ensisijainen yksikkö kaikissa siihen liittyvissä koneoppimisajoissa. Lisätietoja on artikkelissa Microsoft Fabricin koneoppimiskokeilut.
Malli: Koneoppimismalli on tiedosto, joka on harjoitettu tunnistamaan tietyntyyppiset mallit. Harjoitat mallin tietojoukolla ja annat sille algoritmin, jonka avulla se päättelee ja oppii tästä tietojoukosta. Lisätietoja on kohdassa Koneoppimismalli.
Suorita: Suoritus vastaa mallikoodin yksittäistä suoritusta. MLflow-ympäristössä seuranta perustuu kokeisiin ja suoritukset.
Fabric-tietovarasto
SQL-analytiikan päätepiste: Each Lakehousessa on SQL-analytiikan päätepiste, jonka avulla käyttäjä voi tehdä kyselyn delta-taulukon tiedoista TSQL:n ja TDS:n avulla. Lisätietoja on artikkelissa SQL-analytiikan päätepiste.
Fabric-tietovarasto: Fabric-tietovarasto toimii perinteisenä tietovarastona ja tukee kaikkia tapahtumapohjaisia T-SQL-ominaisuuksia, joita voit odottaa yrityksen tietovarastolta. Lisätietoja on kohdassa Fabric Data Warehouse.
Reaaliaikainen tieto
Aktivointi: Aktivointi on koodittomuustyökalu, jonka avulla voit luoda tiedoillesi hälytyksiä, käynnistimiä ja toimintoja. Tietovirroista luodaan hälytyksiä aktivointitoiminnon avulla. Lisätietoja on kohdassa Aktivointi.
Eventhouse: Tapahtumatalot tarjoavat ratkaisun suurten tietomäärien käsittelyyn ja analysointiin erityisesti tilanteissa, jotka edellyttävät reaaliaikaista analysointia ja tutkimista. Ne on suunniteltu käsittelemään reaaliaikaisia tietovirtoja tehokkaasti, jolloin organisaatiot voivat käsitellä, käsitellä ja analysoida tietoja lähes reaaliaikaisesti. Yhdessä työtilassa voi olla useita Eventhouse-taloja. Tapahtumatalossa voi olla useita KQL-tietokantoja, ja jokaisessa tietokannassa voi olla useita taulukoita. Lisätietoja on kohdassa Eventhousen yleiskatsaus.
Eventstream: Microsoft Fabric -eventstreams-ominaisuus tarjoaa Fabric-ympäristössä keskitetyn paikan reaaliaikaisten tapahtumien sieppaamiseen, muuntamiseen ja reititykseen kohteisiin ilman koodaamista. Tapahtumavirta koostuu erilaisista suoratoistettavasta tietolähteestä, tietojen käsittelykohteista ja tapahtuman suorittimesta, kun muuntamista tarvitaan. Lisätietoja on kohdassa Microsoft Fabric -tapahtumavirrat.
KQL-tietokanta: KQL-tietokanta sisältää tietoja muodossa, jossa voit suorittaa KQL-kyselyitä. KQL-tietokannat ovat Eventhousen alla. Lisätietoja on artikkelissa KQL-tietokanta.
KQL-kyselyjoukko: KQL-kyselyjoukko on kohde, jota käytetään kyselyiden suorittamiseen, tulosten tarkasteluun ja kyselytulosten muokkaamiseen Data Explorer -tietokannan tiedoista. Kyselyjoukko sisältää tietokannat ja taulukot, kyselyt ja tulokset. KQL-kyselyjoukon avulla voit tallentaa kyselyt tulevaa käyttöä varten tai viedä ja jakaa kyselyitä muiden kanssa. Lisätietoja on artikkelissa Tietojen kyseleminen KQL-kyselyjoukossa
Reaaliaikainen keskus
- Reaaliaikainen keskitin: Reaaliaikainen keskus on ainoa paikka kaikille dataa liikutettaville tiedoille koko organisaatiossa. Jokainen Microsoft Fabric -vuokraaja valmistellaan automaattisesti toiminnolla. Lisätietoja on kohdassa Reaaliaikaisen keskittimen yleiskatsaus.
OneLake
- Pikakuvake: Pikakuvakkeet ovat OneLakessa upotettuja viittauksia, jotka osoittavat muihin tiedostosäilön sijainteihin. Ne tarjoavat tavan muodostaa yhteys olemassa oleviin tietoihin ilman, että niitä tarvitsee kopioida suoraan. Lisätietoja on kohdassa OneLake-pikakuvakkeet.