Jaa


Microsoft Fabric -terminologia

Tutustu Microsoft Fabricissa käytettyjen termien määritelmiin, mukaan lukien Fabric Data Warehouseen, Fabric Data Engineeringiin, Fabric Data Scienceen, Real-Time Intelligenceen, Data Factoryen ja Power BI:hin liittyvät termit.

Yleiset ehdot

  • Kapasiteetti: Kapasiteetti on tietty joukko resursseja, jotka ovat käytettävissä tiettynä ajankohtana. Kapasiteetti määrittää resurssin mahdollisuuden suorittaa toiminto tai tuottaa tulosta. Eri kohteet kuluttavat eri kapasiteettia tiettynä ajankohtana. Fabric tarjoaa kapasiteettia Fabric SKU:n ja Trials-kokeilujen kautta. Lisätietoja on kohdassa Mikä kapasiteetti on?

  • käyttökokemus: toimintokokoelma, joka on kohdistettu tiettyyn toimintoon. Fabric-käyttökokemuksia ovat Fabric-tietovarasto, Fabric-tietotekniikka, Fabric Data Science, Real-Time Intelligence, Data Factory ja Power BI.

  • Kohde: Kokemus sisältää joukon ominaisuuksia. Käyttäjät voivat luoda, muokata ja poistaa niitä. Jokainen kohdetyyppi tarjoaa eri ominaisuuksia. Esimerkiksi Tietotekniikka-kokemus sisältää lakehouse-, muistikirja- ja Spark-työmääritelmäkohteet.

  • -vuokraaja: Vuokraaja on yksi Fabric-esiintymä organisaatiolle, ja se on kohdistettu Microsoft Entra -tunnukseen.

  • työtila: Työtila on kokoelma kohteita, jotka kokoavat yhteen yhteistyöhön suunniteltuun yksittäiseen ympäristöön eri toiminnot. Se toimii säilönä, joka käyttää kapasiteettia suoritettavalle työlle ja tarjoaa ohjausobjekteja sille, ketkä voivat käyttää sen kohteita. Esimerkiksi työtilassa käyttäjät luovat raportteja, muistikirjoja, semanttisia malleja jne. Lisätietoja on artikkelissa työtilojen .

Fabric Data Engineering

  • Lakehouse: A Lakehouse on kokoelma tiedostoja, kansioita ja taulukoita, jotka edustavat tietokantaa Data Lake -järvestä, jota Apache Spark -moduuli ja SQL-moduuli käyttävät massadatan käsittelyssä. Lakehouse sisältää parannetut ominaisuudet ACID-tapahtumiin, kun käytetään avoimen lähdekoodin Delta-muotoiltuja taulukoita. Lakehouse-kohdetta isännöidään yksilöllisessä työtilakansiossa Microsoft OneLake. Se sisältää tiedostoja eri muodoissa (jäsennetty ja rakenteeton) järjestettynä kansioihin ja alikansioihin. Jos haluat lisätietoja, katso Mikä on lakehouse?

  • Notebook: A Fabric -muistikirja on monikielinen vuorovaikutteinen ohjelmointityökalu, jossa on monipuolisia funktioita. Näitä ovat esimerkiksi koodin ja markdownin luominen, Spark-työn suorittaminen ja valvonta, tuloksen tarkasteleminen ja visualisointi sekä yhteistyö tiimin kanssa. Sen avulla datainsinöörit ja datatieteilijät voivat tutkia ja käsitellä tietoja sekä kehittää koneoppimiskokeiluja sekä koodissa että vähäisessä koodaamisessa. Se voidaan helposti muuntaa jaksotoiminnaksi orkestroinniksi.

  • Spark -sovellus: Apache Spark -sovellus on käyttäjän kirjoittama ohjelma, joka käyttää jotakin Sparkin ohjelmointirajapintakielistä (Scala, Python, Spark SQL tai Java) tai Microsoftin lisäämiä kieliä (.NET C#:n kanssa tai F#). Kun sovellus suoritetaan, se jaetaan yhteen tai useampaan Spark-työhän, jotka suoritetaan rinnakkain tietojen käsittelemiseksi nopeammin. Lisätietoja on artikkelissa Spark-sovellusten valvonta.

  • Apache Spark -työ: A Spark -työ on osa Spark-sovellusta, joka suoritetaan rinnakkain muiden sovelluksessa olevien töiden kanssa. Työ koostuu useista tehtävistä. Lisätietoja on artikkelissa Spark-työn seuranta.

  • Apache Spark -työn määritelmä: Spark-työmääritys on käyttäjän määrittämä parametrijoukko, joka ilmaisee, miten Spark-sovellus tulee suorittaa. Sen avulla voit lähettää erä- tai suoratoistotöitä Spark-klusteriin. Katso lisätietoja artikkelista Mikä on Apache Spark -työmääritelmä?

  • V-järjestys: Kirjoitusoptimointi parquet-tiedostomuotoon, joka mahdollistaa nopean lukemisen ja kustannustehokkuuden ja suorituskyvyn. Kaikki Fabric-moottorit kirjoittavat oletusarvoisesti v-tilattuja parquet-tiedostoja.

Data Factory

  • Connector: Data Factory tarjoaa monipuolisen joukon liittimiä, joiden avulla voit muodostaa yhteyden erityyppisiin tietosäilöihin. Kun yhteys on muodostettu, voit muuntaa tiedot. Katso lisätietoja artikkelista liittimien .

  • Tietoputki: Data Factoryssa tietojen siirron ja muunnoksen järjestämiseen käytetään tietoputkea. Nämä putket eroavat Fabricin käyttöönottoputkista. Lisätietoja on Data Factoryn yleiskatsauksen kohdassa Pipelines.

  • Tietovuo Gen2: Tietovuot tarjoavat vähäisen koodin liittymän, jonka avulla voit käsitellä tietoja sadoista tietolähteistä ja muuntaa tietojasi. Fabric-tietovoita kutsutaan nimellä Tietovuo Gen2. Tietovuo Gen1 on olemassa Power BI:ssä. Tietovuo Gen2 tarjoaa lisäominaisuuksia verrattuna Azure Data Factoryn tai Power BI:n tietovoihin. Et voi päivittää Gen1:stä Gen2:een. Lisätietoja on Data Factory -yleiskatsauksen kohdassa Tietovuot.

  • Käynnistin: Data Factoryn automaatiotoiminto, joka käynnistää putkia tiettyjen ehtojen, kuten aikataulujen tai tietojen käytettävyyden, perusteella.

Fabric Data Science

  • Data Wrangler: Data Wrangler on muistikirjapohjainen työkalu, joka tarjoaa käyttäjille mukaansatempaavan kokemuksen tutkivien tietoanalyysien tekemiseen. Ominaisuus yhdistää ruudukon kaltaisen tietojen näytön dynaamisiin yhteenvetotilastoihin ja yleisiin tietojenpuhdistustoimintoihin, jotka ovat kaikki käytettävissä muutamilla valituilla kuvakkeilla. Jokainen toiminto luo koodin, joka voidaan tallentaa takaisin muistikirjaan uudelleenkäytettävänä komentosarjana.

  • kokeilu: Koneoppimiskokeilu on kaikkien niihin liittyvien koneoppimissuosikeiden ensisijainen yksikkö organisaatiossa ja hallinnassa. Katso lisätietoja artikkelista Microsoft Fabric.

  • malli: Koneoppimismalli on tiedosto, joka on harjoitettu tunnistamaan tietyntyyppiset mallit. Harjoitat mallin tietojoukolla ja annat sille algoritmin, jonka avulla se päättelee ja oppii tästä tietojoukosta. Lisätietoja on kohdassa Koneoppimismalli.

  • suorita: A-suoritus vastaa mallikoodin yksittäistä suoritusta. MLflow -seuranta perustuu kokeisiin ja suorittamiseen.

Fabric-tietovarasto

  • SQL-analytiikan päätepiste: Each Lakehousessa on SQL-analytiikan päätepiste, jonka avulla käyttäjä voi kysellä delta-taulukon tietoja TSQL:llä TDS:n kautta. Lisätietoja on artikkelissa SQL-analytiikan päätepiste.

  • Fabric-tietovarasto: Fabric Data Warehouse toimii perinteisenä tietovarastona ja tukee kaikkia tapahtumapohjaisia T-SQL-ominaisuuksia, joita voit odottaa yrityksen tietovarastosta. Katso lisätietoja artikkelista Fabric Data Warehouse.

Real-Time intelligence

  • aktivointi: Activator on koodittomuustyökalu, jonka avulla voit luoda tiedoillesi hälytyksiä, käynnistimiä ja toimintoja. Tietovirroista luodaan hälytyksiä aktivointitoiminnon avulla. Jos haluat lisätietoja, katso Aktivointi.

  • Eventhouse: Eventhouset tarjoavat ratkaisun suurten tietomäärien käsittelyyn ja analysointiin erityisesti tilanteissa, jotka edellyttävät reaaliaikaista analysointia ja tutkimista. Ne on suunniteltu käsittelemään reaaliaikaisia tietovirtoja tehokkaasti, jolloin organisaatiot voivat käsitellä, käsitellä ja analysoida tietoja lähes reaaliaikaisesti. Yhdessä työtilassa voi olla useita Eventhouse-taloja. Tapahtumatalossa voi olla useita KQL-tietokantoja, ja jokaisessa tietokannassa voi olla useita taulukoita. Lisätietoja on Eventhousen yleiskatsauksessa.

  • Eventstream: Microsoft Fabric -tapahtumajärjestelmä tarjoaa Fabric-ympäristössä keskitetyn paikan reaaliaikaisten tapahtumien sieppaamiseen, muuntamiseen ja reititykseen kohteisiin ilman koodausta. Tapahtumavirta koostuu erilaisista suoratoistettavasta tietolähteestä, tietojen käsittelykohteista ja tapahtuman suorittimesta, kun muuntamista tarvitaan. Jos haluat lisätietoja, katso Microsoft Fabric -tapahtumasisältöjen .

  • KQL-tietokanta: KQL-tietokanta sisältää tietoja muodossa, jossa voit suorittaa KQL-kyselyitä. KQL-tietokannat ovat Eventhousen alla. Lisätietoja on artikkelissa KQL-tietokannan.

  • KQL-kyselyjoukko: KQL-kyselyjoukko on kohde, jota käytetään kyselyjen suorittamiseen, tulosten tarkasteluun ja Data Explorer -tietokannan tietojen kyselytulosten muokkaamiseen. Kyselyjoukko sisältää tietokannat ja taulukot, kyselyt ja tulokset. KQL-kyselyjoukon avulla voit tallentaa kyselyt tulevaa käyttöä varten tai viedä ja jakaa kyselyitä muiden kanssa. Lisätietoja on artikkelissa Kyselytiedot KQL-kyselyjoukon

Real-Time keskus

  • Real-Time: Real-Time hub on yksi paikka kaikille dataa liikuttaville tiedoille koko organisaatiossa. Jokainen Microsoft Fabric -vuokraaja valmistellaan automaattisesti toiminnolla. Lisätietoja on Real-Time hubin yleiskatsauksessa.

OneLake

  • -pikakuvake:-pikakuvakkeet ovat OneLaken upotettuja viittauksia, jotka osoittavat muihin tiedostosäilön sijainteihin. Ne tarjoavat tavan muodostaa yhteys olemassa oleviin tietoihin ilman, että niitä tarvitsee kopioida suoraan. Jos haluat lisätietoja, katso OneLake-pikanäppäimet.