Jaa


Fabric Runtime 1.3 (GA)

Fabric runtime tarjoaa saumattoman integroinnin Azureen. Se tarjoaa hienostuneen ympäristön sekä tietotekniikka- että datatiedeprojekteihin, joissa käytetään Apache Sparkiä. Tässä artikkelissa annetaan yleiskatsaus fabric runtime 1.3:n olennaisiin ominaisuuksiin ja komponentteihin. Se on uusin massadatalaskennan suorituspalvelu.

Microsoft Fabric Runtime 1.3 on viimeisin yleisesti saatavilla oleva suorituksenaikainen versio, joka sisältää seuraavat osat ja päivitykset, jotka on suunniteltu parantamaan tietojen käsittelyominaisuuksia:

  • Apache Spark 3.5
  • Käyttöjärjestelmä: Mariner 2.0
  • Java: 11
  • Skalaa: 2.12.17
  • Python: 3.11
  • Delta Lake: 3.2
  • R: 4.4.1

Vihje

Fabric Runtime 1.3 sisältää tuen alkuperäiselle suoritinmoduulille, joka voi parantaa suorituskykyä merkittävästi ilman lisäkustannuksia. Jos haluat ottaa käyttöön alkuperäisen suorittamismoduulin kaikissa ympäristössäsi olevissa työtiloissa ja muistikirjoissa, siirry ympäristöasetuksiin, valitse Spark-käsittely, siirry Kiihdytys-välilehteen ja valitse Ota käyttöön alkuperäinen suoritusmoduuli. Tallentamisen ja julkaisemisen jälkeen tämä asetus otetaan käyttöön koko ympäristössä, joten kaikki uudet työt ja muistikirjat perivät automaattisesti parannetut suorituskykyominaisuudet ja hyötyvät niistä.

Noudata seuraavia ohjeita, jotta voit integroida runtime 1.3:n työtilaasi ja käyttää sen uusia ominaisuuksia:

  1. Siirry Fabric-työtilan Työtilan asetukset -välilehteen.
  2. Siirry Tietotekniikka/tiede -välilehteen ja valitse Spark-asetukset.
  3. Valitse Ympäristö-välilehti .
  4. Laajenna avattava luettelo Runtime-versioiden kohdalla.
  5. Valitse 1.3 (Spark 3.5, Delta 3.2) ja tallenna muutoksesi. Tämä toiminto määrittää työtilan oletusarvoiseksi suorituspalveluksi luvun 1.3.

Näyttökuva, jossa näkyy suorituksenaikaisen version valinta.

Voit nyt aloittaa Fabric runtime 1.3:n (Spark 3.5 ja Delta Lake 3.2) uusimmat parannukset ja toiminnot.

Tärkeimmät tiedot

Apache Spark 3.5

Apache Spark 3.5.0 on 3.x-sarjan kuudes versio. Tämä versio on avoimen lähdekoodin yhteisössä tehtävän laajan yhteistyön tulos. Siinä käsitellään yli 1 300 ongelmaa, jotka on kirjattu Jiraan.

Tässä versiossa on yhteensopivuuden päivitys jäsennettyyn suoratoistoon. Lisäksi tämä versio laajentaa PySparkin ja SQL:n toimintoja. Se lisää ominaisuuksia, kuten SQL-tunnistelausekkeen, nimetyt argumentit SQL-funktiokutsuihin ja SQL-funktioiden lisäämisen HyperLogLog-likimääräisiä koosteita varten. Muita uusia ominaisuuksia ovat myös Käyttäjän määrittämät Python-taulukkofunktiot, hajautetun koulutuksen yksinkertaistaminen DeepSpeedin kautta ja uudet jäsennettyjen suoratoisto-ominaisuudet, kuten vesileiman levitys ja dropDuplicatesWithinWatermark-toiminto.

Voit tarkistaa täydellisen luettelon ja yksityiskohtaiset muutokset täältä: https://spark.apache.org/releases/spark-release-3-5-0.html.

Delta Spark

Delta Lake 3.2 on kollektiivinen sitoutuminen Delta Lake -järven yhteentoimimiseen eri muodoissa, helppokäyttöisempiin ja tehokkaampiin. Delta Spark 3.2 on rakennettu Apache Spark™ 3.5:n päälle. Delta Spark maven -artefakti on nimetty uudelleen delta-ytimestä delta-spark-artefaktiksi.

Voit tarkistaa täydellisen luettelon ja yksityiskohtaiset muutokset täältä: https://docs.delta.io/3.2.0/index.html.

Vihje

Saat ajan tasalla olevat tiedot, yksityiskohtaisen luettelon muutoksista ja Fabric-suorituspalvelun erityisistä julkaisutiedoista tarkistamalla Spark Runtimes -julkaisut ja -päivitykset ja tilaamalla ne.