Jaa


Yleiskatsaus Copilot for Data Science and Data Engineering (esikatselu)

Tärkeä

Tämä ominaisuus on esikatseluvaiheessa.

Copilot for Data Science and Data Engineering on tekoälyavustaja, joka auttaa analysoimaan ja visualisoimaan tietoja. Se toimii Lakehousen taulukoiden ja tiedostojen, Power BI -tietojoukkojen ja pandas/spark/fabric-tietokehysten kanssa tarjoten vastauksia ja koodikatkelmia suoraan muistikirjaan. Tehokkain tapa käyttää Copilot on lisätä tietosi tietokehyksenä. Voit esittää kysymyksesi keskustelupaneelissa, ja tekoäly tarjoaa vastauksia tai koodia, jotka voit kopioida muistikirjaasi. Se ymmärtää tietosi rakenteen ja metatiedot. Jos tiedot ladataan tietokehykseen, se on tietoinen myös tietokehyksen sisältämistä tiedoista. Voit pyytää Copilot tarjoamaan merkityksellisiä tietoja, luomaan koodin visualisointeja varten tai tarjoamaan koodia tietojen muunnoksille ja tunnistamaan tiedostonimet, jotta niistä on helppo viitata. Copilot tehostaa tietojen analysointia poistamalla monimutkaisia koodauksia.

Muistiinpano

  • Järjestelmänvalvojan on otettava vuokraajavalitsin käyttöön, ennen kuin aloitat Copilotkäytön. Katso lisätietoja vuokraajan asetusten artikkelista .
  • F64- tai P1-kapasiteetin on oltava jollakin tässä artikkelissa luetelluista alueista, Fabric-alueen käytettävyys.
  • Jos vuokraajasi tai kapasiteettisi on Yhdysvaltojen tai Ranskan ulkopuolella, Copilot on oletusarvoisesti poissa käytöstä, ellei Fabric-vuokraajan järjestelmänvalvoja ota käyttöön Azure OpenAI:iin lähetettyjä tietoja voida käsitellä vuokraajasi maantieteellisen alueen, yhteensopivuusrajan tai kansallisen pilvipalveluesiintymän vuokraajan asetuksen ulkopuolella Fabric-hallintaportaalissa.
  • Microsoft Fabricin Copilot ei tueta kokeiluversion SKU:issa. Vain maksullisia SKU:ita (F64 tai uudempi tai P1 tai uudempi) tuetaan.
  • Copilot In Fabricissa julkaistaan parhaillaan julkisessa esikatselussa, ja sen odotetaan olevan kaikkien asiakkaiden saatavilla maaliskuuhun 2024 mennessä.
  • Lisätietoja on artikkelissa Fabric- ja Power BI -Copilot yleiskatsaus.

Johdanto Fabric Data Science -tieteen datatieteen Copilot ja tietotekniikkaan

Copilot for Data Science and Data Engineeringin avulla voit keskustella tekoälyavustajan kanssa, joka auttaa sinua käsittelemään tietojen analysointi- ja visualisointitehtäviä. Voit esittää Copilot kysymyksiä lakehouse-taulukoista, Power BI -tietojoukoista tai Pandas/Spark-tietokehyksistä muistikirjojen sisällä. Copilot vastauksia luonnollisella kielellä tai koodikatkelmia. Copilot voivat myös luoda puolestasi tietokohtaista koodia tehtävän mukaan. Esimerkiksi Copilot datatieteelle ja tietotekniikkaan voivat luoda koodia:

  • Kaavion luominen
  • Tietojen suodattaminen
  • Muunnosten käyttäminen
  • Koneoppimismallit

Valitse ensin muistikirjojen valintanauhasta Copilot-kuvake. Copilot keskustelupaneeli avautuu, ja uusi solu ilmestyy muistikirjasi yläreunaan. Tämä solu on suoritettava aina, kun Spark-istunto ladataan Fabric-muistikirjaan. Muussa tapauksessa Copilot käyttökokemus ei toimi oikein. Arvioimme parhaillaan muita mekanismeja, joilla tämä vaadittu alustus käsitellään tulevissa versioissa.

Näyttökuva, jossa näkyy Copilot valintanauha.

Suorita muistikirjan yläosassa oleva solu tällä koodilla:

#Run this cell to install the required packages for Copilot
%pip install https://aka.ms/chat-magics-0.0.0-py3-none-any.whl
%load_ext chat_magics

Kun solu on suoritettu onnistuneesti, voit käyttää Copilot. Sinun on suoritettava uudelleen muistikirjan yläosassa oleva solu aina, kun muistikirjasi sulkeutuu.

Näyttökuvassa näkyy solun onnistunut suoritus.

Voit maksimoida Copilot tehokkuuden lataamaan taulukon tai tietojoukon tietokehyksenä muistikirjaasi. Näin tekoäly voi käyttää tietoja ja ymmärtää niiden rakenteen ja sisällön. Sitten alat juttelemaan tekoälyn kanssa. Valitse keskustelukuvake muistikirjan työkalurivillä ja kirjoita kysymyksesi tai pyyntösi keskustelupaneeliin. Voit esimerkiksi kysyä seuraavaa:

  • "Mikä on tämän tietojoukon asiakkaiden keski-ikä?"
  • "Näytä palkkikaavio myynnistä alueittain"

Ja paljon muuta. Copilot vastaa vastauksella tai koodilla, jonka voit kopioida ja liittää muistikirjaasi. Copilot for Data Science and Data Engineering on kätevä ja vuorovaikutteinen tapa tutkia ja analysoida tietojasi.

Kun käytät Copilot, voit myös käynnistää muistikirjasolun sisällä olevat taikakomennot, jotta tuloste saadaan suoraan muistikirjaan. Voit esimerkiksi esittää kysymyksiä luonnollisella kielellä käyttämällä komentoa "%%chat", kuten:

%%chat
What are some machine learning models that may fit this dataset?

Näyttökuva, joka näyttää koodin luonnin.

tai

%%code
Can you generate code for a logistic regression that fits this data?

Näyttökuva, joka näyttää logististen regressiokoodien luonnin.

Copilot for Data Science and Data Engineering -tekniikassa on myös rakenne- ja metatietoisuus Lakehousen taulukoista. Copilot voivat tarjota merkityksellisiä tietoja liitettyyn lakehouse-järjestelmään tallennettujen tietoihisi liittyen. Voit esimerkiksi kysyä seuraavaa:

  • "Kuinka monta pöytää Lakehousessa on?"
  • "Mitkä ovat taulukon asiakkaiden sarakkeet?"

Copilot vastaa asiaankuuluvilla tiedoilla, jos lisäsit lakehousen muistikirjaan. Copilot on myös tietoinen muistikirjaan liitettyihin lakehouse-ryhmiin lisättyjen tiedostojen nimistä. Voit viitata kyseisiin tiedostoihin nimen mukaan keskustelussasi. Jos sinulla on Lakehousessa esimerkiksi tiedosto nimeltä sales.csv, voit pyytää "Luo tietokehys sales.csv". Copilot luo koodin ja näyttää sen keskustelupaneelissa. Muistikirjojen Copilot avulla voit helposti käyttää ja kysellä tietojasi eri lähteistä. Et tarvitse siihen tarkkaa komentosyntaksia.

Vinkkejä

  • "Tyhjennä" keskustelusi Copilot keskustelupaneelissa, jossa luuta sijaitsee keskustelupaneelin yläreunassa. Copilot säilyttää tiedot istunnon aikana mahdollisesti annetuista tiedoista tai tuloksista, mutta se auttaa, jos nykyinen sisältö häiritsee sinua.
  • Chat magics -kirjaston avulla voit määrittää Copilotkoskevia asetuksia, mukaan lukien tietosuoja-asetukset. Oletusjakamistila on suunniteltu maksimoimaan kontekstin jakaminen, Copilot voi käyttää, joten annettujen tietojen rajoittaminen copilot voi vaikuttaa suoraan ja merkittävästi sen vastausten merkitykseen.
  • Kun Copilot ensimmäiset käynnistykset, se tarjoaa joukon hyödyllisiä kehotteita, jotka voivat auttaa sinua pääsemään alkuun. Ne voivat auttaa käynnistämään keskustelun Copilot. Voit viitata kehotteeseen myöhemmin käyttämällä keskustelupaneelin alareunan sparkle-painiketta.
  • Voit "vetää" copilot -keskustelun sivupalkin, jos haluat laajentaa keskustelupaneelin, tarkastella koodia selkeämmin tai näytön tulosten luettavuutta.

Rajoitukset

Copilot datatieteen ominaisuudet on tällä hetkellä rajoitettu muistikirjoihin. Näitä ominaisuuksia ovat Copilot chat-ruutu, IPython-taikakomennot, joita voidaan käyttää koodisolussa, ja automaattiset koodiehdotukset, kun kirjoitat koodisoluun. Copilot voivat myös lukea Power BI:n semanttisia malleja käyttämällä semanttisen linkin integrointia.

Copilot on kaksi aiottua avainkäyttöä:

  • Voit esimerkiksi pyytää Copilot tutkimaan ja analysoimaan muistikirjasi tietoja (esimerkiksi lataamalla ensin DataFramen ja kysymällä Copilot DataFramen sisältämistä tiedoista).
  • Toiseksi voit pyytää Copilot luomaan joukon ehdotuksia tietoanalyysiprosessistasi, kuten mitkä ennakoivat mallit voivat olla olennaisia, koodia erityyppisten tietoanalyysien suorittamiseksi ja valmiin muistikirjan dokumentaatiota varten.

Muista, että koodin luominen nopeasti etenevät tai äskettäin julkaistut kirjastot saattavat sisältää epätarkkuuksia tai rakenteita.