Del via


Oversikt over Copilot for datavitenskap og datateknikk (forhåndsversjon)

Viktig

Denne funksjonen er i forhåndsversjon.

Copilot for datavitenskap og datateknikk er en ASSISTENT for kunstig intelligens som hjelper til med å analysere og visualisere data. Det fungerer med Lakehouse-tabeller og -filer, Power BI-datasett og pandaer/spark/fabric-datarammer, og gir svar og kodesnutter direkte i notatblokken. Den mest effektive måten å bruke Copilot på, er å legge til dataene som en dataramme. Du kan stille spørsmålene dine i chattepanelet, og AI-en gir svar eller kode som du kan kopiere til notatblokken. Den forstår dataenes skjema og metadata, og hvis data lastes inn i en dataramme, har den også bevissthet om dataene i datarammen. Du kan be Copilot om å gi innsikt i data, opprette kode for visualiseringer eller gi kode for datatransformasjoner, og den gjenkjenner filnavn for enkel referanse. Copilot effektiviserer dataanalyse ved å eliminere kompleks koding.

Notat

Innføring i Copilot for datavitenskap og datateknikk for stoffdatavitenskap

Med Copilot for datavitenskap og datateknikk kan du chatte med en AI-assistent som kan hjelpe deg med å håndtere dataanalyse og visualiseringsoppgaver. Du kan stille Copilot spørsmål om lakehouse-tabeller, Power BI-datasett eller Pandas/Spark-datarammer i notatblokker. Copilot svar på naturlig språk eller kodesnutter. Copilot kan også generere dataspesifikk kode for deg, avhengig av oppgaven. For eksempel kan Copilot for datavitenskap og datateknikk generere kode for:

  • Oppretting av diagram
  • Filtrere data
  • Bruke transformasjoner
  • Maskinlæringsmodeller

Først velger du Copilot-ikonet på notatblokkbåndet. Chattepanelet Copilot åpnes, og en ny celle vises øverst i notatblokken. Denne cellen må kjøres hver gang en Spark-økt lastes inn i en Fabric-notatblokk. Ellers fungerer ikke Copilot opplevelse riktig. Vi er i ferd med å evaluere andre mekanismer for å håndtere denne nødvendige initialiseringen i fremtidige versjoner.

Skjermbilde som viser Copilot-knappen på båndet.

Kjør cellen øverst i notatblokken, med denne koden:

#Run this cell to install the required packages for Copilot
%load_ext dscopilot_installer
%activate_dscopilot

Når cellen er utført, kan du bruke Copilot. Du må kjøre cellen på nytt øverst i notatblokken hver gang økten i notatblokken lukkes.

Skjermbilde som viser vellykket kjøring av celle.

Hvis du vil maksimere Copilot effektiviteten, laster du inn en tabell eller et datasett som en dataramme i notatblokken. På denne måten kan AI-en få tilgang til dataene og forstå strukturen og innholdet. Deretter begynner du å chatte med ai. Velg chatikonet på verktøylinjen for notatblokken, og skriv inn spørsmålet eller forespørselen i chattepanelet. Du kan for eksempel spørre:

  • "Hva er gjennomsnittsalderen for kunder i dette datasettet?"
  • "Vis meg et stolpediagram over salg etter område"

Og mer. Copilot svarer med svaret eller koden, som du kan kopiere og lime den inn i notatblokken. Copilot for datavitenskap og datateknikk er en praktisk, interaktiv måte å utforske og analysere dataene på.

Når du bruker Copilot, kan du også aktivere de magiske kommandoene i en notatblokkcelle for å hente utdata direkte i notatblokken. For svar på naturlig språk kan du for eksempel stille spørsmål ved hjelp av kommandoen "%%chat", for eksempel:

%%chat
What are some machine learning models that may fit this dataset?

Skjermbilde som viser kodegenerering.

eller

%%code
Can you generate code for a logistic regression that fits this data?

Skjermbilde som viser generering av logistisk regresjonskode.

Copilot for Data Science and Data Engineering har også skjema- og metadatabevissthet om tabeller i lakehouse. Copilot kan gi relevant informasjon i sammenheng med dataene i et vedlagt innsjøhus. Du kan for eksempel spørre:

  • "Hvor mange bord er det i lakehouse?"
  • "Hva er kolonnene til tabellkundene?"

Copilot svarer med relevant informasjon hvis du har lagt til lakehouse i notatblokken. Copilot har også bevissthet om navnene på filer som er lagt til i alle lakehouse festet til notatblokken. Du kan referere til disse filene etter navn i chatten. Hvis du for eksempel har en fil med navnet sales.csv i lakehouse, kan du spørre «Opprett en dataramme fra sales.csv». Copilot genererer koden og viser den i chattepanelet. Med Copilot for notatblokker kan du enkelt få tilgang til og spørre etter data fra ulike kilder. Du trenger ikke den nøyaktige kommandosyntaksen for å gjøre det.

Tips

  • «Fjern» samtalen i det Copilot chattepanelet med kosten plassert øverst i chattepanelet. Copilot beholder kunnskapen om eventuelle inndata eller utdata i løpet av økten, men dette hjelper hvis du finner det gjeldende innholdet forstyrrende.
  • Bruk biblioteket for chatmagi til å konfigurere innstillinger om Copilot, inkludert personverninnstillinger. Standard delingsmodus er utformet for å maksimere kontekstdelingen Copilot har tilgang til, slik at begrensning av informasjonen som gis til copilot, kan påvirke relevansen av svarene betydelig.
  • Når Copilot første start, tilbyr den et sett med nyttige ledetekster som kan hjelpe deg med å komme i gang. De kan hjelpe kickstart samtalen med Copilot. Hvis du vil referere til ledetekster senere, kan du bruke glitterknappen nederst i chattepanelet.
  • Du kan «dra» sidepanelet i copilot-chatten for å utvide chattepanelet, for å vise kode tydeligere eller for lesbarhet av utdataene på skjermen.

Begrensninger

Copilot funksjoner i datavitenskapsopplevelsen er for øyeblikket begrenset til notatblokker. Disse funksjonene inkluderer den Copilot chatruten, magiske IPython-kommandoer som kan brukes i en kodecelle, og automatiske kodeforslag mens du skriver i en kodecelle. Copilot kan også lese semantiske Power BI-modeller ved hjelp av en integrering av semantisk kobling.

Copilot har to tiltenkte nøkkelbruk:

  • Du kan be Copilot om å undersøke og analysere data i notatblokken (for eksempel ved først å laste inn en DataFrame og deretter be Copilot om data i DataFrame).
  • To, du kan be Copilot om å generere en rekke forslag om dataanalyseprosessen, for eksempel hvilke prediktive modeller som kan være relevante, kode for å utføre ulike typer dataanalyse og dokumentasjon for en fullført notatblokk.

Husk at kodegenerering med raske eller nylig utgitte biblioteker kan omfatte unøyaktigheter eller fabrikasjoner.