Oversikt over Copilot for datavitenskap og datateknikk (forhåndsversjon)
Viktig
Denne funksjonen er i forhåndsversjon.
Copilot for datavitenskap og datateknikk er en ASSISTENT for kunstig intelligens som hjelper til med å analysere og visualisere data. Det fungerer med Lakehouse-tabeller og -filer, Power BI-datasett og pandaer/spark/fabric-datarammer, og gir svar og kodesnutter direkte i notatblokken. Den mest effektive måten å bruke Copilot på, er å legge til dataene som en dataramme. Du kan stille spørsmålene dine i chattepanelet, og AI-en gir svar eller kode som du kan kopiere til notatblokken. Den forstår dataenes skjema og metadata, og hvis data lastes inn i en dataramme, har den også bevissthet om dataene i datarammen. Du kan be Copilot om å gi innsikt i data, opprette kode for visualiseringer eller gi kode for datatransformasjoner, og den gjenkjenner filnavn for enkel referanse. Copilot effektiviserer dataanalyse ved å eliminere kompleks koding.
Notat
- Administratoren må aktivere leierbryteren før du begynner å bruke Copilot. Se artikkelen Copilot leierinnstillinger for mer informasjon.
- F64- eller P1-kapasiteten må være i et av områdene som er oppført i denne artikkelen, fabric-områdetilgjengelighet.
- Hvis leieren eller kapasiteten er utenfor USA eller Frankrike, deaktiveres Copilot som standard med mindre leieradministratoren for Fabric aktiverer data som sendes til Azure OpenAI, kan behandles utenfor leierens geografiske område, samsvarsgrense eller nasjonale skyforekomst leierinnstilling i administrasjonsportalen for Stoff.
- Copilot i Microsoft Fabric støttes ikke på prøveversjon av SKU-er. Bare betalte SKU-er (F64 eller høyere, eller P1 eller høyere) støttes.
- Copilot i Fabric rulles for tiden ut i offentlig forhåndsvisning og forventes å være tilgjengelig for alle kunder innen utgangen av mars 2024.
- Se artikkelen Oversikt over Copilot i Fabric og Power BI for mer informasjon.
Innføring i Copilot for datavitenskap og datateknikk for stoffdatavitenskap
Med Copilot for datavitenskap og datateknikk kan du chatte med en AI-assistent som kan hjelpe deg med å håndtere dataanalyse og visualiseringsoppgaver. Du kan stille Copilot spørsmål om lakehouse-tabeller, Power BI-datasett eller Pandas/Spark-datarammer i notatblokker. Copilot svar på naturlig språk eller kodesnutter. Copilot kan også generere dataspesifikk kode for deg, avhengig av oppgaven. For eksempel kan Copilot for datavitenskap og datateknikk generere kode for:
- Oppretting av diagram
- Filtrere data
- Bruke transformasjoner
- Maskinlæringsmodeller
Først velger du Copilot-ikonet på notatblokkbåndet. Chattepanelet Copilot åpnes, og en ny celle vises øverst i notatblokken. Denne cellen må kjøres hver gang en Spark-økt lastes inn i en Fabric-notatblokk. Ellers fungerer ikke Copilot opplevelse riktig. Vi er i ferd med å evaluere andre mekanismer for å håndtere denne nødvendige initialiseringen i fremtidige versjoner.
Kjør cellen øverst i notatblokken, med denne koden:
#Run this cell to install the required packages for Copilot
%load_ext dscopilot_installer
%activate_dscopilot
Når cellen er utført, kan du bruke Copilot. Du må kjøre cellen på nytt øverst i notatblokken hver gang økten i notatblokken lukkes.
Hvis du vil maksimere Copilot effektiviteten, laster du inn en tabell eller et datasett som en dataramme i notatblokken. På denne måten kan AI-en få tilgang til dataene og forstå strukturen og innholdet. Deretter begynner du å chatte med ai. Velg chatikonet på verktøylinjen for notatblokken, og skriv inn spørsmålet eller forespørselen i chattepanelet. Du kan for eksempel spørre:
- "Hva er gjennomsnittsalderen for kunder i dette datasettet?"
- "Vis meg et stolpediagram over salg etter område"
Og mer. Copilot svarer med svaret eller koden, som du kan kopiere og lime den inn i notatblokken. Copilot for datavitenskap og datateknikk er en praktisk, interaktiv måte å utforske og analysere dataene på.
Når du bruker Copilot, kan du også aktivere de magiske kommandoene i en notatblokkcelle for å hente utdata direkte i notatblokken. For svar på naturlig språk kan du for eksempel stille spørsmål ved hjelp av kommandoen "%%chat", for eksempel:
%%chat
What are some machine learning models that may fit this dataset?
eller
%%code
Can you generate code for a logistic regression that fits this data?
Copilot for Data Science and Data Engineering har også skjema- og metadatabevissthet om tabeller i lakehouse. Copilot kan gi relevant informasjon i sammenheng med dataene i et vedlagt innsjøhus. Du kan for eksempel spørre:
- "Hvor mange bord er det i lakehouse?"
- "Hva er kolonnene til tabellkundene?"
Copilot svarer med relevant informasjon hvis du har lagt til lakehouse i notatblokken. Copilot har også bevissthet om navnene på filer som er lagt til i alle lakehouse festet til notatblokken. Du kan referere til disse filene etter navn i chatten. Hvis du for eksempel har en fil med navnet sales.csv i lakehouse, kan du spørre «Opprett en dataramme fra sales.csv». Copilot genererer koden og viser den i chattepanelet. Med Copilot for notatblokker kan du enkelt få tilgang til og spørre etter data fra ulike kilder. Du trenger ikke den nøyaktige kommandosyntaksen for å gjøre det.
Tips
- «Fjern» samtalen i det Copilot chattepanelet med kosten plassert øverst i chattepanelet. Copilot beholder kunnskapen om eventuelle inndata eller utdata i løpet av økten, men dette hjelper hvis du finner det gjeldende innholdet forstyrrende.
- Bruk biblioteket for chatmagi til å konfigurere innstillinger om Copilot, inkludert personverninnstillinger. Standard delingsmodus er utformet for å maksimere kontekstdelingen Copilot har tilgang til, slik at begrensning av informasjonen som gis til copilot, kan påvirke relevansen av svarene betydelig.
- Når Copilot første start, tilbyr den et sett med nyttige ledetekster som kan hjelpe deg med å komme i gang. De kan hjelpe kickstart samtalen med Copilot. Hvis du vil referere til ledetekster senere, kan du bruke glitterknappen nederst i chattepanelet.
- Du kan «dra» sidepanelet i copilot-chatten for å utvide chattepanelet, for å vise kode tydeligere eller for lesbarhet av utdataene på skjermen.
Begrensninger
Copilot funksjoner i datavitenskapsopplevelsen er for øyeblikket begrenset til notatblokker. Disse funksjonene inkluderer den Copilot chatruten, magiske IPython-kommandoer som kan brukes i en kodecelle, og automatiske kodeforslag mens du skriver i en kodecelle. Copilot kan også lese semantiske Power BI-modeller ved hjelp av en integrering av semantisk kobling.
Copilot har to tiltenkte nøkkelbruk:
- Du kan be Copilot om å undersøke og analysere data i notatblokken (for eksempel ved først å laste inn en DataFrame og deretter be Copilot om data i DataFrame).
- To, du kan be Copilot om å generere en rekke forslag om dataanalyseprosessen, for eksempel hvilke prediktive modeller som kan være relevante, kode for å utføre ulike typer dataanalyse og dokumentasjon for en fullført notatblokk.
Husk at kodegenerering med raske eller nylig utgitte biblioteker kan omfatte unøyaktigheter eller fabrikasjoner.