Dela via


Översikt över Copilot för datavetenskap och datateknik (förhandsversion)

Viktig

Den här funktionen finns i förhandsversion.

Copilot för datavetenskap och datateknik är en AI-assistent som hjälper till att analysera och visualisera data. Det fungerar med Lakehouse-tabeller och filer, Power BI-datauppsättningar och pandas/spark/fabric-dataramar, vilket ger svar och kodfragment direkt i notebook. Det mest effektiva sättet att använda Copilot är att lägga till dina data som en dataram. Du kan ställa dina frågor i chattpanelen och AI:n tillhandahåller svar eller kod för att kopiera till din notebook-fil. Den förstår dina datas schema och metadata, och om data läses in i en dataram har den även medvetenhet om data i dataramen. Du kan be Copilot att ge insikter om data, skapa kod för visualiseringar eller ange kod för datatransformeringar och identifiera filnamn för enkel referens. Copilot effektiviserar dataanalysen genom att eliminera komplex kodning.

Anteckning

Introduktion till Copilot för datavetenskap och datateknik för Fabric Data Science

Med Copilot för datavetenskap och datateknik kan du chatta med en AI-assistent som kan hjälpa dig att hantera dina dataanalys- och visualiseringsuppgifter. Du kan ställa frågor till Copilot om lakehouse-tabeller, Power BI-datauppsättningar eller Pandas/Spark-dataramar i anteckningsböcker. Copilot svar på naturligt språk eller kodfragment. Copilot kan också generera dataspecifik kod åt dig, beroende på uppgiften. Till exempel kan Copilot för datavetenskap och datateknik generera kod för:

  • Skapa diagram
  • Filtrering av data
  • Tillämpa transformationer
  • Maskininlärningsmodeller

Välj först ikonen Copilot i menyfliksområdet för anteckningsböcker. Chattpanelen Copilot öppnas och en ny cell visas överst i anteckningsboken. Den här cellen måste köras varje gång en Spark-session läses in i en Fabric-anteckningsbok. Annars fungerar inte Copilot-upplevelsen korrekt. Vi håller på att utvärdera andra mekanismer för att hantera den här nödvändiga initieringen i framtida versioner.

Skärmbild som visar knappen Copilot i menyfliksområdet.

Kör cellen överst i anteckningsboken med den här koden:

#Run this cell to install the required packages for Copilot
%load_ext dscopilot_installer
%activate_dscopilot

När cellen har körts kan du använda Copilot. Du måste köra om cellen högst upp i anteckningsboken varje gång din session i anteckningsboken avslutas.

Skärmbild som visar lyckad cellkörning.

För att maximera Copilot effektiviteten, laddar du en tabell eller datauppsättning som en dataram i din notebook. På så sätt kan AI:n komma åt data och förstå dess struktur och innehåll. Börja sedan chatta med AI:n. Välj chattikonen i notebook-verktygsfältet och skriv din fråga eller begäran i chattpanelen. Du kan till exempel fråga:

  • "Vilken är den genomsnittliga åldern för kunder i den här datamängden?"
  • "Visa mig ett stapeldiagram över försäljning per region"

Och mer. Copilot svarar med svaret eller koden, som du kan kopiera och klistra in i anteckningsboken. Copilot för datavetenskap och datateknik är ett bekvämt, interaktivt sätt att utforska och analysera dina data.

När du använder Copilotkan du också anropa magi-kommandona inuti en anteckningsblockcell för att hämta utdata direkt i anteckningsblocket. För svar på naturligt språk kan du till exempel ställa frågor med hjälp av kommandot "%%chat", till exempel:

%%chat
What are some machine learning models that may fit this dataset?

Skärmbild som visar kodgenerering.

eller

%%code
Can you generate code for a logistic regression that fits this data?

Skärmbild som visar generering av logistisk regressionskod.

Copilot för datavetenskap och datateknik har också schema- och metadatafunktionalitet för tabeller i lakehouse. Copilot kan tillhandahålla relevant information i samband med dina data i ett bifogat sjöhus. Du kan till exempel fråga:

  • Hur många bord finns det i sjöstugan?
  • Vilka är kolumnerna på kunden-tabellen?

Copilot svarar med relevant information om du har lagt till lakehouse i notebook-filen. Copilot har också kännedom om namnen på filer som läggs till i alla lakehouse som är kopplade till notebooken. Du kan referera till filerna efter namn i chatten. Om du till exempel har en fil med namnet sales.csv i lakehouse kan du fråga "Skapa en dataram från sales.csv". Copilot genererar koden och visar den i chattpanelen. Med Copilot för anteckningsböcker kan du enkelt komma åt och ställa frågor till dina data från olika källor. Du behöver inte den exakta kommandosyntaxen för att göra det.

Tips

  • "Rensa din konversation i Copilot-chattpanelen med sopborsten längst upp." Copilot behåller information om alla indata eller utdata under sessionen, men detta kan hjälpa om du tycker att det nuvarande innehållet är distraherande.
  • Använd biblioteket chat magics för att konfigurera inställningar för Copilot, inklusive sekretessinställningar. Standarddelningsläget är utformat för att maximera kontextdelningen Copilot har åtkomst till, så att begränsa den information som tillhandahålls till copilot kan direkt och avsevärt påverka relevansen av dess svar.
  • När Copilot först startas erbjuder den en uppsättning användbara frågor som kan hjälpa dig att komma igång. De kan hjälpa dig att starta konversationen med Copilot. Om du vill referera till frågor senare kan du använda knappen sparkle längst ned i chattpanelen.
  • Du kan "dra" sidopanelen i copilot-chatten för att expandera chattpanelen för att visa kod tydligare eller för läsbarhet för utdata på skärmen.

Begränsningar

Copilot funktioner i Data Science-upplevelsen är för närvarande begränsade till notebook-filer. Dessa funktioner omfattar Copilot chattfönster, IPython-magiska kommandon som kan användas i en kodcell och automatiska kodförslag när du skriver in en kodcell. Copilot kan också läsa Power BI-semantiska modeller med hjälp av en integrering av semantisk länk.

Copilot har två viktiga användningsområden:

  • För det första kan du be Copilot att undersöka och analysera data i notebook-filen (till exempel genom att först läsa in en DataFrame och sedan fråga Copilot om data i DataFrame).
  • För det andra kan du be Copilot att generera en rad förslag om din dataanalysprocess, till exempel vilka förutsägelsemodeller som kan vara relevanta, kod för att utföra olika typer av dataanalys och dokumentation för en slutförd notebook-fil.

Tänk på att kodgenerering med snabbrörliga eller nyligen släppta bibliotek kan innehålla felaktigheter eller fabriceringar.