Delen via


Overzicht van Copilot voor Data Science en Data Engineering (preview)

Belangrijk

Deze functie bevindt zich in preview-versie.

Copilot voor Data Science en Data Engineering is een AI-assistent waarmee u gegevens kunt analyseren en visualiseren. Het werkt met Lakehouse-tabellen en -bestanden, Power BI-gegevenssets en pandas/spark/fabric-gegevensframes, waarmee antwoorden en codefragmenten rechtstreeks in het notebook worden verstrekt. De meest effectieve manier om Copilot te gebruiken, is door uw gegevens toe te voegen als een dataframe. U kunt uw vragen stellen in het chatvenster en de AI biedt antwoorden of code om naar uw notebook te kopiëren. Het begrijpt het schema en de metagegevens van uw gegevens en als gegevens in een dataframe worden geladen, is het ook bekend met de gegevens in het gegevensframe. U kunt Copilot vragen om inzicht te geven in gegevens, code voor visualisaties te maken of code te geven voor gegevenstransformaties, en bestandsnamen worden herkend voor eenvoudige referentie. Copilot stroomlijnt gegevensanalyse door complexe codering te elimineren.

Notitie

Inleiding tot Copilot voor Data Science en Data Engineering voor Fabric Data Science

Met Copilot voor Data Science en Data Engineering kunt u chatten met een AI-assistent waarmee u uw gegevensanalyse- en visualisatietaken kunt afhandelen. U kunt de Copilot vragen stellen over lakehouse-tabellen, Power BI-datasets of Pandas/Spark-dataframes in notebooks. Copilot geeft antwoorden in natuurlijke taal of codefragmenten. Copilot kan ook gegevensspecifieke code voor u genereren, afhankelijk van de taak. Copilot voor Data Science en Data Engineering kan bijvoorbeeld code genereren voor:

  • Grafiek maken
  • Gegevens filteren
  • Transformaties toepassen
  • Machine learning-modellen

Selecteer eerst het pictogram Copilot op het lint met notitieblokken. Het Copilot chatvenster wordt geopend en er wordt een nieuwe cel boven aan het notitieblok weergegeven. Deze cel moet worden uitgevoerd telkens wanneer een Spark-sessie wordt geladen in een Fabric-notebook. Anders werkt de Copilot-ervaring niet goed. We zijn bezig met het evalueren van andere mechanismen voor het afhandelen van deze vereiste initialisatie in toekomstige releases.

Schermopname met de knop Copilot op het lint.

Voer de cel boven aan het notebook uit met deze code:

#Run this cell to install the required packages for Copilot
%load_ext dscopilot_installer
%activate_dscopilot

Nadat de cel succesvol is uitgevoerd, kunt u Copilotgebruiken. U moet de cel bovenaan het notitieblok opnieuw uitvoeren telkens wanneer uw sessie in het notitieblok wordt gesloten.

schermafbeelding die geslaagde uitvoering van cellen toont.

Als u de effectiviteit van Copilot wilt maximaliseren, laadt u een tabel of gegevensset als een dataframe in uw notebook. Op deze manier kan de AI toegang krijgen tot de gegevens en de structuur en inhoud ervan begrijpen. Begin vervolgens te chatten met de AI. Selecteer het chatpictogram op de werkbalk van het notitieblok en typ uw vraag of aanvraag in het chatvenster. U kunt bijvoorbeeld het volgende vragen:

  • Wat is de gemiddelde leeftijd van klanten in deze gegevensset?
  • "Toon een staafdiagram van verkoop per regio"

En nog veel meer. Copilot reageert met het antwoord of de code, die u kunt kopiëren en plakken in uw notitieblok. Copilot voor Data Science en Data Engineering is een handige, interactieve manier om uw gegevens te verkennen en te analyseren.

Terwijl u Copilotgebruikt, kunt u ook de magische commando's in een notebookcel aanroepen om uitvoer rechtstreeks in de notebook te verkrijgen. Voor antwoorden in natuurlijke taal kunt u bijvoorbeeld vragen stellen met behulp van de opdracht '%%chat', zoals:

%%chat
What are some machine learning models that may fit this dataset?

schermopname van het genereren van code.

of

%%code
Can you generate code for a logistic regression that fits this data?

Schermopname van het genereren van logistieke regressiecode.

Copilot voor Data Science en Data Engineering heeft ook schema- en metagegevenskennis van tabellen in lakehouse. Copilot kan relevante informatie verstrekken in de context van uw gegevens in een gekoppeld lakehouse. U kunt bijvoorbeeld het volgende vragen:

  • Hoeveel tafels zijn er in het lakehouse?
  • "Wat zijn de kolommen van de tabelklanten?"

Copilot reageert met de relevante informatie wanneer u het lakehouse aan de notebook hebt toegevoegd. Copilot heeft ook inzicht in de namen van bestanden die zijn toegevoegd aan elk lakehouse dat aan het notitieblok is gekoppeld. U kunt deze bestanden op naam in uw chat raadplegen. Als u bijvoorbeeld een bestand hebt met de naam sales.csv in uw lakehouse, kunt u vragen om een dataframe te maken van sales.csv. Copilot de code genereert en deze weergeeft in het chatvenster. Met Copilot voor notebooks kunt u eenvoudig gegevens uit verschillende bronnen openen en er query's op uitvoeren. U hebt niet de exacte opdrachtsyntaxis nodig om dit te doen.

Tips

  • Verwijder uw chatgesprek in het chatvenster Copilot met de bezem bovenin het chatvenster. Copilot behoudt tijdens de sessie kennis van invoer en uitvoer, maar dit helpt als u de huidige inhoud als afleidend ervaart.
  • Gebruik de magics-bibliotheek voor chat om instellingen over Copilotte configureren, inclusief privacyinstellingen. De standaardmodus voor delen is ontworpen om de contexten waar Copilot toegang toe heeft te maximaliseren, zodat het beperken van de informatie die aan copilot wordt verstrekt, rechtstreeks en aanzienlijk invloed kan hebben op de relevantie van de antwoorden.
  • Wanneer Copilot voor het eerst wordt gestart, biedt het een set nuttige aanwijzingen waarmee u aan de slag kunt gaan. Ze kunnen u helpen uw gesprek te starten met Copilot. Als u later naar prompts wilt verwijzen, kunt u de sparkle-knop onder aan het chatvenster gebruiken.
  • U kunt de zijbalk van de copilot-chat 'slepen' om het chatvenster uit te vouwen, om code duidelijker weer te geven of voor leesbaarheid van de uitvoer op uw scherm.

Beperkingen

Copilot-functies in de Data Science-omgeving zijn momenteel beperkt tot notebooks. Deze functies omvatten het Copilot chatvenster, IPython magic-opdrachten die kunnen worden gebruikt in een codecel en automatische codesuggesties terwijl u een codecel typt. Copilot kan ook semantische Power BI-modellen lezen met behulp van de integratie van semantische koppeling.

Copilot heeft twee belangrijke toepassingen:

  • U kunt Copilot vragen om gegevens in uw notebook te onderzoeken en te analyseren (bijvoorbeeld door eerst een DataFrame te laden en vervolgens Copilot te vragen over gegevens in het DataFrame).
  • U kunt Copilot vragen om een reeks suggesties te genereren over uw gegevensanalyseproces, zoals welke voorspellende modellen relevant kunnen zijn, code voor het uitvoeren van verschillende typen gegevensanalyse en documentatie voor een voltooid notitieblok.

Houd er rekening mee dat het genereren van code met snel bewegende of onlangs uitgebrachte bibliotheken onnauwkeurigheden of fabricaties kan bevatten.