Overzicht van Copilot voor Data Science en Data Engineering (preview)
Belangrijk
Deze functie bevindt zich in preview-versie.
Copilot voor Data Science en Data Engineering is een AI-assistent waarmee u gegevens kunt analyseren en visualiseren. Het werkt met Lakehouse-tabellen en -bestanden, Power BI-gegevenssets en pandas/spark/fabric-gegevensframes, waarmee antwoorden en codefragmenten rechtstreeks in het notebook worden verstrekt. De meest effectieve manier om Copilot te gebruiken, is door uw gegevens toe te voegen als een dataframe. U kunt uw vragen stellen in het chatvenster en de AI biedt antwoorden of code om naar uw notebook te kopiëren. Het begrijpt het schema en de metagegevens van uw gegevens en als gegevens in een dataframe worden geladen, is het ook bekend met de gegevens in het gegevensframe. U kunt Copilot vragen om inzicht te geven in gegevens, code voor visualisaties te maken of code te geven voor gegevenstransformaties, en bestandsnamen worden herkend voor eenvoudige referentie. Copilot stroomlijnt gegevensanalyse door complexe codering te elimineren.
Notitie
- De beheerder moet de tenantswitch inschakelen voordat u Copilotgaat gebruiken. Zie het artikel Copilot tenantinstellingen voor meer informatie.
- Uw F64- of P1-capaciteit moet zich bevinden in een van de regio's die in dit artikel worden vermeld, Fabric-regio's beschikbaarheid.
- Als uw tenant of capaciteit zich buiten de VS of Frankrijk bevindt, wordt Copilot standaard uitgeschakeld, tenzij uw Fabric-tenantbeheerder de gegevens die naar Azure OpenAI worden verzonden, buiten de geografische regio, nalevingsgrens of nationale cloudinstantie van uw tenant kunnen worden verwerkt tenantinstelling in de fabric-beheerportal.
- Copilot in Microsoft Fabric wordt niet ondersteund voor proef-SKU's. Alleen betaalde SKU's (F64 of hoger of P1 of hoger) worden ondersteund.
- Copilot in Fabric wordt momenteel geïmplementeerd in een openbare preview en is naar verwachting eind maart 2024 beschikbaar voor alle klanten.
- Zie het artikel Overzicht van Copilot in Fabric en Power BI voor meer informatie.
Inleiding tot Copilot voor Data Science en Data Engineering voor Fabric Data Science
Met Copilot voor Data Science en Data Engineering kunt u chatten met een AI-assistent waarmee u uw gegevensanalyse- en visualisatietaken kunt afhandelen. U kunt de Copilot vragen stellen over lakehouse-tabellen, Power BI-datasets of Pandas/Spark-dataframes in notebooks. Copilot geeft antwoorden in natuurlijke taal of codefragmenten. Copilot kan ook gegevensspecifieke code voor u genereren, afhankelijk van de taak. Copilot voor Data Science en Data Engineering kan bijvoorbeeld code genereren voor:
- Grafiek maken
- Gegevens filteren
- Transformaties toepassen
- Machine learning-modellen
Selecteer eerst het pictogram Copilot op het lint met notitieblokken. Het Copilot chatvenster wordt geopend en er wordt een nieuwe cel boven aan het notitieblok weergegeven. Deze cel moet worden uitgevoerd telkens wanneer een Spark-sessie wordt geladen in een Fabric-notebook. Anders werkt de Copilot-ervaring niet goed. We zijn bezig met het evalueren van andere mechanismen voor het afhandelen van deze vereiste initialisatie in toekomstige releases.
Voer de cel boven aan het notebook uit met deze code:
#Run this cell to install the required packages for Copilot
%load_ext dscopilot_installer
%activate_dscopilot
Nadat de cel succesvol is uitgevoerd, kunt u Copilotgebruiken. U moet de cel bovenaan het notitieblok opnieuw uitvoeren telkens wanneer uw sessie in het notitieblok wordt gesloten.
Als u de effectiviteit van Copilot wilt maximaliseren, laadt u een tabel of gegevensset als een dataframe in uw notebook. Op deze manier kan de AI toegang krijgen tot de gegevens en de structuur en inhoud ervan begrijpen. Begin vervolgens te chatten met de AI. Selecteer het chatpictogram op de werkbalk van het notitieblok en typ uw vraag of aanvraag in het chatvenster. U kunt bijvoorbeeld het volgende vragen:
- Wat is de gemiddelde leeftijd van klanten in deze gegevensset?
- "Toon een staafdiagram van verkoop per regio"
En nog veel meer. Copilot reageert met het antwoord of de code, die u kunt kopiëren en plakken in uw notitieblok. Copilot voor Data Science en Data Engineering is een handige, interactieve manier om uw gegevens te verkennen en te analyseren.
Terwijl u Copilotgebruikt, kunt u ook de magische commando's in een notebookcel aanroepen om uitvoer rechtstreeks in de notebook te verkrijgen. Voor antwoorden in natuurlijke taal kunt u bijvoorbeeld vragen stellen met behulp van de opdracht '%%chat', zoals:
%%chat
What are some machine learning models that may fit this dataset?
of
%%code
Can you generate code for a logistic regression that fits this data?
Copilot voor Data Science en Data Engineering heeft ook schema- en metagegevenskennis van tabellen in lakehouse. Copilot kan relevante informatie verstrekken in de context van uw gegevens in een gekoppeld lakehouse. U kunt bijvoorbeeld het volgende vragen:
- Hoeveel tafels zijn er in het lakehouse?
- "Wat zijn de kolommen van de tabelklanten?"
Copilot reageert met de relevante informatie wanneer u het lakehouse aan de notebook hebt toegevoegd. Copilot heeft ook inzicht in de namen van bestanden die zijn toegevoegd aan elk lakehouse dat aan het notitieblok is gekoppeld. U kunt deze bestanden op naam in uw chat raadplegen. Als u bijvoorbeeld een bestand hebt met de naam sales.csv in uw lakehouse, kunt u vragen om een dataframe te maken van sales.csv. Copilot de code genereert en deze weergeeft in het chatvenster. Met Copilot voor notebooks kunt u eenvoudig gegevens uit verschillende bronnen openen en er query's op uitvoeren. U hebt niet de exacte opdrachtsyntaxis nodig om dit te doen.
Tips
- Verwijder uw chatgesprek in het chatvenster Copilot met de bezem bovenin het chatvenster. Copilot behoudt tijdens de sessie kennis van invoer en uitvoer, maar dit helpt als u de huidige inhoud als afleidend ervaart.
- Gebruik de magics-bibliotheek voor chat om instellingen over Copilotte configureren, inclusief privacyinstellingen. De standaardmodus voor delen is ontworpen om de contexten waar Copilot toegang toe heeft te maximaliseren, zodat het beperken van de informatie die aan copilot wordt verstrekt, rechtstreeks en aanzienlijk invloed kan hebben op de relevantie van de antwoorden.
- Wanneer Copilot voor het eerst wordt gestart, biedt het een set nuttige aanwijzingen waarmee u aan de slag kunt gaan. Ze kunnen u helpen uw gesprek te starten met Copilot. Als u later naar prompts wilt verwijzen, kunt u de sparkle-knop onder aan het chatvenster gebruiken.
- U kunt de zijbalk van de copilot-chat 'slepen' om het chatvenster uit te vouwen, om code duidelijker weer te geven of voor leesbaarheid van de uitvoer op uw scherm.
Beperkingen
Copilot-functies in de Data Science-omgeving zijn momenteel beperkt tot notebooks. Deze functies omvatten het Copilot chatvenster, IPython magic-opdrachten die kunnen worden gebruikt in een codecel en automatische codesuggesties terwijl u een codecel typt. Copilot kan ook semantische Power BI-modellen lezen met behulp van de integratie van semantische koppeling.
Copilot heeft twee belangrijke toepassingen:
- U kunt Copilot vragen om gegevens in uw notebook te onderzoeken en te analyseren (bijvoorbeeld door eerst een DataFrame te laden en vervolgens Copilot te vragen over gegevens in het DataFrame).
- U kunt Copilot vragen om een reeks suggesties te genereren over uw gegevensanalyseproces, zoals welke voorspellende modellen relevant kunnen zijn, code voor het uitvoeren van verschillende typen gegevensanalyse en documentatie voor een voltooid notitieblok.
Houd er rekening mee dat het genereren van code met snel bewegende of onlangs uitgebrachte bibliotheken onnauwkeurigheden of fabricaties kan bevatten.