Condividi tramite


Panoramica di Copilot per Data Science e Ingegneria dei Dati (anteprima)

Importante

Questa funzionalità è disponibile in anteprima .

Copilot per data science e ingegneria dei dati è un assistente di intelligenza artificiale che consente di analizzare e visualizzare i dati. Funziona con tabelle e file Lakehouse, set di dati di Power BI e dataframe pandas/spark/fabric, fornendo risposte e frammenti di codice direttamente nel notebook. Il modo più efficace per usare Copilot consiste nell'aggiungere i tuoi dati come un dataframe. È possibile porre domande nel pannello della chat e l'intelligenza artificiale fornisce risposte o codice da copiare nel notebook. Comprende lo schema e i metadati dei dati e, se i dati vengono caricati in un data frame, possiede anche la consapevolezza dei dati contenuti al suo interno. È possibile chiedere Copilot di fornire informazioni dettagliate sui dati, creare codice per le visualizzazioni o fornire codice per le trasformazioni dei dati e riconosce i nomi di file per un riferimento semplice. Copilot semplifica l'analisi dei dati eliminando la codifica complessa.

Nota

Introduzione a Copilot per la data science e l'ingegneria dei dati per Fabric Data Science

Con Copilot per data science e ingegneria dei dati, è possibile chattare con un assistente di intelligenza artificiale che consente di gestire le attività di analisi e visualizzazione dei dati. È possibile porre domande Copilot sulle tabelle lakehouse, sui set di dati di Power BI o sui dataframe Pandas/Spark all'interno dei notebook. Copilot risposte in linguaggio naturale o frammenti di codice. Copilot può anche generare codice specifico per i dati, a seconda del compito. Ad esempio, Copilot per data science e ingegneria dei dati può generare codice per:

  • Creazione di grafici
  • Filtro dei dati
  • Applicazione di trasformazioni
  • Modelli di Machine Learning

Selezionare prima di tutto l'icona Copilot nella barra multifunzione dei notebook. Viene aperto il pannello Copilot chat e viene visualizzata una nuova cella nella parte superiore del notebook. Questa cella deve essere eseguita ogni volta che una sessione Spark viene caricata in un notebook Fabric. In caso contrario, l'esperienza di Copilot non funzionerà correttamente. È in corso la valutazione di altri meccanismi per la gestione di questa inizializzazione necessaria nelle versioni future.

Screenshot che mostra il pulsante Copilot sulla barra multifunzione.

Esegui la cella in cima al notebook con questo codice:

#Run this cell to install the required packages for Copilot
%load_ext dscopilot_installer
%activate_dscopilot

Dopo l'esecuzione senza errori della cella, è possibile usare Copilot. È necessario rieseguire la cella nella parte superiore del notebook ogni volta che la sessione nel notebook si chiude.

Screenshot che mostra l'esecuzione corretta della cella.

Per ottimizzare l'efficacia di Copilot, carica una tabella o un set di dati come Dataframe nel notebook. In questo modo, l'intelligenza artificiale può accedere ai dati e comprenderne la struttura e il contenuto. Iniziare quindi a chattare con l'intelligenza artificiale. Selezionare l'icona della chat nella barra degli strumenti del notebook e digitare la domanda o la richiesta nel pannello della chat. Ad esempio, è possibile chiedere:

  • "Qual è l'età media dei clienti in questo set di dati?"
  • "Mostra un grafico a barre delle vendite per area"

E altro ancora. Copilot risponde con la risposta o il codice, che puoi copiare e incollare nel tuo notebook. Copilot per data science e data engineering è un modo pratico e interattivo per esplorare e analizzare i dati.

Quando si utilizza Copilot, è anche possibile utilizzare i comandi magici all'interno di una cella del notebook per ottenere l'output direttamente nel notebook. Ad esempio, per le risposte in linguaggio naturale alle risposte, è possibile porre domande usando il comando "%%chat" , ad esempio:

%%chat
What are some machine learning models that may fit this dataset?

Screenshot che mostra la generazione del codice.

o

%%code
Can you generate code for a logistic regression that fits this data?

Screenshot che mostra la generazione di codice di regressione logistica.

Copilot per la scienza dei dati e l'ingegneria dei dati è anche consapevole dello schema e dei metadati delle tabelle nel lakehouse. Copilot può fornire informazioni pertinenti nel contesto dei dati in un lakehouse collegato. Ad esempio, è possibile chiedere:

  • "Quanti tavoli si trovano nella casa del lago?"
  • "Quali sono le colonne dei clienti della tabella?"

Copilot risponde con le informazioni pertinenti se hai aggiunto il lakehouse al notebook. Copilot ha anche la conoscenza dei nomi dei file aggiunti a qualsiasi lakehouse collegati al notebook. È possibile fare riferimento a tali file in base al nome nella chat. Ad esempio, se si dispone di un file denominato sales.csv nel lakehouse, è possibile chiedere "Creare un dataframe da sales.csv". Copilot genera il codice e lo visualizza nel pannello della chat. Utilizzando Copilot per i notebook, è possibile accedere facilmente ed eseguire query sui dati da fonti diverse. Per eseguire questa operazione non è necessaria la sintassi esatta dei comandi.

Suggerimenti

  • "Cancella" la conversazione nel pannello di chat Copilot con la scopa situata nella parte superiore del pannello della chat. Copilot mantiene la conoscenza di eventuali input o output durante la sessione, ma questo aiuta se trovi il contenuto attuale distraente.
  • Usare la libreria chat magics per configurare le impostazioni relative a Copilot, incluse le impostazioni di privacy. La modalità di condivisione predefinita è progettata per massimizzare la condivisione del contesto a cui Copilot ha accesso, quindi limitare le informazioni fornite a copilot può influire direttamente e significativamente sulla pertinenza delle sue risposte.
  • Quando Copilot viene avviato per la prima volta, offre un set di suggerimenti utili per aiutarti a iniziare. Possono aiutare ad avviare la conversazione con Copilot. Per fare riferimento alle richieste in un secondo momento, è possibile usare il pulsante sparkle nella parte inferiore del pannello della chat.
  • È possibile "trascinare" la barra laterale della chat copilot per espandere il pannello della chat, per visualizzare il codice in modo più chiaro o per la leggibilità degli output sullo schermo.

Limitazioni

Copilot funzionalità dell'esperienza di data science sono attualmente incluse in notebook. Queste funzionalità includono il riquadro di chat Copilot, i comandi magici IPython che possono essere usati all'interno di una cella di codice e i suggerimenti automatici per il codice durante la digitazione in una cella di codice. Copilot può anche leggere i modelli semantici di Power BI tramite un'integrazione di collegamenti semantici.

Copilot prevede due usi chiave:

  • È possibile chiedere Copilot di esaminare e analizzare i dati nel notebook, ad esempio caricando prima un dataframe e quindi chiedendo Copilot sui dati all'interno del dataframe.
  • Due, è possibile chiedere Copilot di generare una serie di suggerimenti sul processo di analisi dei dati, ad esempio quali modelli predittivi potrebbero essere rilevanti, codice per eseguire diversi tipi di analisi dei dati e documentazione per un notebook completato.

Tenere presente che la generazione di codice con librerie in rapida evoluzione o rilasciate di recente può includere imprecisioni o fabricazioni.