Sdílet prostřednictvím


Přehled Copilot pro datovou vědu a datové inženýrství (náhled)

Důležitý

Tato funkce je ve verzi Preview.

Copilot pro datové vědy a datové inženýrství je asistent umělé inteligence, který pomáhá analyzovat a vizualizovat data. Funguje s tabulkami a soubory Lakehouse, datovými rámci pandas/spark/fabric a datovými sadami Power BI a poskytuje odpovědi a fragmenty kódu přímo v poznámkovém bloku. Připojení k OneLake a výchozím připojeným Lakehouses umožňují systému Copilot poskytovat kontextové návrhy kódu a přizpůsobené odpovědi v přirozeném jazyce podle vašich dat.

Copilot vám může pomoci lépe porozumět vašim datům a může nabídnout návrhy pro zahájení poznámkového bloku, včetně kódu vygenerovaného pro počáteční buňky. Jakmile identifikuje a přidá zdroje dat prostřednictvím Průzkumníka objektů Fabric, Copilot Chat nabízí návrhy na typy modelů k implementaci. Tato doporučení můžete zkopírovat přímo do poznámkového bloku a začít s vývojem. Pokud si nejste jisti dalšími kroky, můžete vyvolat Copilot uvnitř buňky pro nápovědy ohledně směru modelu.

Když narazíte na chyby, Copilot poskytuje navrhované opravy. Pokud potřebujete další pomoc, můžete chatovat s Copilot, abyste získali více možností a vyhnout se neustálému online vyhledávání.

Výhodná je také automatická dokumentace s jednoduchou funkcí Přidat komentáře, která shrnuje změny kódu a dat. Díky tomu jsou buňky pro vás i ostatní srozumitelné. V průběhu pracovního postupu se můžete poradit s Copilot v konkrétních bodech, získat podporu v reálném čase a pokyny k urychlení procesu vývoje.

Poznámka

Ve Sparku 3.4 a novějších verzích v Microsoft Fabric není nutné používat žádnou instalační buňku pro použití Copilot v poznámkovém bloku. Předchozí verze, které vyžadovaly instalační buňku (Spark 3.3 a starší), se už nepodporují.

Poznámka

Úvod do Copilot pro datovou vědu a datové inženýrství v rámci Fabric Data Science

S Copilot pro datové vědy a datové inženýrství můžete chatovat s asistentem AI, který vám pomůže zvládnout úlohy analýzy a vizualizace dat. Můžete klást Copilot otázky týkající se tabulek lakehouse, datových sad Power BI nebo datových rámců Pandas/Spark v poznámkových blocích. Copilot odpovídá v přirozeném jazyce nebo fragmentech kódu. Copilot může také vygenerovat kód specifický pro data v závislosti na úkolu. Například Copilot pro datové vědy a datové inženýrství může vygenerovat kód pro:

  • Vytvoření grafu
  • Filtrování dat
  • Použití transformací
  • Modely strojového učení

Nejprve na liště poznámkových bloků vyberte ikonu Copilot. Otevře se panel Copilot chatu a v horní části poznámkového bloku se zobrazí nová buňka. Můžete také vybrat copilot v horní části buňky ve svých Fabric Notebooks.

Pokud chcete maximalizovat efektivitu Copilot, načtěte do poznámkového bloku tabulku nebo datovou sadu jako datový rámec. AI pak může přistupovat k datům a porozumět jeho struktuře a obsahu. Pak začněte chatovat s AI. Na panelu nástrojů poznámkového bloku vyberte ikonu chatu a na panelu chatu zadejte svůj dotaz nebo žádost. Můžete se například zeptat:

  • "Jaký je průměrný věk zákazníků v této datové sadě?"
  • "Show me a bar chart of sales by region" (Zobrazit pruhový graf prodeje podle oblastí)
  • atd.

Copilot odpoví odpovědí nebo kódem, který můžete zkopírovat a vložit do poznámkového bloku. Copilot pro datové vědy a datové inženýrství je pohodlný interaktivní způsob, jak zkoumat a analyzovat data.

Použití panelu chatu Copilot k interakci s daty

Pokud chcete chatovat s daty a získat přehledy, vyberte ikonu chatu na panelu nástrojů poznámkového bloku a otevřete panel chatu Copilot. Na panelu chatu napište své otázky nebo žádosti. Můžete se například zeptat:

  • "Jaký je průměrný věk zákazníků v této datové sadě?"
  • "Show me a bar chart of sales by region" (Zobrazit pruhový graf prodeje podle oblastí)
  • atd.

Copilot odpoví odpovědí nebo kódem, který můžete zkopírovat a vložit do poznámkového bloku. Kromě toho Copilot může navrhnout, co dělat dál s vašimi daty. Copilot nabízí návrhy a generuje relevantní fragmenty kódu, které vám pomůžou pokračovat v analýze dat a úlohách vizualizace.

Pokud chcete pracovat s panelem chatu Copilot v poznámkových blocích Microsoft Fabric, postupujte takto:

  1. Otevřete panel chatu Copilot: Pokud chcete otevřít panel chatu Copilot, vyberte ikonu chatu na panelu nástrojů poznámkového bloku.

  2. Pokládat otázky nebo vznést žádosti: Napište své otázky nebo žádosti do panelu chatu. Tady je několik konkrétních příkladů pro datové vědy a datové inženýrství:

  • zkoumání dat:

    • "Jaká je distribuce sloupce age v této datové sadě?"
    • "Ukažte mi histogram sloupce "příjem".
  • čištění dat:

    • Jak můžu zpracovat chybějící hodnoty v této datové sadě?
    • "Vygenerování kódu pro odebrání duplicit z tohoto datového rámce."
  • Transformace dat:

    • Jak můžu normalizovat sloupec 'prodeje'?
    • Vytvořte nový sloupec „zisk“ odečtením „náklady“ od „výnosy“.
  • vizualizace:

    • Vytvořte bodový graf "výška" vs "váha".
    • Vygenerujte krabicový graf pro sloupec "plat".
  • Machine Learning:

    • Trénujte klasifikátor rozhodovacího stromu na této datové sadě.
    • "Vygenerování kódu pro algoritmus clusteringu k-means se 3 clustery."
  • vyhodnocení modelu:

    • "Jak vyhodnotím přesnost logistického regresního modelu?"
    • "Vygenerujte konfuzní matici pro předpovědi."
  1. Přijměte odpovědi: Copilot odpovídá vysvětlením přirozeného jazyka nebo úryvky kódu. Kód můžete zkopírovat a vložit do poznámkového bloku a spustit ho.

  2. získat návrhy: Pokud nevíte, jak pokračovat, požádejte o návrhy Copilot:

  • "Co mám dělat dál s touto datovou sadou?"
  • "Jaké jsou některé doporučené techniky přípravy funkcí pro tato data?"
  1. Použít vygenerovaný kód: Zkopírujte vygenerované fragmenty kódu z panelu chatu a vložte je do buněk poznámkového bloku, abyste je mohli spustit.

Pomocí těchto kroků a uvedených příkladů můžete efektivně pracovat s panelem chatu Copilot a vylepšit tak pracovní postupy datových věd a přípravy dat v poznámkových blocích Microsoft Fabric.

O použití panelu Copilot In-Cell a rychlých akcí

S Copilot můžete pracovat přímo v buňkách poznámkového bloku a generovat kód a provádět rychlé akce s buňkami kódu. Tady je postup použití panelu Copilot v buňce:

  1. vygenerovat kód: Pokud chcete vygenerovat kód pro konkrétní úlohy, můžete použít Copilot vnitřní panel buňky. Požadavek můžete například zadat na textovém panelu nad buňkou kódu:
Can you generate code for a logistic regression that fits this data?

Copilot poskytuje potřebný fragment kódu přímo v následující buňce.

  1. Oprava kódu: Můžete požádat Copilot o opravu chyb v kódu. Napište svůj požadavek do textového panelu nad buňkou kódu a Copilot navrhuje opravy.

  2. Přidat komentáře: Pokud chcete kód automaticky zdokumentovat, použijte funkci Přidat komentáře. Copilot vygeneruje komentáře, které shrnují změny kódu a dat, aby byl poznámkový blok čitelnější.

  3. optimalizovat kód: Pokud chcete zlepšit výkon, můžete požádat Copilot o optimalizaci kódu. Copilot nabízí návrhy pro zvýšení efektivity kódu.

  4. Vysvětlit kód: Pokud potřebujete objasnit část kódu, požádejte Copilot o vysvětlení. Copilot poskytuje podrobné vysvětlení funkcí kódu.

Postup použití rychlých akcí

  1. Vyvolat Copilotv buňce: Vyberte ikonu Copilot na panelu nástrojů poznámkového bloku a začněte interakci s Copilot.

  2. Zadejte svůj požadavek: Zadejte požadavek nebo otázku do textového panelu nad buňkou kódu. Například:

Explain the following code snippet.
  1. Přijmout návrhy: Copilot odpoví relevantním kódem, opravami, komentáři, optimalizacemi nebo vysvětleními.

  2. Použití návrhů: Zkopírujte vygenerovaný kód nebo návrhy z Copilot a vložte je do buněk poznámkového bloku, abyste je mohli spustit.

Pomocí panelu Copilot v buňce můžete vygenerovat kód, opravit chyby, přidat komentáře, optimalizovat výkon a lépe porozumět kódu v poznámkových blocích Microsoft Fabric.

Snímek obrazovky znázorňující generování kódu logistické regrese

Copilot pro datovou vědu a datové inženýrství má také povědomí o schématu a metadatech tabulek lakehouse. Copilot může poskytnout relevantní informace v kontextu vašich dat hostovaných v připojeném jezeře. Můžete se například zeptat:

  • Kolik stolů je v chatě u jezera?
  • Jaké jsou sloupce tabulky zákazníků?

Copilot odpoví relevantními informacemi, pokud jste do poznámkového bloku přidali jezero. Copilot má také povědomí o názvech souborů přidaných do libovolného lakehouse připojeného k poznámkovému bloku. Tyto soubory můžete v chatu odkazovat pomocí názvu. Pokud máte například ve svém lakehousu soubor s názvem sales.csv, můžete požádat Copilot o „Vytvoření datového rámce z sales.csv“. Copilot vygeneruje kód a zobrazí ho na panelu chatu. S Copilot pro poznámkové bloky můžete snadno přistupovat k datům z různých zdrojů a dotazovat se na je. K tomu nepotřebujete přesnou syntaxi příkazů.

Tipy

  • Vyčistěte konverzaci v panelu chatu Copilot pomocí symbolu koštěte umístěného nahoře v panelu chatu. Copilot uchová si znalosti o všech vstupech a výstupech během relace, ale to vám pomůže, pokud zjistíte, že aktuální obsah je rušivý.
  • Pomocí knihovny Chat Magics můžete nakonfigurovat nastavení týkající se Copilot, včetně nastavení ochrany osobních údajů. Výchozí režim sdílení maximalizuje přístup k sdílenému kontextu, ke kterému má Copilot přístup. Proto omezení informací poskytnutých kopilotu může přímo a významně ovlivnit relevantnost odpovědí.
  • Při prvním spuštění Copilot nabízí sadu užitečných výzev, které vám pomůžou začít. Můžou vám pomoct zahájit konverzaci s Copilot. Chcete-li se později vrátit k výzvám, můžete použít tlačítko s ikonou jiskry v dolní části chatovacího panelu.
  • Boční panel chatu copilot můžete "přetáhnout" a rozbalit panel chatu, abyste mohli zobrazit kód srozumitelněji nebo zlepšit čitelnost výstupů na obrazovce.

Omezení

Copilot funkce v prostředí datové vědy jsou aktuálně omezeny pouze na poznámkové bloky. Mezi tyto funkce patří podokno chatu Copilot, příkazy magic IPythonu, které se dají použít v buňce kódu, a automatické návrhy kódu při psaní do buňky kódu. Copilot dokáže také pomocí integrace přes sémantický odkaz načíst sémantické modely Power BI.

Copilot má dva zamýšlená použití:

  • Můžete požádat Copilot, aby prozkoumali a analyzovali data v poznámkovém bloku (například tak, že nejprve načtete datový rámec a potom požádáte Copilot o datech uvnitř datového rámce).
  • Můžete požádat Copilot, aby vygeneroval řadu návrhů týkajících se procesu analýzy dat – například jaké prediktivní modely můžou být relevantní, kód pro provádění různých typů analýzy dat a dokumentaci pro dokončený poznámkový blok.

Generování kódu s rychle se měnícími nebo nedávno vydanými knihovnami může zahrnovat nepřesnosti nebo výmysly.

Odstranění a export dat

Copilot v poznámkových blocích poskytuje uživatelům dva základní příkazy pro správu historie chatu v buňkách poznámkového bloku: show_chat_history a clear_chat_history. Příkaz show_chat_history exportuje úplnou historii chatu pro účely dodržování předpisů, aby se zajistilo, že jsou všechny potřebné interakce zdokumentované a přístupné ke kontrole. Například spuštění show_chat_history vygeneruje komplexní protokol historie chatu, který se pak dá zkontrolovat nebo archivovat kvůli dodržování předpisů.

Příkaz clear_chat_history odebere všechny předchozí konverzace z poznámkového bloku, aby uživatel mohl začít znovu. Tento příkaz vymaže staré interakce, aby se spustilo nové vlákno konverzace. Spuštěním clear_chat_history například odstraníte všechny předchozí historie chatu, abyste poznámkový blok nechali bez jakýchkoli předchozích konverzací. Tyto funkce vylepšují celkovou funkčnost a uživatelskou zkušenost Copilot v poznámkových blocích.