Udostępnij za pośrednictwem


Omówienie Copilot na potrzeby nauki o danych i inżynierii danych (wersja zapoznawcza)

Ważny

Ta funkcja jest dostępna w wersji zapoznawczej.

Copilot dla nauki o danych i inżynierii danych to asystent sztucznej inteligencji, który ułatwia analizowanie i wizualizowanie danych. Współpracuje z tabelami i plikami Lakehouse, zestawami danych Power BI oraz ramkami danych pandas/spark/fabric, dostarczając odpowiedzi i przykłady kodu bezpośrednio w notesie. Najskuteczniejszym sposobem korzystania z Copilot jest dodanie danych jako ramki danych. Pytania można zadawać na panelu czatu, a sztuczna inteligencja udostępnia odpowiedzi lub kod do skopiowania do notesu. Rozumie on schemat i metadane danych, a jeśli dane są ładowane do ramki danych, ma również świadomość danych wewnątrz ramki danych. Możesz poprosić Copilot o udostępnienie szczegółowych informacji na temat danych, utworzenie kodu dla wizualizacji, podanie kodu na potrzeby przekształceń danych, a także rozpoznawanie nazw plików dla łatwego odwołania się do nich. Copilot usprawnia analizę danych, eliminując złożone kodowanie.

Notatka

Wprowadzenie do Copilot na potrzeby nauki o danych i inżynierii danych na potrzeby nauki o danych w sieci szkieletowej

Dzięki Copilot do nauki o danych i inżynierii danych możesz porozmawiać z asystentem sztucznej inteligencji, który może pomóc w obsłudze zadań analizy danych i wizualizacji. Możesz zadać Copilot pytania dotyczące tabel lakehouse, zestawów danych usługi Power BI lub ramek danych Pandas/Spark w notesach. Copilot odpowiedzi w języku naturalnym lub fragmentach kodu. Copilot może również generować kod specyficzny dla danych, w zależności od zadania. Na przykład Copilot dla nauki o danych i inżynierii danych mogą generować kod dla:

  • Tworzenie wykresu
  • Filtrowanie danych
  • Stosowanie przekształceń
  • Modele uczenia maszynowego

Najpierw wybierz ikonę Copilot na wstążce notesów. Otwarcie panelu czatu Copilot spowoduje pojawienie się nowej komórki w górnej części notesu. Ta komórka musi być uruchamiana za każdym razem, gdy sesja Spark zostanie załadowana w notesie Fabric. W przeciwnym razie doświadczenie Copilot nie będzie działać prawidłowo. Jesteśmy w trakcie oceny innych mechanizmów obsługi tej wymaganej inicjalizacji w przyszłych wersjach.

Zrzut ekranu przedstawiający wstążkę Copilot.

Uruchom komórkę w górnej części notesu za pomocą następującego kodu:

#Run this cell to install the required packages for Copilot
%pip install https://aka.ms/chat-magics-0.0.0-py3-none-any.whl
%load_ext chat_magics

Po pomyślnym wykonaniu komórki można użyć Copilot. Należy ponownie uruchomić komórkę w górnej części notesu za każdym razem, gdy sesja w notesie zostanie zamknięta.

Zrzut ekranu przedstawiający pomyślne wykonanie komórki.

Aby zmaksymalizować skuteczność Copilot, załaduj tabelę lub zestaw danych jako ramkę danych w notesie. Dzięki temu sztuczna inteligencja może uzyskiwać dostęp do danych i rozumieć jego strukturę i zawartość. Następnie zacznij rozmawiać ze sztuczną inteligencją. Wybierz ikonę czatu na pasku narzędzi notesu i wpisz swoje pytanie lub żądanie w panelu czatu. Możesz na przykład zapytać:

  • "Jaki jest średni wiek klientów w tym zestawie danych?"
  • "Pokaż mi wykres słupkowy sprzedaży według regionu"

I więcej. Copilot odpowiada odpowiedzią lub kodem, który można skopiować i wkleić do notesu. Copilot na potrzeby nauki o danych i inżynierii danych to wygodny, interaktywny sposób eksplorowania i analizowania danych.

Korzystając z Copilot, możesz także wywołać polecenia magiczne wewnątrz komórki notatnika, aby uzyskać dane wyjściowe bezpośrednio w notatniku. Na przykład w przypadku odpowiedzi na odpowiedzi w języku naturalnym można zadawać pytania przy użyciu polecenia "%%chat", takiego jak:

%%chat
What are some machine learning models that may fit this dataset?

Zrzut ekranu przedstawiający generowanie kodu.

lub

%%code
Can you generate code for a logistic regression that fits this data?

Zrzut ekranu przedstawiający generowanie kodu regresji logistycznej.

Copilot do nauki o danych i inżynierii danych ma również świadomość schematów i metadanych tabel w lakehouse. Copilot może dostarczyć odpowiednie informacje w kontekście danych w dołączonym jeziorze. Możesz na przykład zapytać:

  • "Ile stołów znajduje się w domku nad jeziorem?"
  • "Jakie są kolumny klientów tabeli?"

Copilot odpowiada odpowiednim informacjom, jeśli do notesu dodano usługę Lakehouse. Copilot ma również świadomość nazw plików dodanych do dowolnego lakehouse połączonego z notesem. Możesz odwoływać się do tych plików według nazwy w czacie. Jeśli na przykład masz plik o nazwie sales.csv w usłudze Lakehouse, możesz zapytać "Tworzenie ramki danych z sales.csv". Copilot generuje kod i wyświetla go w panelu czatu. Dzięki Copilot dla notesów można łatwo uzyskiwać dostęp do danych i wykonywać względem nich zapytania z różnych źródeł. Nie potrzebujesz dokładnej składni polecenia, aby to zrobić.

Porady

  • Aby „wyczyścić” konwersację w panelu czatu Copilot, użyj miotły znajdującej się na górze panelu czatu. Copilot zachowuje wiedzę na temat wszelkich danych wejściowych lub wyjściowych podczas sesji, ale może pomóc, jeśli obecna treść Cię rozprasza.
  • Użyj biblioteki magii czatów, aby skonfigurować ustawienia dotyczące Copilot, w tym ustawień prywatności. Domyślny tryb udostępniania jest zaprojektowany tak, aby zmaksymalizować dostęp Copilot do kontekstu, dlatego ograniczenie informacji udostępnianych copilot może bezpośrednio i znacząco wpłynąć na trafność jego odpowiedzi.
  • Po pierwszym uruchomieniu Copilot oferuje zestaw przydatnych wskazówek, które mogą pomóc w rozpoczęciu pracy. Mogą one pomóc w rozpoczęciu rozmowy z Copilot. Aby odwołać się do monitów później, możesz użyć przycisku sparkle w dolnej części panelu czatu.
  • Możesz "przeciągnąć" pasek boczny czatu copilot, aby rozwinąć panel czatu i wyświetlić kod czytelniej lub poprawić czytelność wyników na ekranie.

Ograniczenia

Copilot funkcje środowiska nauki o danych są obecnie ograniczone do notesów. Te cechy obejmują okienko czatu Copilot, polecenia magiczne IPython, które mogą być używane w komórce kodu, oraz automatyczne sugestie kodu podczas wpisywania w komórce kodu. Copilot można również odczytywać semantyczne modele usługi Power BI przy użyciu integracji linku semantycznego.

Copilot ma dwa kluczowe zastosowania:

  • Możesz poprosić Copilot o zbadanie i przeanalizowanie danych w notesie (na przykład najpierw ładując ramkę danych, a następnie prosząc Copilot o dane wewnątrz ramki danych).
  • Dwa, możesz poprosić Copilot o wygenerowanie szeregu propozycji dotyczących procesu analizy danych, takich jak, które modele predykcyjne mogą być istotne, kod do wykonywania różnych typów analizy danych oraz dokumentacji dla ukończonego notatnika.

Należy pamiętać, że generowanie kodu z dynamicznymi lub niedawno wydanymi bibliotekami może obejmować niedokładności lub fabrykacje.