Поделиться через


Обзор Copilot для обработки и анализа данных (предварительная версия)

Важный

Эта функция доступна в предварительной версии.

Copilot для обработки данных и анализа данных — это помощник по искусственному интеллекту, который помогает анализировать и визуализировать данные. Он работает с таблицами и файлами Lakehouse, наборами данных Power BI и датафреймами pandas/spark/fabric, предоставляя ответы и фрагменты кода непосредственно в записной книжке. Наиболее эффективным способом использования Copilot является добавление данных в качестве DataFrame. Вы можете задать свои вопросы на панели чата, а ИИ предоставляет ответы или код для копирования в записную книжку. Он понимает схему и метаданные ваших данных, а если данные загружаются в фрейм данных, он также имеет представление о содержании внутри этого фрейма. Вы можете попросить Copilot предоставить аналитические сведения о данных, создать код для визуализаций или предоставить код для преобразований данных, и он распознает имена файлов для простой ссылки. Copilot упрощает анализ данных путем устранения сложного кода.

Заметка

Общие сведения о Copilot для науки о данных и инженерии данных на платформе Fabric Data Science

С помощью Copilot для науки о данных и инженерии данных вы можете общаться с ассистентом на базе искусственного интеллекта, который поможет вам справиться с задачами анализа данных и визуализации. Вы можете задать Copilot вопросы о таблицах lakehouse, наборах данных Power BI или пандах или кадрах данных Spark в записных книжках. Copilot ответы на естественном языке или фрагменты кода. Copilot также может создавать код, специфичный для данных, в соответствии с задачей. Например, Copilot для Data Science и Data Engineering может создавать код для:

  • Создание диаграммы
  • Фильтрация данных
  • Применение преобразований
  • Модели машинного обучения

Сначала выберите значок Copilot на ленте записных книжек. Откроется панель чата Copilot, а в верхней части записной книжки появится новая ячейка. Эта ячейка должна выполняться каждый раз, когда сеанс Spark запускается в блокноте Fabric. В противном случае интерфейс Copilot не будет работать должным образом. Мы в процессе оценки других механизмов для обработки этой требуемой инициализации в будущих выпусках.

снимок экрана с лентой Copilot.

Запустите ячейку в верхней части записной книжки, используя следующий код:

#Run this cell to install the required packages for Copilot
%pip install https://aka.ms/chat-magics-0.0.0-py3-none-any.whl
%load_ext chat_magics

После успешного выполнения ячейки можно использовать Copilot. Необходимо повторно запускать ячейку в верхней части записной книжки каждый раз, когда завершается сеанс работы в ней.

снимок экрана успешного выполнения ячейки.

Чтобы максимально повысить эффективность Copilot, загрузите таблицу или набор данных в качестве DataFrame в вашем блокноте. Таким образом, ИИ может получить доступ к данным и понять его структуру и содержимое. Затем начните общаться с ИИ. Выберите значок чата на панели инструментов записной книжки и введите вопрос или запрос на панели чата. Например, можно попросить:

  • "Какой средний возраст клиентов в этом наборе данных?"
  • "Показать линейчатую диаграмму продаж по регионам"

И многое другое. Copilot отвечает с помощью ответа или кода, который можно скопировать и вставить в записную книжку. Copilot для обработки и анализа данных — это удобный интерактивный способ изучения и анализа данных.

При использовании Copilotможно также вызывать волшебные команды внутри ячейки записной книжки, чтобы получить выходные данные непосредственно в записной книжке. Например, для ответов на естественный язык можно задать вопросы с помощью команды "%%chat", например:

%%chat
What are some machine learning models that may fit this dataset?

снимок экрана: создание кода.

или

%%code
Can you generate code for a logistic regression that fits this data?

снимок экрана: создание кода логистической регрессии.

Copilot для науки о данных и инженерии данных также имеет понимание схем и метаданных таблиц в lakehouse. Copilot могут предоставлять соответствующие сведения в контексте данных в присоединенном озерном доме. Например, можно попросить:

  • "Сколько столов в лейкхаусе?"
  • Каковы столбцы таблицы клиентов?

Copilot предоставляет соответствующую информацию, если вы добавили lakehouse в записную книжку. Copilot также имеет представление о именах файлов, добавленных в любой lakehouse, присоединенной к записной книжке. Вы можете ссылаться на эти файлы по имени в чате. Например, если у вас есть файл с именем sales.csv в lakehouse, можно попросить "Создать кадр данных из sales.csv". Copilot создает код и отображает его на панели чата. С помощью Copilot тетрадей вы можете легко получать доступ к данным из разных источников и выполнять запросы к ним. Для этого не требуется точный синтаксис команды.

Советы

  • Очистите беседу на панели чата Copilot с помощью иконки метлы, расположенной в верхней части панели чата. Copilot сохраняет знания о любых входных или выходных данных во время сеанса, но это может помочь, если текущее содержимое вас отвлекает.
  • Используйте библиотеку магии чата для настройки параметров Copilot, включая параметры конфиденциальности. Режим общего доступа по умолчанию предназначен для увеличения доступа Copilot к контексту, поэтому ограничение информации, предоставляемой copilot, может напрямую и значительно повлиять на релевантность его ответов.
  • При первом запуске Copilot он предлагает набор полезных подсказок, которые помогут вам приступить к работе. Они могут помочь быстро начать беседу с Copilot. Чтобы ссылаться на запросы позже, можно использовать кнопку «Блестка» в нижней части панели чата.
  • Вы можете перетащить боковую панель чата copilot, чтобы развернуть панель чата, чтобы просмотреть код более четко или для удобочитаемости выходных данных на экране.

Ограничения

Copilot функции в интерфейсе обработки и анализа данных в настоящее время относятся к записным книжкам. К этим функциям относятся панель чата Copilot, магические команды IPython, которые можно использовать в ячейке кода, а также автоматические предложения кода в процессе ввода в ячейку кода. Copilot также может считывать семантические модели данных Power BI через интеграцию семантической связи.

У Copilot есть два основных предполагаемых применения.

  • Во-первых, вы можете попросить Copilot проверить и проанализировать данные в вашем ноутбуке (например, сначала загрузив DataFrame, а затем запросив Copilot о данных внутри DataFrame).
  • Во-вторых, вы можете запросить у Copilot генерацию ряда предложений о вашем процессе анализа данных, например, о том, какие прогнозные модели могут быть релевантными, код для выполнения различных типов анализа данных и документацию для уже завершенного блокнота.

Помните, что создание кода с быстро развивающимися или недавно выпущенными библиотеками может включать неточности или вымыслы.