Compartilhar via


Visão geral do Copilot para Ciência de Dados e Engenharia de Dados (versão prévia)

Importante

Esse recurso está na versão prévia.

Copilot para Ciência de Dados e Engenharia de Dados é um assistente de IA que ajuda a analisar e visualizar dados. Ele é compatível com tabelas e arquivos do Lakehouse, conjuntos de dados do Power BI e DataFrames pandas/spark/fabric, fornecendo respostas e trechos de código diretamente no notebook. A maneira mais eficaz de usar Copilot é adicionar seus dados como um dataframe. Você pode fazer suas perguntas no painel de chat e a IA fornece respostas ou código para copiar em seu bloco de anotações. Ele entende o esquema e os metadados de seus dados e, se os dados forem carregados em um dataframe, ele também está ciente dos dados dentro do dataframe. Você pode solicitar Copilot fornecer insights sobre dados, criar código para visualizações ou fornecer código para transformações de dados e reconhecer nomes de arquivo para uma referência fácil. Copilot simplifica a análise de dados eliminando a codificação complexa.

Nota

Introdução ao Copilot para Ciência de Dados e Engenharia de Dados para Ciência de Dados do Fabric

Com Copilot para Ciência de Dados e Engenharia de Dados, você pode conversar com um assistente de IA que pode ajudá-lo a lidar com suas tarefas de visualização e análise de dados. Você pode fazer as perguntas ao Copilot sobre tabelas do lakehouse, conjuntos de dados do Power BI ou dataframes do Pandas/Spark dentro de notebooks. O Copilot responde em linguagem natural ou snippets de código. Copilot também pode gerar código específico de dados para você, dependendo da tarefa. Por exemplo, Copilot para Ciência de Dados e Engenharia de Dados pode gerar código para:

  • Criação de gráfico
  • Filtrando dados
  • Aplicando transformações
  • Modelos de machine learning

Primeiro, selecione o ícone Copilot na faixa de opções do notebook. O painel de chat Copilot abre e uma nova célula aparece na parte superior do seu notebook. Essa célula deve ser executada sempre que uma sessão do Spark for carregada em um bloco de anotações do Fabric. Caso contrário, a experiência de Copilot não funcionará corretamente. Estamos no processo de avaliar outros mecanismos para lidar com essa inicialização necessária em versões futuras.

Captura de tela mostrando o botão Copilot na faixa de opções.

Execute a célula na parte superior do notebook, com este código:

#Run this cell to install the required packages for Copilot
%load_ext dscopilot_installer
%activate_dscopilot

Depois que a célula for executada com êxito, você poderá usar o Copilot. Você deve executar novamente a célula na parte superior do notebook sempre que a sessão no notebook for encerrada.

Captura de tela mostrando a execução bem-sucedida da célula.

Para maximizar a eficácia do Copilot, carregue uma tabela ou conjunto de dados como um dataframe no seu notebook. Dessa forma, a IA pode acessar os dados e entender sua estrutura e conteúdo. Em seguida, comece a conversar com a IA. Selecione o ícone de chat na barra de ferramentas do bloco de anotações e digite sua pergunta ou solicitação no painel de chat. Por exemplo, você pode perguntar:

  • "Qual é a idade média dos clientes neste conjunto de dados?"
  • "Mostre-me um gráfico de barras de vendas por região"

E muito mais. Copilot responde com a resposta ou o código, que pode ser copiado e colado no bloco de anotações. Copilot para Ciência de Dados e Engenharia de Dados é uma maneira conveniente e interativa de explorar e analisar seus dados.

Ao usar o Copilot, você também pode invocar os comandos magic dentro de uma célula do notebook para obter a saída diretamente no notebook. Por exemplo, para respostas de linguagem natural às respostas, você pode fazer perguntas usando o comando "%%chat", como:

%%chat
What are some machine learning models that may fit this dataset?

Captura de tela mostrando a geração de código.

ou

%%code
Can you generate code for a logistic regression that fits this data?

Captura de tela mostrando a geração de código de regressão logística.

O Copilot para Ciência de Dados e Engenharia de Dados também tem o reconhecimento de metadados e esquema de tabelas no lakehouse. O Copilot pode fornecer informações relevantes no contexto de seus dados em um lakehouse anexado. Por exemplo, você pode perguntar:

  • "Quantas mesas estão na casa à beira do lago?"
  • "Quais são as colunas dos clientes da tabela?"

O Copilot responde com as informações relevantes, caso você tenha adicionado o lakehouse ao notebook. O Copilot também tem reconhecimento dos nomes dos arquivos adicionados a qualquer lakehouse anexado ao notebook. Você pode consultar esses arquivos pelo nome em seu chat. Por exemplo, se você tiver um arquivo chamado sales.csv em seu lakehouse, poderá pedir para "Criar um dataframe de sales.csv". Copilot gera o código e o exibe no painel de chat. Com Copilot para notebooks, você pode acessar e consultar facilmente seus dados de diferentes fontes. Você não precisa da sintaxe de comando exata para fazer isso.

Dicas

  • Limpe sua conversa no painel de chat Copilot com a vassoura localizada na parte superior do painel de chat. O Copilot mantém o conhecimento de quaisquer entradas ou saídas durante a sessão, mas isso ajuda se você achar que o conteúdo atual causa distração.
  • Use a biblioteca de magias de chat para definir configurações sobre Copilot, incluindo configurações de privacidade. O modo de compartilhamento padrão foi projetado para maximizar o compartilhamento de contexto ao qual Copilot tem acesso, portanto, limitar as informações fornecidas ao copilot pode afetar direta e significativamente a relevância de suas respostas.
  • Quando o Copilot é iniciado pela primeira vez, ele oferece um conjunto de prompts úteis que podem ajudá-lo a começar. Eles podem ajudar a iniciar sua conversa com o Copilot. Para fazer referência aos prompts posteriormente, você pode usar o botão de brilho na parte inferior do painel de chat.
  • Você pode "arrastar" a barra lateral do chat do copilot para expandir o painel de chat, para exibir o código com mais clareza ou para facilitar a leitura das saídas na tela.

Limitações

Atualmente, os recursos do Copilot na experiência de Ciência de Dados estão no escopo dos notebooks. Esses recursos incluem o painel de chat Copilot, comandos mágicos do IPython que podem ser usados em uma célula de código e sugestões automáticas de código à medida que você digita em uma célula de código. Copilot também pode ler modelos semânticos do Power BI usando uma integração de link semântico.

Copilot tem dois usos de chave pretendidos:

  • Primeiro, você pode solicitar que Copilot examine e analise dados em seu notebook (por exemplo, primeiro carregando um DataFrame e, em seguida, perguntando Copilot sobre dados dentro do DataFrame).
  • Segundo, você pode pedir a Copilot para gerar uma série de sugestões sobre seu processo de análise de dados, como quais modelos preditivos podem ser relevantes, código para executar diferentes tipos de análise de dados e documentação para um notebook concluído.

Tenha em mente que a geração de código com bibliotecas rápidas ou lançadas recentemente pode incluir imprecisões ou fabricações.