Compartilhar via


Visão geral do Copilot para Ciência de Dados e Engenharia de Dados (previsão)

Importante

Este recurso está em pré-visualização.

Copilot for Data Science and Data Engineering é um assistente de IA que ajuda a analisar e visualizar dados. Ele funciona com tabelas e arquivos do Lakehouse, conjuntos de dados do Power BI e dataframes pandas/spark/fabric, fornecendo respostas e trechos de código diretamente no bloco de anotações. A maneira mais eficaz de usar Copilot é adicionar seus dados como um dataframe. Você pode fazer suas perguntas no painel de bate-papo, e a IA fornece respostas ou código para copiar em seu bloco de anotações. Ele entende o esquema e os metadados dos dados e, se os dados forem carregados em um dataframe, ele também terá conhecimento dos dados dentro do quadro de dados. Você pode pedir a Copilot para fornecer informações sobre dados, criar código para visualizações ou fornecer código para transformações de dados, e ele reconhece nomes de arquivos para facilitar a referência. Copilot simplifica a análise de dados, eliminando codificações complexas.

Observação

Introdução ao Copilot para Ciência de Dados e Engenharia de Dados para Ciência de Dados de Tecido

Com o Copilot para Ciência de Dados e Engenharia de Dados, você pode conversar com um assistente de IA que pode ajudá-lo a lidar com suas tarefas de análise e visualização de dados. Você pode fazer as Copilot perguntas sobre tabelas lakehouse, conjuntos de dados do Power BI ou quadros de dados Pandas/Spark dentro de blocos de anotações. Copilot responde em linguagem natural ou com trechos de código. Copilot também pode gerar código específico de dados para você, dependendo da tarefa. Por exemplo, Copilot para Ciência de Dados e Engenharia de Dados pode gerar código para:

  • Criação de gráficos
  • Filtragem de dados
  • Aplicação de transformações
  • Modelos de aprendizagem automática

Primeiro selecione o ícone de Copilot na barra de ferramentas de cadernos. O painel de bate-papo Copilot é aberto e uma nova célula aparece na parte superior do seu bloco de anotações. Esta célula deve ser executada sempre que uma sessão do Spark for carregada em um notebook Fabric. Caso contrário, a experiência Copilot não funcionará corretamente. Estamos no processo de avaliar outros mecanismos para lidar com essa inicialização necessária em versões futuras.

Captura de ecrã a mostrar o friso Copilot.

Execute a célula na parte superior do bloco de anotações, com este código:

#Run this cell to install the required packages for Copilot
%pip install https://aka.ms/chat-magics-0.0.0-py3-none-any.whl
%load_ext chat_magics

Depois que a célula for executada com êxito, você poderá usar Copilot. Tem de executar novamente a célula no topo do bloco de notas sempre que a sua sessão for encerrada.

Captura de ecrã mostrando a execução bem-sucedida da célula.

Para maximizar a eficácia do Copilot, carregue uma tabela ou conjunto de dados como um dataframe no teu caderno. Dessa forma, a IA pode acessar os dados e entender sua estrutura e conteúdo. Em seguida, comece a conversar com a IA. Selecione o ícone de bate-papo na barra de ferramentas do bloco de anotações e digite sua pergunta ou solicitação no painel de bate-papo. Por exemplo, você pode perguntar:

  • "Qual é a idade média dos clientes neste conjunto de dados?"
  • "Mostre-me um gráfico de barras de vendas por região"

E mais. Copilot responde com a resposta ou o código, que você pode copiar e colar no seu bloco de anotações. Copilot para Ciência de Dados e Engenharia de Dados é uma maneira conveniente e interativa de explorar e analisar seus dados.

Ao usar Copilot, você também pode invocar os comandos mágicos dentro de uma célula do notebook para obter a saída diretamente no notebook. Por exemplo, para respostas em linguagem natural às respostas, você pode fazer perguntas usando o comando "%%chat", como:

%%chat
What are some machine learning models that may fit this dataset?

Captura de tela mostrando a geração de código.

ou

%%code
Can you generate code for a logistic regression that fits this data?

Captura de tela mostrando a geração de código de regressão logística.

Copilot para Ciência de Dados e Engenharia de Dados também tem consciência de esquema e metadados de tabelas no lakehouse. Copilot pode fornecer informações relevantes no contexto dos seus dados num lakehouse anexo. Por exemplo, você pode perguntar:

  • "Quantas mesas existem na casa do lago?"
  • "Quais são as colunas dos clientes da mesa?"

Copilot responde com as informações relevantes se você adicionou a casa do lago ao caderno. Copilot também tem conhecimento dos nomes dos ficheiros adicionados a qualquer Lakehouse anexado ao notebook. Pode referir-se a esses ficheiros pelo nome no seu chat. Por exemplo, se você tiver um arquivo chamado sales.csv em sua casa do lago, poderá perguntar "Criar um dataframe a partir de sales.csv". Copilot gera o código e o exibe no painel de chat. Com o Copilot para blocos de notas, pode aceder e consultar facilmente os seus dados a partir de diferentes fontes. Você não precisa da sintaxe exata do comando para fazê-lo.

Dicas

  • "Limpe" sua conversa no painel de bate-papo Copilot com a vassoura localizada na parte superior do painel de bate-papo. Copilot mantém o conhecimento de quaisquer entradas ou saídas durante a sessão, mas isso pode ajudar se achar que o conteúdo atual é distrativo.
  • Use a biblioteca de magias de bate-papo para definir configurações sobre Copilot, incluindo configurações de privacidade. O modo de compartilhamento padrão foi projetado para maximizar o compartilhamento de contexto ao qual Copilot tem acesso, portanto, limitar as informações fornecidas a copilot pode afetar direta e significativamente a relevância de suas respostas.
  • Quando Copilot é lançado pela primeira vez, ele oferece um conjunto de prompts úteis que podem ajudá-lo a começar. Eles podem ajudar a iniciar sua conversa com Copilot. Para consultar os prompts mais tarde, você pode usar o botão de brilho na parte inferior do painel de bate-papo.
  • Você pode "arrastar" a barra lateral do bate-papo copilot para expandir o painel de bate-papo, para visualizar o código com mais clareza ou para legibilidade das saídas na tela.

Limitações

Copilot funcionalidades na experiência de Ciência de Dados estão atualmente limitadas a notebooks. Esses recursos incluem o painel de bate-papo Copilot, comandos mágicos IPython que podem ser usados dentro de uma célula de código e sugestões automáticas de código à medida que você digita em uma célula de código. Copilot também pode ler modelos semânticos do Power BI usando uma integração de link semântico.

Copilot tem dois usos principais pretendidos:

  • Primeiro, você pode pedir a Copilot para examinar e analisar dados em seu bloco de anotações (por exemplo, primeiro carregando um DataFrame e, em seguida, perguntando a Copilot sobre dados dentro do DataFrame).
  • Em segundo lugar, você pode pedir a Copilot que gere uma série de sugestões sobre seu processo de análise de dados, como quais modelos preditivos podem ser relevantes, código para executar diferentes tipos de análise de dados e documentação para um bloco de anotações concluído.

Lembre-se de que a geração de código com bibliotecas rápidas ou lançadas recentemente pode incluir imprecisões ou fabricações.