Compartir a través de


Información general sobre Copilot para la ciencia de datos y la ingeniería de datos (versión preliminar)

Importante

Esta característica se encuentra en versión preliminar.

Copilot para la ciencia de datos y la ingeniería de datos es un asistente de inteligencia artificial que ayuda a analizar y visualizar datos. Funciona con tablas y archivos de Lakehouse, conjuntos de datos de Power BI y tramas de datos pandas/spark/fabric, proporcionando respuestas y fragmentos de código directamente en el cuaderno. La forma más eficaz de usar Copilot es agregar tus datos como un dataframe. Puede formular sus preguntas en el panel de chat y la inteligencia artificial proporciona respuestas o código para copiar en el cuaderno. Comprende el esquema y los metadatos de los datos, y si estos se cargan en un marco de datos, también tiene conocimiento de lo que hay dentro de él. Puede pedir a Copilot que proporcione información sobre los datos, cree código para visualizaciones o proporcione código para transformaciones de datos y reconozca nombres de archivo para facilitar la referencia. Copilot simplifica el análisis de datos eliminando la codificación compleja.

Nota

Introducción a Copilot para la ciencia de datos y la ingeniería de datos para la ciencia de datos de Fabric

Con Copilot para la ciencia de datos y la ingeniería de datos, puede chatear con un asistente de inteligencia artificial que pueda ayudarle a controlar las tareas de visualización y análisis de datos. Puede hacerle preguntas a Copilot sobre tablas de almacén de lago, conjuntos de datos de Power BI o elementos DataFrame de Pandas y Spark en cuadernos. Copilot responde en lenguaje natural o con fragmentos de código. Copilot también puede generar código específico de los datos, en función de la tarea. Por ejemplo, Copilot para la ciencia de datos y la ingeniería de datos puede generar código para:

  • Creación de gráficos
  • Filtrado de datos
  • Aplicación de transformaciones
  • Modelos de Machine Learning

En primer lugar, seleccione el icono de Copilot en la cinta de cuadernos. Se abre el panel de chat Copilot y aparece una nueva celda en la parte superior del cuaderno. Esta celda debe ejecutarse cada vez que se carga una sesión de Spark en un cuaderno de Fabric. De lo contrario, la experiencia de Copilot no funcionará correctamente. Estamos en proceso de evaluar otros mecanismos para controlar esta inicialización necesaria en futuras versiones.

Captura de pantalla que muestra el botón Copilot de la cinta de opciones.

Ejecute la celda en la parte superior del cuaderno, con este código:

#Run this cell to install the required packages for Copilot
%load_ext dscopilot_installer
%activate_dscopilot

Una vez que se ha ejecutado correctamente la celda, puede usar Copilot. Debe volver a ejecutar la celda al principio del cuaderno cada vez que cierre sesión en él.

Recorte de pantalla en el que se muestra la ejecución correcta de la celda.

Para maximizar la eficacia de Copilot, cargue una tabla o un conjunto de datos como un marco de datos en su cuaderno de notas. De este modo, la inteligencia artificial puede acceder a los datos y comprender su estructura y contenido. A continuación, empiece a chatear con la inteligencia artificial. Seleccione el icono de chat en la barra de herramientas del cuaderno y escriba su pregunta o solicitud en el panel de chat. Por ejemplo, puede preguntar:

  • "¿Cuál es la edad media de los clientes de este conjunto de datos?"
  • "Mostrarme un gráfico de barras de ventas por región"

Y mucho más. Copilot responde con la respuesta o el código, que puede copiar y pegar en su cuaderno. Copilot para la ciencia de datos y la ingeniería de datos es una forma cómoda e interactiva de explorar y analizar los datos.

Mientras utiliza Copilot, puede invocar también comandos magic dentro de una celda del cuaderno para obtener la salida directamente en el cuaderno. Por ejemplo, para las respuestas del lenguaje natural a las respuestas, puede formular preguntas mediante el comando "%%chat", como:

%%chat
What are some machine learning models that may fit this dataset?

Captura de pantalla que muestra la generación de código.

o bien

%%code
Can you generate code for a logistic regression that fits this data?

Captura de pantalla que muestra la generación de código de regresión logística.

Copilot para ciencia de datos e ingeniería de datos también tiene conocimiento del esquema y los metadatos de las tablas del almacén de lago. Copilot puede proporcionar información pertinente en el contexto de los datos de un almacén de lago conectado. Por ejemplo, puede preguntar:

  • ¿Cuántas mesas hay en la casa del lago?
  • "¿Qué columnas tiene la tabla Clientes?"

Copilot responde con la información pertinente si ha agregado el almacén de lago al cuaderno. Copilot también tiene conocimiento de los nombres de los archivos agregados a cualquier almacén de lago conectado al cuaderno. Puede hacer referencia a esos archivos por su nombre en el chat. Por ejemplo, si tiene un archivo denominado sales.csv en el almacén de lago, puede pedirle "Crea un DataFrame a partir de sales.csv". Copilot genera el código y lo muestra en el panel de chat. Con Copilot para cuadernos, puede acceder a los datos de diferentes orígenes y consultarlos fácilmente. No necesita la sintaxis exacta del comando para hacerlo.

Consejos

  • "Borre" la conversación en el panel de chat de Copilot con la escoba de la parte superior del panel. Copilot retiene el conocimiento de las entradas o salidas que se producen durante la sesión, lo que resulta muy útil si el contenido actual le distrae.
  • Usa la biblioteca de magias de chat para configurar opciones sobre Copilot, incluidas las configuraciones de privacidad. El modo de uso compartido predeterminado está diseñado para maximizar el uso compartido del contexto al que Copilot tiene acceso, por lo que limitar la información proporcionada a Copilot puede tener un impacto directo y significativo en la relevancia de sus respuestas.
  • Cuando Copilot se inicia por primera vez, ofrece un conjunto de avisos útiles que pueden ayudarte a empezar. Pueden ayudar a iniciar la conversación con Copilot. Para hacer referencia a indicaciones más adelante, puede usar el botón chispa situado en la parte inferior del panel de chat.
  • Puede "arrastrar" la barra lateral del chat de copilot para expandir el panel de chat, para ver el código más claramente o para mejorar la legibilidad de las salidas en la pantalla.

Limitaciones

Las características de Copilot en la experiencia de ciencia de datos están actualmente limitadas a cuadernos. Estas características incluyen el panel de chat de Copilot, comandos mágicos de IPython que se pueden usar dentro de una celda de código y sugerencias automáticas de código mientras escribe en una celda de código. Copilot también puede leer modelos semánticos de Power BI mediante una integración del vínculo semántico.

Copilot tiene dos usos clave previstos:

  • Uno, puede pedirle a Copilot que examine y analice los datos en su cuaderno (por ejemplo, cargando primero un DataFrame y luego preguntando a Copilot sobre los datos dentro del DataFrame).
  • En segundo lugar, puede solicitar a Copilot que genere una serie de sugerencias sobre su proceso de análisis de datos, como qué modelos predictivos pueden ser relevantes, código para realizar diferentes tipos de análisis de datos y documentación para un notebook completado.

Tenga en cuenta que la generación de código con bibliotecas que evolucionan rápidamente o que se han lanzado recientemente puede incluir inexactitudes o invenciones.