Exploración de cuadernos

Completado

Los cuadernos proporcionan un entorno interactivo en el que puede combinar texto y gráficos en formato Markdown con celdas que contienen código que se ejecuta de forma interactiva en la sesión del cuaderno.

Como científico de datos, es posible que esté más familiarizado con la escritura y ejecución de código en cuadernos. Microsoft Fabric ofrece una experiencia de cuaderno conocida, con la tecnología de Apache Spark.

En Microsoft Fabric, los científicos de datos, los usuarios empresariales y los analistas trabajan en la misma plataforma, lo que mejora el uso compartido de datos y la colaboración a escala.

El uso de cuadernos en la ciencia de datos

Los cuadernos son una herramienta común para los científicos de datos, ya que permiten combinar código, texto explicativo y recursos multimedia en un único documento. Esto crea una narrativa que puede impulsar la exploración al facilitar el uso compartido de códigos y la creación de prototipos rápidas.

Los cuadernos también permiten a los científicos de datos experimentar y compartir información rápidamente a través de la creación rápida del entorno.

Cuadernos en Microsoft Fabric

Puede empezar a trabajar con cuadernos en Microsoft Fabric sin esfuerzo de configuración. Puede crear un cuaderno o importar uno existente. También puede seleccionar varios cuadernos e importarlos en un lote.

Screenshot of the actions available in a Data Science workspace in Microsoft Fabric.

Actualmente, los cuadernos de Microsoft Fabric admiten cuatro lenguajes de Apache Spark:

  • PySpark (Python)
  • Spark (Scala)
  • Spark SQL
  • SparkR

Crear un cuaderno

Para crear un cuaderno, seleccione la opción Nuevo en Inicio en el área de trabajo habilitada para Fabric.

La captura de pantalla siguiente le guía por los componentes principales del cuaderno en Fabric.

Screenshot of the options available in a Microsoft Fabric notebook.

  1. La barra de menús de un cuaderno de Microsoft Fabric ofrece varias características. Permite guardar y exportar el cuaderno, administrar celdas, finalizar la sesión, programar la ejecución del cuaderno, iniciar Data Wrangler, ajustar el diseño y mucho más. Para acceder a todas estas características, simplemente cambie entre las pestañas Inicio, Editar, Ejecutar, Datosy Ver.

  2. En la pestaña Almacén de lago, puede agregar un nuevo o existente almacén de lago desde el explorador de almacén de lago. La pestaña Recursos proporciona un almacenamiento similar a Unix para archivos pequeños, como código, conjuntos de datos e imágenes, accesibles directamente desde el cuaderno.

  3. Ejecute la celda actual. Como alternativa, puede presionar Ctrl+Entrar o presionar Alt+Entrar para ejecutar la celda actual e insertar una nueva celda.

  4. Agregue un nuevo código o una celda de Markdown. Esta opción también está disponible en el menú seleccionando Editar-> Agregar celda de código.

  5. Proporciona varias opciones para administrar una celda específica, como cambiar la posición de la celda dentro del cuaderno, convertirlo a una celda de código o markdown, borrar la salida, agregar comentarios, etc.

Nota:

Si no encuentra la opción cuaderno, podría deberse a que el inquilino o el área de trabajo no se ha habilitado para Fabric. Para obtener información sobre cómo habilitar Fabric, consulte Habilitación de Microsoft Fabric para su organización.

Trabajar con datos en cuadernos

Arrastrar y colocar permite importar fácilmente datos desde el explorador del Almacén de lago. Admite varios tipos de archivo, como archivos de texto, tablas, imágenes, etc. Puede quitar los datos en una celda existente o nueva y el cuaderno genera un fragmento de código para obtener una vista previa de los datos.

Example of the drag-and-drop feature generating the necessary code to read a file.

Además, puede insertar fácilmente imágenes en una celda de Markdown arrastrando y colocándolas desde el explorador o el equipo local.

Ejecutar código en cuadernos

IntelliSense mejora la escritura de código y la identificación de errores con características como el resaltado de sintaxis, el marcado de errores y las finalizaciones automáticas de código. A medida que escribe, predice lo que intenta escribir y ofrece sugerencias. Esto no solo acelera la codificación, sino que también ayuda a evitar errores tipográficos y aprender llamadas API.

Seguimiento de las variables en cuadernos

No es raro trabajar en un cuaderno para tener cientos de variables, cada una de las cuales desempeña un papel fundamental en el análisis de datos o el desarrollo del modelo. Realizar un seguimiento de todas estas variables puede ser una tarea complicada. Aquí es donde entra en juego el explorador de variables integrado en el cuaderno de Microsoft Fabric.

A medida que ejecuta celdas de código en el cuaderno de PySpark (Python) en Microsoft Fabric, se realiza un seguimiento automático de las variables y se enumeran en el explorador de variables. Esto le permite ver el estado de las variables en cualquier punto del proceso de codificación.

Screenshot of the variable explorer in a Microsoft Fabric notebook.

Para cada variable, el explorador muestra su nombre, su tipo, su longitud y su valor. Esto proporciona información general rápida de los datos sin necesidad de imprimir o registrar estos detalles manualmente.

Administración de bibliotecas y dependencias

En Microsoft Fabric, puede administrar bibliotecas y dependencias de dos maneras: a través de la configuración del área de trabajo o en línea dentro de un cuaderno.

Configuración del área de trabajo

Todas las bibliotecas instaladas en el nivel de área de trabajo se pueden usar en todos los cuadernos y trabajos de Spark dentro de esa área de trabajo y son accesibles en diferentes sesiones. Por lo tanto, si necesita crear un entorno común para todas las sesiones de un área de trabajo, es mejor usar bibliotecas de nivel de área de trabajo.

  1. En el panel de navegación izquierdo, seleccione Áreas de trabajo. Esto despliega una lista de las áreas de trabajo. Seleccione el área de trabajo en el que desea trabajar.

  2. Seleccione Configuración del área de trabajo para el área de trabajo actual y, a continuación, seleccione Ingeniería de datos/Ciencia.

    Screenshot of the library management option in a Data Science workspace in Microsoft Fabric.

  3. Seleccione Administración de bibliotecas para instalar tanto la fuente de Python como las bibliotecas personalizadas.

Instalación en línea

El comando %pip de Microsoft Fabric funciona igual que el comando pip en muchos cuadernos de ciencia de datos. Use comandos %pip para instalar directamente bibliotecas de fuentes en el cuaderno.

Nota:

Las bibliotecas instaladas con el comando %pip solo están disponibles para la sesión actual. Además, al ejecutar un comando %pip se reiniciará el intérprete de Python, lo que significa que se perderán las variables definidas antes de ejecutar el comando.

El comando de instalación %pip se usa para instalar las versiones más recientes de estas bibliotecas. A continuación, la instrucción import (importar) se usa para importar estas bibliotecas en el entorno de Python actual.

%pip install seaborn
%pip install sklearn

import seaborn as sns
from sklearn import datasets

Sugerencia

Se recomienda colocar todos los comandos para agregar, eliminar o actualizar paquetes de Python al principio del cuaderno.

Colaboración en cuadernos

El uso compartido y la colaboración en cuadernos permiten la resolución colectiva de problemas y la eficacia en los proyectos de ciencia de datos. Los cuadernos de Microsoft Fabric ofrecen una característica eficaz en la que varios usuarios pueden editar simultáneamente el mismo documento. Esta funcionalidad es útil en escenarios como la programación de pares, la solución de problemas remota y el uso compartido de conocimientos.

En nuestro escenario, imagine que usted y su compañero trabajan en un proyecto usando cuadernos de Microsoft Fabric. Está atascado en un fragmento de código y pide ayuda a su compañero. Su compañero abre el mismo cuaderno y ve que aparece su perfil. A medida que su compañero revisa y edita el código, puede ver sus movimientos de cursor, selecciones y cambios en tiempo real. Estos comentarios inmediatos le ayudan a identificar y comprender la solución rápidamente.

Esta característica de colaboración en tiempo real de los cuadernos de Microsoft Fabric no solo le ayuda a resolver el problema de codificación, sino que también le proporciona una excelente oportunidad para aprender de su compañero más experimentado.

Para obtener más información sobre todas las características disponibles en los cuadernos de Microsoft Fabric, consulte Desarrollo, ejecución y administración de cuadernos de Microsoft Fabric.