Compartir vía


Cómo usar los cuadernos de Microsoft Fabric

El cuaderno de Microsoft Fabric es un elemento de código principal para desarrollar trabajos de Apache Spark y experimentos de aprendizaje automático. Se trata de una superficie interactiva basada en la web que usan los científicos de datos e ingenieros de datos para escribir código que se beneficie de visualizaciones enriquecidas y texto de Markdown. Los ingenieros de datos escriben código para la ingesta, preparación y transformación de datos. Los científicos de datos también usan cuadernos para crear soluciones de aprendizaje automático, incluyendo la creación de experimentos y modelos, el seguimiento de modelos y la implementación.

Con un cuaderno de Fabric puede hacer lo siguiente:

  • Empezar a trabajar sin esfuerzo alguno de configuración.
  • Explorar y procesar fácilmente los datos con una experiencia intuitiva de poco código.
  • Mantener los datos protegidos con las características de seguridad empresarial integradas.
  • Analizar datos en formatos sin procesar (CSV, TXT, JSON, etc.) y formatos de archivos procesados (parquet, Delta Lake, etc.) mediante las eficaces funcionalidades de Spark.
  • Ser productivo con funcionalidades de creación mejoradas y visualización de datos integrada.

En este artículo se describe cómo usar cuadernos en experiencias de ciencia de datos e ingeniería de datos.

Contexto de seguridad del cuaderno en ejecución

La ejecución de un cuaderno se puede desencadenar de tres maneras diferentes en Fabric, con plena flexibilidad para cumplir diferentes escenarios:

  • Ejecución interactiva: el usuario desencadena manualmente la ejecución a través de las distintas entradas de la experiencia de usuario o llamando a la API de REST. La ejecución se llevaría a cabo en el contexto de seguridad del usuario actual.
  • Ejecución como actividad de canalización: la ejecución se desencadena desde la canalización de Data Factory de Microsoft Fabric. Puede encontrar los pasos detallados en la Actividad del cuaderno. La ejecución se llevaría a cabo en el contexto de seguridad del propietario de la canalización.
  • Programador: la ejecución se desencadena desde un plan de programador. La ejecución se llevaría a cabo en el contexto de seguridad del usuario que configura o actualiza el plan del programador.

La flexibilidad de estas opciones de ejecución con un contexto de seguridad diferente le permite cumplir distintos escenarios y requisitos, pero también requiere que tenga en cuenta el contexto de seguridad al diseñar y desarrollar el cuaderno; de lo contrario, puede provocar un comportamiento inesperado e incluso algunos problemas de seguridad.

La primera vez que se crea un cuaderno, se mostrará un mensaje de advertencia para recordarle el riesgo de ejecutar el código sin revisarlo.

Captura de pantalla que muestra la advertencia de ejecución del cuaderno.

Estos son algunos procedimientos recomendados para ayudarle a evitar problemas de seguridad:

  • Antes de ejecutar manualmente el cuaderno, abra la configuración del cuaderno y compruebe la sección Detalle en el panel Acerca de la actualización de modificación para asegurarse de que el cambio más reciente es correcto.
  • Antes de añadir una actividad de cuaderno a una canalización, abra la configuración del cuaderno y compruebe la sección Detalle en el panel Acerca de la actualización de modificación para asegurarse de que el cambio más reciente es correcto. Si no está seguro del cambio más reciente, es mejor que abra el cuaderno para revisar el cambio antes de añadirlo a la canalización.
  • Antes de actualizar el plan del programador, abra la configuración del cuaderno y compruebe la sección Detalle en el panel Acerca de la actualización de modificación para asegurarse de que el cambio más reciente es correcto. Si no está seguro del cambio más reciente, es mejor que abra el cuaderno para revisar el cambio antes de actualizar el plan del programador.
  • Separe el área de trabajo en fases diferentes (desarrollo, prueba, producción) y controle el acceso a las otras fases para evitar el problema de seguridad. Añada solo el usuario en quien confíe a la fase de producción.

Creación de cuadernos

Puede crear un cuaderno o importar uno existente.

Creación un nuevo cuaderno

Como en otros procesos de creación de elementos de Fabric estándar, puede crear fácilmente un cuaderno desde la página principal de Ingeniería de datos de Fabric, la opción Nuevo del área de trabajo o en Crear centro.

Importar los cuaderno existentes

Puedes importar uno o varios cuadernos existentes desde el equipo local mediante la entrada de la barra de herramientas del área de trabajo. Los cuadernos de Fabric reconocen los archivos estándar .ipynb de Jupyter Notebook y los archivos de código fuente como .py, .scala y .sql, y crear respectivamente nuevos elementos de cuaderno.

Captura de pantalla que muestra dónde encontrar las opciones de los cuadernos en el menú Crear.

Exportación de un cuaderno

Puede exportar el cuaderno a otros formatos estándar. Los cuadernos se pueden exportar a los siguientes formatos:

  • El archivo de cuaderno estándar (.ipynb), que se usa normalmente para cuadernos de Jupyter Notebook.
  • Un archivo HTML (.html), que se puede abrir directamente desde el explorador.
  • Un archivo de Python (.py).
  • Un archivo de Latex (.tex).

Captura de pantalla que muestra dónde exportar un cuaderno.

Guardado de un cuaderno

En Fabric, un cuaderno se guardará automáticamente de manera predeterminada después de abrirlo y de editarlo; no hay que preocuparse por perder los cambios del código. También puede usar Guardar una copia para clonar en otra copia en el área de trabajo actual o en otra área de trabajo.

Captura de pantalla que muestra dónde guardar una copia.

Si prefiere guardar manualmente un cuaderno, puede cambiar a la opción de guardado Manual para tener una rama local del elemento del cuaderno y, a continuación, usar Guardar o CTRL+s para guardar los cambios.

Captura de pantalla que muestra dónde cambiar el guardado manual.

También puede cambiar al modo de guardado manual seleccionando Editar ->Opciones de guardado ->Manual. Para activar una rama local del cuaderno, guárdelo manualmente seleccionando Guardar o use el método abreviado de teclado Ctrl+s.

Conectar lakehouses y cuadernos

Los cuadernos de Fabric ahora admiten interacciones cercanas con los almacenes de lago; puede agregar fácilmente un almacén de lago nuevo o existente desde el Explorador del almacén de lago.

Puede ir a diferentes almacenes de lago en el Explorador del almacén de lago y anclar un almacén de lago para establecerlo como predeterminado. A continuación, el almacén predeterminado se monta en el directorio de trabajo del entorno de ejecución y puede leer o escribir en el almacén de lago predeterminado mediante una ruta de acceso local.

Captura de pantalla que muestra dónde anclar un Lakehouse predeterminado.

Nota:

Debe reiniciar la sesión después de anclar un nuevo almacén de lago o cambiar el nombre del almacén de lago predeterminado.

Agregar o eliminar una instancia de Lakehouse

Al seleccionar el icono X situado junto a un nombre del Lakehouse, se quita de la pestaña del cuaderno, pero el elemento Lakehouse sigue existiendo en el área de trabajo.

Seleccione Agregar Lakehouse para agregar más al cuaderno, ya sea agregando uno existente o creando uno nuevo.

Explorar un archivo Lakehouse

La subcarpeta y los archivos de la sección Tablas y Archivos de la vista Lake aparecen en un área de contenido entre la lista de Lakehouse y el contenido del cuaderno. Seleccione diferentes carpetas de la sección Tablas y Archivos para actualizar el área de contenido.

Operaciones de carpeta y de archivo

Si selecciona un archivo (.csv, .parquet, .txt, .jpg, .png, etc.) con un clic derecho, puede usar la API de Spark y la de Pandas para cargar los datos. Se genera una nueva celda de código y se inserta debajo de la celda que tiene el foco.

Puede copiar fácilmente una ruta de acceso con un formato diferente al del archivo o carpeta que se ha seleccionado y usar la ruta de acceso correspondiente en el código.

Captura de pantalla que muestra el menú contextual de archivos en Lakehouse.

Recursos de los cuadernos

El explorador de recursos de los cuadernos proporciona un sistema de archivos similar a Unix para ayudar a administrar las carpetas y los archivos. Ofrece un espacio de sistema de archivos que se puede escribir, donde puede almacenar archivos de tamaño pequeño, como módulos de código, modelos semánticos e imágenes. Puede acceder fácilmente a ellos con código en el cuaderno de la misma manera que si estuviera trabajando con el sistema de archivos local.

GIF animado de los recursos de los cuadernos.

Nota:

  • Los almacenamientos de recursos máximos para carpetas integradas y carpetas de entorno son de 500 MB, con un tamaño de archivo único de hasta 100 MB. Ambos permiten hasta 100 instancias de archivo o carpeta en total.
  • Si usa notebookutils.notebook.run(), utilice el comando notebookutils.nbResPath para acceder al recurso del cuaderno de destino. La ruta de acceso relativa builtin/ siempre apuntará a la carpeta integrada del cuaderno raíz.

Carpeta de recursos integrados

La carpeta de recursos integrados es una carpeta predefinida del sistema para cada instancia de elemento del cuaderno. Estas son las funcionalidades clave de los recursos del cuaderno.

  • Puede usar operaciones comunes como crear, eliminar, cargar, descargar, arrastrar y colocar, cambiar el nombre, duplicar y buscar a través de la interfaz de usuario.
  • Puede usar rutas de acceso relativas como builtin/YourData.txt para explorar de manera rápida. El método de notebookutils.nbResPath le ayuda a componer la ruta de acceso completa.
  • Puede mover fácilmente los datos validados a un almacén de lago mediante la opción Escribir en almacén de lago. Fabric tiene fragmentos de código enriquecido insertados para los tipos de archivo comunes, que le ayudarán a empezar a trabajar rápidamente.
  • Estos recursos también están disponibles para usarse en el caso de ejecución del cuaderno de referencia mediante notebookutils.notebook.run().

Carpeta de recursos del entorno

La Carpeta de recursos del entorno es un repositorio compartido diseñado para simplificar la colaboración entre varios cuadernos.

  • Puedes encontrar la pestaña Recursos dentro del entorno y tener las operaciones completas para administrar los archivos de recursos aquí. Estos archivos se pueden compartir entre varios cuadernos una vez que el cuaderno está conectado al entorno actual.

    Captura de pantalla que muestra dónde administrar recursos en el entorno.

  • En la página Cuaderno, puedes encontrar fácilmente una segunda carpeta raíz en Recursos heredados del entorno conectado.

    Captura de pantalla que muestra dónde abrir la carpeta de recursos del entorno.

  • También puedes operar en los archivos o carpetas igual que con la carpeta Recursos integrados.

  • La ruta de acceso del recurso del entorno se montará automáticamente en el clúster de cuadernos; puedes usar la ruta de acceso relativa /env para acceder a los recursos del entorno.

Editor de archivos

El editor de archivos te permite ver y editar archivos directamente dentro de la carpeta de recursos del cuaderno y la carpeta de recursos del entorno en el cuaderno. Los tipos de archivo admitidos incluyen CSV, TXT, HTML, YML, PY, SQL, entre otros. Con el editor de archivos, puedes acceder y modificar archivos fácilmente en el cuaderno, admite el resaltado de palabras clave y proporciona un servicio de lenguaje necesario al abrir y editar archivos de código como .py y .sql.

  • Puedes acceder a esta característica mediante la opción "Ver y editar" en el menú Archivo. Hacer doble clic en el archivo es una manera más rápida.

    Captura de pantalla que muestra dónde ver y editar archivos.

  • El cambio de contenido en el editor de archivos debe guardarse manualmente haciendo clic en el botón Guardar o en el método abreviado de teclado: Ctrl+S; el editor de archivos no admite el guardado automático.

  • El modo de cuaderno también afecta al editor de archivos. Solo puedes ver los archivos, pero no puedes editarlos si estás en el modo de cuaderno sin el permiso de edición.

Nota:

Estas son algunas limitaciones para el editor de archivos.

  • El límite en el tamaño de archivo es de 1 MB.
  • Estos tipos de archivo no son compatibles con la vista y la edición: .xlsx y .parquet.

Colaborar en un cuaderno

El cuaderno de Fabric es un elemento de colaboración que admite la edición por parte de varios usuarios en el mismo cuaderno.

Cuando abre un cuaderno, se entra al modo de edición conjunta de manera predeterminada y todas las ediciones del cuaderno se guardarán automáticamente. Si los compañeros abren el mismo cuaderno al mismo tiempo, verá su perfil, la salida de la ejecución, el indicador del cursor, el indicador de selección y el seguimiento de la edición. Mediante las características de colaboración, puede realizar fácilmente la programación en pareja, la depuración remota y los escenarios de tutoría.

Captura de pantalla que muestra una celda de código que está editando otro usuario.

Uso compartido de un cuaderno

Compartir un cuaderno es una manera cómoda de colaborar con los miembros del equipo. Los roles de área de trabajo autorizados pueden ver o editar/ejecutar cuadernos de forma predeterminada. Puede compartir un cuaderno con los permisos especificados concedidos.

  1. Seleccione Compartir en la barra de herramientas del cuaderno.

    Captura de pantalla que muestra dónde seleccionar Compartir.

  2. Seleccione la categoría correspondiente de personas que pueden ver este cuaderno. Puede elegir los permisos Compartir, Editar o Ejecutar para los destinatarios.

    Captura de pantalla que muestra dónde seleccionar los permisos.

  3. Después de seleccionar Aplicar, puede enviar el cuaderno directamente o copiar el vínculo para otros usuarios. A continuación, los destinatarios pueden abrir el cuaderno con la vista correspondiente concedida por su nivel de permisos.

    Captura de pantalla que muestra dónde crear y enviar un vínculo.

  4. Para administrar aún más los permisos del cuaderno, seleccione Lista de elementos del área de trabajo>Más opciones y, a continuación, seleccione Administrar permisos. Desde esa pantalla, puede actualizar el acceso y los permisos existentes del cuaderno.

    Captura de pantalla que muestra dónde administrar los permisos en el área de trabajo.

Comentar una celda de código

La creación de comentarios es otra característica útil en escenarios de colaboración. Actualmente, Fabric admite la adición de comentarios de nivel de celda.

  1. Seleccione el botón Comentarios de la barra de herramientas del cuaderno o el indicador de comentario de celda para abrir el panel Comentarios.

    Captura de pantalla que muestra dónde seleccionar Comentario.

  2. Seleccione el código en la celda de código, seleccione Nuevo en el panel Comentarios, agregue los comentarios y, a continuación, seleccione Publicar comentario para guardarlo.

    Captura de pantalla que muestra dónde seleccionar Nuevo.

  3. Si las necesita, busque las opciones Editar comentario, Resolver conversación y Eliminar conversación; para ello, seleccione la opción Más situada junto al comentario.

Etiquetado de otros usuarios en un comentario

"Etiquetado" hace referencia a mencionar y notificar a un usuario en un subproceso de comentario, lo que mejora la colaboración de forma eficaz en los detalles.

  1. Seleccione una sección de código en una celda y un nuevo subproceso de comentario.

  2. Introduzca el nombre de usuario y elija el correcto en la lista de sugerencias si desea mencionar a alguien para obtener información sobre una determinada sección.

  3. Comparta sus conclusiones y publíquelas.

  4. Se desencadenará una notificación por correo electrónico y el usuario hace clic en el vínculo Abrir comentarios para localizar rápidamente esta celda.

  5. Además, autorice y configure los permisos para los usuarios al etiquetar a alguien que no tiene acceso, lo que garantiza que los recursos de código estén bien administrados.

GIF animado de etiquetar a otros en un comentario.

Nota:

Para un elemento de comentario, el usuario etiquetado ya no recibirá una notificación por correo electrónico si actualiza el comentario en un plazo de una hora. Pero enviará una notificación por correo electrónico al nuevo usuario etiquetado.

Conmutador del modo notebook

Los cuadernos de Fabric admiten cuatro modos que se pueden cambiar fácilmente: modo de Desarrollo, de Solo ejecución, de Edición y de Vista. Cada modo se asigna a una combinación de permisos específica. Al compartir el cuaderno con otros miembros del equipo, puedes conceder permisos adecuados a los destinatarios y verás el mejor modo de cuaderno disponible según tu permiso; también podrás cambiar entre el modo al que tienen permiso.

Captura de pantalla en la que se muestra dónde cambiar entre los modos.

  • Modo de Desarrollo: lectura, ejecución, permiso de escritura necesario.
  • Modo de Solo ejecución: lectura, ejecución y permiso necesario.
  • Modo de Edición: se necesita permiso de lectura y escritura.
  • Modo de Vista: se necesita permiso de lectura.