Compartir a través de


Exportación a Azure Blob Storage

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

En este artículo se describe cómo usar la opción Exportar a Azure Blob Storage, en el módulo Exportar datos de Machine Learning Studio (clásico).

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Esta opción es útil cuando desea exportar datos de un experimento de aprendizaje automático a Azure Blob Storage. Por ejemplo, puede compartir salidas de datos de aprendizaje automático con otras aplicaciones, almacenar datos intermedios o conjuntos de datos limpios para su uso en otros experimentos.

Puede acceder a los blobs de Azure desde cualquier lugar, mediante HTTP o HTTPS. Dado Azure Blob Storage es un almacén de datos no estructurado, puede exportar datos en varios formatos. Actualmente, se admiten los formatos CSV, TSV y ARFF.

Para exportar datos a un blob de Azure para que los usen otras aplicaciones, use el módulo Exportar datos para guardar los datos en Azure Blob Storage. A continuación, use cualquier herramienta que pueda leer datos de Azure Storage (como Excel, utilidades de almacenamiento en la nube u otros servicios en la nube) para cargar y usar los datos.

Nota:

Los módulos Importar datos y Exportar datos solo pueden leer y escribir datos desde Azure Storage creado mediante el modelo de implementación clásica. En otras palabras, el nuevo tipo Azure Blob Storage cuenta que ofrece niveles de acceso de almacenamiento de acceso es decir, de acceso es decir, es decir, no se admite todavía.

Por lo general, las cuentas de almacenamiento de Azure que podría haber creado antes de que esta opción de servicio estuviera disponible no deberían verse afectadas.

Sin embargo, si necesita crear una cuenta para su uso con Machine Learning, se recomienda seleccionar Clásica para el modelo de implementación o usarResource Manager y, en Tipo de cuenta, seleccionar Uso general en lugar de Blob Storage.

Cómo exportar datos a Azure Blob Storage

Azure Blob service sirve para almacenar grandes cantidades de datos, incluidos los datos binarios. Hay dos tipos de almacenamiento de blobs: blobs públicos y blobs que requieren credenciales de inicio de sesión.

  1. Agregue el módulo Exportar datos al experimento. Puede encontrar este módulo en la categoría Entrada y salida de datos en Studio (clásico).

  2. Conectar exportar datos al módulo que genera los datos que desea exportar a Azure Blob Storage.

  3. Abra el panel Propiedades de Exportar datos. Para el destino de datos, seleccione Azure Blob Storage.

  4. En Tipo de autenticación, elija Público (DIRECCIÓN URL de SAS) si sabe que el almacenamiento admite el acceso a través de una dirección URL de SAS.

    Una dirección URL de SAS es un tipo especial de dirección URL que se puede generar mediante una utilidad de almacenamiento de Azure y solo está disponible durante un tiempo limitado. Contiene toda la información necesaria para la autenticación y la descarga.

    Para URI, escriba o pegue el URI completo que define la cuenta y el blob público.

  5. Para las cuentas privadas, elija Cuentay proporcione el nombre de cuenta y la clave de cuenta, para que el experimento pueda escribir en la cuenta de almacenamiento.

    • Nombre de cuenta: escriba o pegue el nombre de la cuenta en la que desea guardar los datos. Por ejemplo, si la dirección URL completa de la cuenta de almacenamiento es https://myshared.blob.core.windows.net, escribiría myshared.

    • Clave de cuenta: pegue la clave de acceso de almacenamiento asociada a la cuenta.

  6. Ruta de acceso al contenedor, directorio o blob: escriba el nombre del blob donde se almacenarán los datos exportados. Por ejemplo, para guardar los resultados del experimento en un nuevo blob denominado results01.csv del contenedor predictions en una cuenta denominada mymldata, la dirección URL completa para el blob sería https://mymldata.blob.core.windows.net/predictions/results01.csv.

    Por lo tanto, en el campo Path to container, directory, or blob (Ruta de acceso al contenedor, directorio o blob), especificaría el contenedor y el nombre del blob de la manera siguiente: predictions/results01.csv

  7. Si especifica el nombre de un blob que aún no existe, Azure creará el blob.

    Al escribir en un blob existente, puede especificar que el contenido actual del blob se sobrescriba estableciendo la propiedad , Azure Blob Storage modo de escritura. De manera predeterminada, esta propiedad se establece en Error, lo que significa que se produce un error cada vez que se encuentra un archivo de blob existente con el mismo nombre.

  8. Para File format for blob file (Formato de archivo de blob), seleccione el formato en el que se deben almacenar los datos.

    • CSV: los valores separados por comas (CSV) son el formato de almacenamiento predeterminado. Para exportar los encabezados de columna junto con los datos, seleccione la opción Write blob header row (Escribir fila de encabezado de blob). Para obtener más información sobre el formato delimitado por comas que se usa Machine Learning, vea Convertir a CSV.

    • TSV: el formato de valores separados por tabulaciones (TSV) es compatible con muchas herramientas de aprendizaje automático. Para exportar los encabezados de columna junto con los datos, seleccione la opción Write blob header row (Escribir fila de encabezado de blob). Para obtener más información sobre el formato separado por tabulaciones que se usa Machine Learning, vea Convertir a TSV.

    • ARFF: este formato permite guardar archivos en el formato usado por el conjunto de herramientas de Weka. Este formato no se admite para los archivos almacenados en una dirección URL de SAS. Para obtener más información sobre el formato ARFF, vea Convertir a ARFF.

  9. Usar resultados almacenados en caché: seleccione esta opción si desea evitar volver a escribir los resultados en el archivo de blob cada vez que ejecute el experimento. Si no hay ningún otro cambio en los parámetros del módulo, el experimento escribe los resultados solo la primera vez que se ejecuta el módulo, o cuando hay cambios en los datos.

Ejemplos

Para obtener ejemplos de cómo usar el módulo Exportar datos, vea el Azure AI Gallery:

  • Convertir conjunto de datos al formato VW: este experimento usa el script de Python junto con el módulo Exportar datos para crear datos que vowpal Wabbit puede usar.

  • Configuración de canalizaciones de análisis predictivo mediante Azure SQL Data Warehouse: en este escenario se describe el movimiento de datos entre varios componentes, incluidos Machine Learning y SQL Data Warehouse.

  • Puntuación por lotes sin código: en este tutorial se muestra cómo puede usar Azure Logic Apps para automatizar tanto la importación de datos que usan los experimentos como la escritura de los resultados del experimento en Blob Storage.

  • Operacionalización de una solución de Azure ML con SQL Server local mediante Azure Data Factory: en este artículo se describe una canalización de datos más compleja que envía datos de vuelta a una base de datos SQL Server local, mediante Blob Storage como fase provisional. El uso de una base de datos local requiere la configuración de una puerta de enlace de datos, pero puede omitir esa parte del ejemplo y simplemente usar blob storage.

Notas técnicas

Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.

Preguntas frecuentes

¿Cómo puedo evitar escribir los datos si el experimento no ha cambiado?

Cuando los resultados del experimento cambian, Exportar datos siempre guarda el nuevo conjunto de datos. Sin embargo, si ejecuta el experimento repetidamente sin realizar cambios que afecten a los datos de salida, puede seleccionar la opción Usar resultados almacenados en caché.

El módulo comprueba si el experimento se ha ejecutado anteriormente con los mismos datos y las mismas opciones, y si se encuentra una ejecución anterior, la operación de escritura no se repite.

¿Puedo guardar datos en una cuenta en otra región geográfica?

Sí, puede escribir datos en cuentas de distintas regiones. Sin embargo, si la cuenta de almacenamiento se encuentra en una región diferente del nodo de proceso usado para el experimento de aprendizaje automático, el acceso a los datos podría ser más lento. Además, se le cobrará por la entrada y salida de datos en la suscripción.

Parámetros del módulo

Opciones generales

Nombre Intervalo Tipo Valor predeterminado Descripción
Origen de datos Lista Origen de datos o receptor Azure Blob Storage El destino puede ser un archivo en Azure BLOB Storage, una tabla de Azure, una tabla o vista en un Azure SQL Database o una tabla de Hive.
Uso de resultados almacenados en caché TRUE/FALSE Boolean FALSE El módulo solo se ejecuta si no existe una caché válida; De lo contrario, use los datos almacenados en caché de la ejecución anterior.
Especificar el tipo de autenticación SAS/cuenta AuthenticationType Cuenta Indica si se deben usar credenciales de SAS o de cuenta para la autorización de acceso.

Pública o SAS: opciones de almacenamiento público

Nombre Intervalo Tipo Valor predeterminado Descripción
URI SAS para blob cualquiera String ninguno Uri de SAS del blob en el que se va a escribir (obligatorio)
Formato del archivo SAS ARFF

CSV

TSV
LoaderUtils.FileTypes CSV Indica si el archivo es CSV, TSV o ARFF. (necesario)
Escribir la fila de encabezado SAS TRUE/FALSE Boolean FALSE Indica si los encabezados de columna se deben escribir en el archivo

Cuenta: opciones de almacenamiento privado

Nombre Intervalo Tipo Valor predeterminado Descripción
Nombre de cuenta de Azure cualquiera String ninguno Nombre de la cuenta de usuario de Azure
Clave de cuenta de Azure cualquiera SecureString ninguno Claves de Azure Storage
Ruta de acceso del blob empezando con el contenedor cualquiera String ninguno Nombre del archivo de blob, empezando por el nombre del contenedor
Azure Blob Storage de escritura Lista: Error, Sobrescritura enum:BlobFileWriteMode Error Elección del método de escritura de archivos de blob
Formato de archivo de blob ARFF

CSV

TSV
LoaderUtils.FileTypes CSV Indica si el archivo de blob es CSV, TSV o ARFF.
Escribir la fila de encabezado de blob TRUE/FALSE Boolean FALSE Indica si el archivo de blob debe tener una fila de encabezado

Excepciones

Excepción Descripción
Error 0027 Se produce una excepción cuando dos objetos tienen que ser del mismo tamaño pero no lo son.
Error 0003 Se produce una excepción si una o varias de las entradas son nulas o están vacías.
Error 0029 Se produce una excepción cuando se pasa un URI no válido.
Error 0030 Se produce una excepción cuando no es posible descargar un archivo.
Error 0002 Se produce una excepción si uno o más parámetros no se pudieron analizar o convertir del tipo especificado al tipo requerido por el método de destino.
Error 0009 Se produce una excepción si se especifica incorrectamente el nombre de la cuenta de almacenamiento de Azure o el nombre del contenedor.
Error 0048 Se produce una excepción cuando no es posible abrir un archivo.
Error 0046 Se produce una excepción si no es posible crear el directorio en la ruta de acceso especificada.
Error 0049 Se produce una excepción cuando no es posible analizar un archivo.

Para obtener una lista de errores específicos de los módulos de Studio (clásico), consulte Machine Learning códigos de error.

Para obtener una lista de excepciones de API, consulte Machine Learning códigos de error de la API REST.

Consulte también

Import Data
Export Data
Exportar a Azure SQL Database
Exportar a una consulta de Hive
Exportar a una tabla de Azure