Creación de proyectos de clasificación de texto personalizado
Artículo
Use este artículo para obtener información sobre cómo configurar los requisitos para empezar con una clasificación de texto personalizado y crear un proyecto.
Prerrequisitos
Para empezar a usar una clasificación de texto personalizado, se necesitará lo siguiente:
Antes de empezar a usar la clasificación de texto personalizado, necesitará un recurso de Lenguaje de Azure AI. Se recomienda crear el recurso de idioma y conectarlo a una cuenta de almacenamiento en Azure Portal. La creación de un recurso en Azure Portal permite crear una cuenta de Azure Storage al mismo tiempo, con todos los permisos necesarios preconfigurados. También puede leer más adelante en el artículo para aprender a usar un recurso existente y configurarlo para que funcione con la clasificación personalizada de texto.
También necesitará una cuenta de Azure Storage en la que cargará los documentos .txt que se usarán para entrenar un modelo de clasificación de texto.
Nota
Debe tener asignado un rol de propietario en el grupo de recursos para crear un recurso de idioma.
Si va a conectar una cuenta de almacenamiento ya existente, debe tener asignado un rol de propietario.
Creación de un recurso de idioma y conexión de la cuenta de almacenamiento
Nota
No debe mover la cuenta de almacenamiento a otro grupo de recursos o suscripción una vez que esté vinculada con el recurso de lenguaje.
Vaya a Azure Portal y cree un recurso de Lenguaje de Azure AI.
En la ventana que se abre, seleccione Clasificación de texto personalizado y reconocimiento de entidades con nombre personalizadas en las características personalizadas. Seleccione Continuar para crear el recurso en la parte inferior de la pantalla.
Cree un recurso de idioma con los detalles siguientes.
Nombre
Valor obligatorio
Subscription
Su suscripción de Azure.
Grupo de recursos
Grupo de recursos que contendrá su recurso. Puede elegir uno existente o crear uno.
Uno de los planes de tarifa admitidos. Puede usar el nivel de servicio Gratis (F0) para probar el servicio.
Si recibe un mensaje que indica "la cuenta de inicio de sesión no es propietaria del grupo de recursos de la cuenta de almacenamiento seleccionada", la cuenta debe tener asignado un rol de propietario en el grupo de recursos para poder crear un recurso de idioma. Póngase en contacto con el propietario de la suscripción de Azure para obtener ayuda.
Para determinar el propietario de la suscripción de Azure, busque en el grupo de recursos y siga el vínculo a su suscripción asociada. A continuación:
Seleccione la pestaña Control de acceso (IAM).
Seleccione Asignaciones de roles.
Filtre por Role:Owner.
En la sección Clasificación de texto personalizado y reconocimiento de entidades con nombre personalizadas, seleccione una cuenta de almacenamiento existente o Nueva cuenta de almacenamiento. Cabe decir que estos valores son para ayudarle a empezar; no son necesariamente los valores de la cuenta de almacenamiento que querrá usar en entornos de producción. Para evitar la latencia durante la compilación del proyecto, conéctese a cuentas de almacenamiento en la misma región que el recurso de idioma.
Valor de la cuenta de almacenamiento
Valor recomendado
Nombre de la cuenta de almacenamiento
Cualquier nombre
Tipo de cuenta de almacenamiento
LRS estándar
Asegúrese de que el Aviso de IA responsable esté activado. En la parte inferior de la página, seleccione Revisar y crear.
Creación de un nuevo recurso de idioma desde Language Studio
Si es la primera vez que inicia sesión, verá una ventana en Language Studio que le permitirá elegir un recurso de idioma existente o crear uno. También puede crear un recurso; para ello, haga clic en el icono de configuración de la esquina superior derecha, seleccione Recursos y, a continuación, haga clic en Crear un nuevo recurso.
Cree un recurso de idioma con los detalles siguientes.
Asegúrese de habilitar la opción Identidad administrada al crear el recurso de idioma.
Lea y confirme el aviso de inteligencia artificial responsable.
Para usar la clasificación de texto personalizado, deberá conectar el recurso a una cuenta de almacenamiento. Cree una cuenta de almacenamiento de Azure si no tiene una. Siga estos pasos para crear el primer proyecto y conectarlo a su cuenta de almacenamiento.
Inicie sesión en Language Studio. Aparecerá una ventana que le permitirá seleccionar la suscripción y el recurso de idioma. Seleccione el recurso de idioma.
En la sección Classify text (Clasificar texto) de Language Studio, busque Custom text classification (Clasificación de texto personalizado).
Seleccione Create new project (Crear proyecto) en el menú superior de la página de proyectos. La creación de un proyecto le permitirá etiquetar datos, entrenar, evaluar, mejorar e implementar los modelos.
Después de hacer clic en Create new project (Crear proyecto), aparecerá una ventana para conectar la cuenta de almacenamiento. Si ya ha conectado una cuenta de almacenamiento, verá la cuenta de almacenamiento conectada. Si no es así, elija la cuenta de almacenamiento en la lista desplegable que aparece y seleccione Conectar cuenta de almacenamiento; esto establecerá los roles necesarios para la cuenta de almacenamiento. Este paso posiblemente devolverá un error si no está asignado como propietario en la cuenta de almacenamiento.
Nota
Solo debe realizar este paso una vez con cada nuevo recurso de idioma que use.
Este proceso es irreversible: si conecta una cuenta de almacenamiento al recurso de idioma, no podrá desconectarla más tarde.
Solo puede conectar el recurso de idioma a una cuenta de almacenamiento.
Seleccione el tipo de proyecto. Puede crear un proyecto de clasificación de varias etiquetas, donde cada documento puede pertenecer a una o varias clases, o un proyecto de clasificación de etiqueta única, donde cada documento solo puede pertenecer a una clase. El tipo seleccionado no se puede cambiar más adelante. Más información sobre los tipos de proyecto
Introduzca la información del proyecto, como el nombre, una descripción y el idioma de los documentos del proyecto. Si usa el conjunto de datos de ejemplo, seleccione Inglés. El nombre del proyecto no se podrá cambiar posteriormente. Seleccione Next (Siguiente).
Sugerencia
El conjunto de datos no tiene que estar completamente en el mismo idioma. Puede tener varios documentos, cada uno de ellos con distintos idiomas admitidos. Si el conjunto de datos contiene documentos de distintos idiomas o si espera textos en idiomas diferentes durante el tiempo de ejecución, seleccione la opción Enable multi-lingual dataset (Habilitar conjunto de datos multilingüe) al especificar la información básica del proyecto. Esta opción se puede habilitar más adelante desde la página Configuración del proyecto.
Seleccione el contenedor en el que ha cargado el conjunto de datos.
Nota
Si ya ha etiquetado los datos, asegúrese de que siguen el formato admitido y seleccione Sí, mis documentos ya están etiquetados y he formateado el archivo de etiquetas JSON, y seleccione el archivo de etiquetas en el menú desplegable siguiente.
Si usa uno de los conjuntos de datos de ejemplo, use el archivo json webOfScience_labelsFile o movieLabels incluido. Luego, seleccione Siguiente.
Revise los datos especificados y seleccione Create Project (Crear proyecto).
Puede crear un nuevo recurso y una cuenta de almacenamiento con los siguientes archivos de plantilla y parámetros de la CLI, que se hospedan en GitHub.
Edite los valores siguientes en el archivo de parámetros:
Nombre de parámetro
Descripción del valor
name
Nombre del recurso de idioma
location
Región en la que se hospeda el recurso. Consulte la compatibilidad de regiones para obtener más información.
sku
Plan de tarifa del recurso. Consulte los límites de servicio para obtener más información.
storageResourceName
Nombre de la cuenta de almacenamiento
storageLocation
Región en la que se hospeda la cuenta de almacenamiento.
El proceso de conexión de una cuenta de almacenamiento al recurso de idioma es irreversible, no se puede desconectar más adelante.
Solo puede conectar el recurso de idioma a una cuenta de almacenamiento.
Uso de un recurso de idioma existente
Requisito
Descripción
Regions
Asegúrese de que el recurso existente se haya aprovisionado en una de las regiones admitidas. Si no tiene un recurso, deberá crear uno en una región admitida.
El recurso de idioma debe tener administración de identidades. Para habilitarla mediante Azure Portal:
Vaya al recurso de idioma.
En el menú izquierdo, en la sección Administración de recursos, seleccione Identidad.
En la pestaña Asignado por el sistema, asegúrese de establecer Estado en Activado.
El recurso de idioma debe tener administración de identidades. Para habilitarla mediante Language Studio:
Seleccione el icono de configuración de la esquina superior derecha de la pantalla
Seleccione Recursos.
Active la casilla Identidad administrada del recurso de Lenguaje de Azure AI.
Habilitación de la característica de clasificación de texto personalizado
Asegúrese de habilitar las características de clasificación de texto personalizado/reconocimiento de entidades con nombre personalizadas desde Azure Portal.
En el menú izquierdo, en la sección Administración de recursos, seleccione Características.
Habilite la característica de clasificación de texto personalizado/reconocimiento de entidades con nombre personalizadas.
Conecte a su cuenta de almacenamiento.
Seleccione Aplicar.
Importante
Asegúrese de que el recurso de idioma tiene asignado el rol colaborador de datos de blobs de almacenamiento en la cuenta de almacenamiento que está conectando.
Establezca los roles del recurso de Lenguaje de Azure AI y la cuenta de almacenamiento
Siga estos pasos para establecer los roles necesarios del recurso de idioma de Azure y la cuenta de almacenamiento.
Roles para el recurso Lenguaje de Azure AI
Vaya a la cuenta de almacenamiento o recurso de idioma en Azure Portal.
Seleccione Control de acceso (IAM) en el menú de navegación izquierdo.
Seleccione Agregar para Agregar asignaciones de roles y elija el rol adecuado para la cuenta.
Debe tener asignado el rol de propietario o colaborador en el recurso de idioma.
En Asignar acceso a, seleccione Usuario, grupo o entidad de servicio.
Elija Seleccionar miembros.
Seleccione el nombre de usuario. Puede buscar por nombres de usuario en el campo Seleccionar. Repita este procedimiento para todos los roles.
Repita estos pasos con todas las cuentas de usuario que necesiten acceso a este recurso.
Roles para la cuenta de almacenamiento
Vaya a la página de la cuenta de almacenamiento en Azure Portal.
Seleccione Control de acceso (IAM) en el menú de navegación izquierdo.
Seleccione Agregar para Agregar asignaciones de roles y elija el rol colaborador de datos de blobs de almacenamiento en la cuenta de almacenamiento.
En Asignar acceso a, seleccione Identidad administrada.
Elija Seleccionar miembros.
Seleccione la suscripción e Idioma como identidad administrada. Puede buscar por nombres de usuario en el campo Seleccionar.
Importante
Si tiene una red virtual o un punto de conexión privado, asegúrese de seleccionar Permitir servicios de Azure en la lista de servicios de confianza para acceder a esta cuenta de almacenamiento en el Azure Portal.
Habilitación de CORS en la cuenta de almacenamiento
Asegúrese de permitir métodos (GET, PUT, DELETE) al habilitar el uso compartido de recursos entre orígenes (CORS).
Establezca el campo de orígenes permitidos en https://language.cognitive.azure.com. Permita todos los encabezados agregando * a los valores de encabezado permitido y establezca la antigüedad máxima en 500.
Crear un proyecto de clasificación de texto personalizado
Una vez configurados el recurso y el contenedor de almacenamiento, cree un nuevo proyecto de clasificación de texto personalizado. Un proyecto es un área de trabajo para crear modelos de inteligencia artificial personalizados basados en sus datos. A su proyecto solo puede acceder usted y otros usuarios que tengan acceso al recurso de Azure que se usa. Si ha etiquetado los datos, puede importarlos para empezar.
Inicie sesión en Language Studio. Aparecerá una ventana que le permitirá seleccionar la suscripción y el recurso de idioma. Seleccione el recurso de idioma.
En la sección Classify text (Clasificar texto) de Language Studio, busque Custom text classification (Clasificación de texto personalizado).
Seleccione Create new project (Crear proyecto) en el menú superior de la página de proyectos. La creación de un proyecto le permitirá etiquetar datos, entrenar, evaluar, mejorar e implementar los modelos.
Después de hacer clic en Create new project (Crear proyecto), aparecerá una ventana para conectar la cuenta de almacenamiento. Si ya ha conectado una cuenta de almacenamiento, verá la cuenta de almacenamiento conectada. Si no es así, elija la cuenta de almacenamiento en la lista desplegable que aparece y seleccione Conectar cuenta de almacenamiento; esto establecerá los roles necesarios para la cuenta de almacenamiento. Este paso posiblemente devolverá un error si no está asignado como propietario en la cuenta de almacenamiento.
Nota
Solo debe realizar este paso una vez con cada nuevo recurso de idioma que use.
Este proceso es irreversible: si conecta una cuenta de almacenamiento al recurso de idioma, no podrá desconectarla más tarde.
Solo puede conectar el recurso de idioma a una cuenta de almacenamiento.
Seleccione el tipo de proyecto. Puede crear un proyecto de clasificación de varias etiquetas, donde cada documento puede pertenecer a una o varias clases, o un proyecto de clasificación de etiqueta única, donde cada documento solo puede pertenecer a una clase. El tipo seleccionado no se puede cambiar más adelante. Más información sobre los tipos de proyecto
Introduzca la información del proyecto, como el nombre, una descripción y el idioma de los documentos del proyecto. Si usa el conjunto de datos de ejemplo, seleccione Inglés. El nombre del proyecto no se podrá cambiar posteriormente. Seleccione Next (Siguiente).
Sugerencia
El conjunto de datos no tiene que estar completamente en el mismo idioma. Puede tener varios documentos, cada uno de ellos con distintos idiomas admitidos. Si el conjunto de datos contiene documentos de distintos idiomas o si espera textos en idiomas diferentes durante el tiempo de ejecución, seleccione la opción Enable multi-lingual dataset (Habilitar conjunto de datos multilingüe) al especificar la información básica del proyecto. Esta opción se puede habilitar más adelante desde la página Configuración del proyecto.
Seleccione el contenedor en el que ha cargado el conjunto de datos.
Nota
Si ya ha etiquetado los datos, asegúrese de que siguen el formato admitido y seleccione Sí, mis documentos ya están etiquetados y he formateado el archivo de etiquetas JSON, y seleccione el archivo de etiquetas en el menú desplegable siguiente.
Si usa uno de los conjuntos de datos de ejemplo, use el archivo json webOfScience_labelsFile o movieLabels incluido. Luego, seleccione Siguiente.
Revise los datos especificados y seleccione Create Project (Crear proyecto).
Para empezar a crear un modelo de clasificación personalizado, debe crear un proyecto. La creación de un proyecto le permitirá etiquetar datos, entrenar, evaluar, mejorar e implementar los modelos.
Nota
El nombre del proyecto distingue mayúsculas de minúsculas para todas las operaciones.
Cree una solicitud PATCH con la dirección URL, los encabezados y el cuerpo JSON que se incluyen a continuación para crear el proyecto.
URL de la solicitud
Use la dirección URL siguiente para crear un proyecto. Reemplace los valores de los marcadores de posición por sus propios valores.
Nombre del proyecto. Este valor distingue mayúsculas de minúsculas.
myProject
{API-VERSION}
Versión de la API a la que se llama. El valor al que se hace referencia aquí se corresponde con la versión más reciente publicada. Consulte Ciclo de vida del modelo para obtener más información sobre otras versiones de API disponibles.
2022-05-01
encabezados
Use el siguiente encabezado para autenticar la solicitud.
Clave
Valor
Ocp-Apim-Subscription-Key
Clave para el recurso. Se usa para autenticar las solicitudes de API.
Body
Utilice el siguiente código JSON en la solicitud. Reemplace los valores de los marcadores de posición por sus propios valores.
Nombre del proyecto. Este valor distingue mayúsculas de minúsculas.
myProject
language
{LANGUAGE-CODE}
Una cadena que especifica el código de idioma de los documentos que se usan en el proyecto. Si el proyecto es un proyecto multilingüe, elija el código de idioma de la mayoría de los documentos. Consulte Compatibilidad de idiomas para obtener más información sobre los códigos de idioma admitidos.
en-us
projectKind
customMultiLabelClassification
El tipo de proyecto.
customMultiLabelClassification
multilingües
true
Un valor booleano que le permite tener documentos en varios idiomas del conjunto de datos y, cuando se implementa el modelo, puede consultar el modelo en cualquier idioma admitido (no necesariamente incluido en los documentos de entrenamiento. Consulte Compatibilidad de idiomas para obtener más información sobre la compatibilidad multilingüe.
true
storageInputContainerName
{CONTAINER-NAME}
Nombre del contenedor de almacenamiento de Azure donde ha cargado los documentos.
Nombre del proyecto. Este valor distingue mayúsculas de minúsculas.
myProject
language
{LANGUAGE-CODE}
Una cadena que especifica el código de idioma de los documentos que se usan en el proyecto. Si el proyecto es un proyecto multilingüe, elija el código de idioma de la mayoría de los documentos. Consulte Compatibilidad de idiomas para obtener más información sobre los códigos de idioma admitidos.
en-us
projectKind
customSingleLabelClassification
El tipo de proyecto.
customSingleLabelClassification
multilingües
true
Un valor booleano que le permite tener documentos en varios idiomas del conjunto de datos y, cuando se implementa el modelo, puede consultar el modelo en cualquier idioma admitido (no necesariamente incluido en los documentos de entrenamiento. Consulte Compatibilidad de idiomas para obtener más información sobre la compatibilidad multilingüe.
true
storageInputContainerName
{CONTAINER-NAME}
Nombre del contenedor de almacenamiento de Azure donde ha cargado los documentos.
myContainer
Esta solicitud devolverá una respuesta 201, lo que significa que el proyecto está creado.
Esta solicitud devolverá un error si:
El recurso seleccionado no tiene el permiso adecuado para la cuenta de almacenamiento.
Importación de un proyecto de clasificación de texto personalizado
Si ya ha etiquetado los datos, puede usarlos para empezar a trabajar con el servicio. Asegúrese de que los datos etiquetados siguen los formatos de datos aceptados.
Inicie sesión en Language Studio. Aparecerá una ventana que le permitirá seleccionar la suscripción y el recurso de idioma. Seleccione el recurso de idioma.
En la sección Classify text (Clasificar texto) de Language Studio, busque Custom text classification (Clasificación de texto personalizado).
Seleccione Create new project (Crear proyecto) en el menú superior de la página de proyectos. La creación de un proyecto le permitirá etiquetar datos, entrenar, evaluar, mejorar e implementar los modelos.
Después de seleccionar Create new project (Crear proyecto), aparecerá una pantalla que le permitirá conectar la cuenta de almacenamiento. Si no encuentra la cuenta de almacenamiento, asegúrese de que ha creado un recurso mediante los pasos recomendados. Si ya ha conectado una cuenta de almacenamiento al recurso de idioma, verá la cuenta de almacenamiento conectada.
Nota
Solo debe realizar este paso una vez con cada nuevo recurso de idioma que use.
Este proceso es irreversible: si conecta una cuenta de almacenamiento al recurso de idioma, no podrá desconectarla más tarde.
Solo puede conectar el recurso de idioma a una cuenta de almacenamiento.
Seleccione el tipo de proyecto. Puede crear un proyecto de clasificación de varias etiquetas, donde cada documento puede pertenecer a una o varias clases, o un proyecto de clasificación de etiqueta única, donde cada documento solo puede pertenecer a una clase. El tipo seleccionado no se puede cambiar más adelante.
Introduzca la información del proyecto, como el nombre, una descripción y el idioma de los documentos del proyecto. El nombre del proyecto no se podrá cambiar posteriormente. Seleccione Next (Siguiente).
Sugerencia
El conjunto de datos no tiene que estar completamente en el mismo idioma. Puede tener varios documentos, cada uno de ellos con distintos idiomas admitidos. Si el conjunto de datos contiene documentos de distintos idiomas o si espera textos en idiomas diferentes durante el tiempo de ejecución, seleccione la opción Enable multi-lingual dataset (Habilitar conjunto de datos multilingüe) al especificar la información básica del proyecto. Esta opción se puede habilitar más adelante desde la página Configuración del proyecto.
Seleccione el contenedor en el que ha cargado el conjunto de datos.
Seleccione Sí, mis documentos ya están etiquetados y he formateado el archivo de etiquetas JSON y seleccione el archivo de etiquetas en el menú desplegable siguiente para importar el archivo de etiquetas JSON. Asegúrese de que sigue el formato admitido.
Seleccione Siguiente.
Revise los datos especificados y seleccione Create Project (Crear proyecto).
Envíe una solicitud POST con la dirección URL, los encabezados y el cuerpo JSON que se incluyen a continuación para importar el archivo de etiquetas. Asegúrese de que el archivo de etiquetas siga el formato aceptado.
Si ya existe un proyecto con el mismo nombre, se reemplazan los datos de ese proyecto.
Nombre del proyecto. Este valor distingue mayúsculas de minúsculas.
myProject
{API-VERSION}
Versión de la API a la que se llama. El valor al que se hace referencia aquí se corresponde con la versión más reciente publicada. Obtenga más información sobre otras versiones de API disponibles
2022-05-01
encabezados
Use el siguiente encabezado para autenticar la solicitud.
Clave
Valor
Ocp-Apim-Subscription-Key
Clave para el recurso. Se usa para autenticar las solicitudes de API.
Body
Utilice el siguiente código JSON en la solicitud. Reemplace los valores de los marcadores de posición por sus propios valores.
Versión de la API a la que se llama. La versión que se use aquí debe ser la misma versión de API en la dirección URL. Obtenga más información sobre otras versiones de API disponibles
2022-05-01
projectName
{PROJECT-NAME}
Nombre del proyecto. Este valor distingue mayúsculas de minúsculas.
myProject
projectKind
customMultiLabelClassification
El tipo de proyecto.
customMultiLabelClassification
language
{LANGUAGE-CODE}
Una cadena que especifica el código de idioma de los documentos que se usan en el proyecto. Si el proyecto es un proyecto multilingüe, elija el código de idioma de la mayoría de los documentos. Consulte Compatibilidad de idiomas para obtener más información sobre la compatibilidad multilingüe.
en-us
multilingües
true
Un valor booleano que le permite tener documentos en varios idiomas del conjunto de datos y, cuando se implementa el modelo, puede consultar el modelo en cualquier idioma admitido (no necesariamente incluido en los documentos de entrenamiento. Consulte Compatibilidad de idiomas para obtener más información sobre la compatibilidad multilingüe.
true
storageInputContainerName
{CONTAINER-NAME}
Nombre del contenedor de almacenamiento de Azure donde ha cargado los documentos.
myContainer
clases
[]
Matriz que contiene todas las clases que tiene en el proyecto. Se trata de las clases en las que desea clasificar los documentos.
[]
Documentos
[]
Matriz que contiene todos los documentos del proyecto y cuáles son las clases etiquetadas en este documento.
[]
ubicación
{DOCUMENT-NAME}
Ubicación de los documentos en el contenedor de almacenamiento. Puesto que todos los documentos están en la raíz del contenedor, este debe ser el nombre del documento.
doc1.txt
dataset
{DATASET}
Conjunto de pruebas al que este documento irá cuando se divida antes del entrenamiento. Consulte Entrenamiento de un modelo para obtener información sobre la división de datos. Los valores posibles que admite este campo son Train y Test.
Versión de la API a la que se llama. La versión que se use aquí debe ser la misma versión de API en la dirección URL.
2022-05-01
projectName
{PROJECT-NAME}
Nombre del proyecto. Este valor distingue mayúsculas de minúsculas.
myProject
projectKind
customSingleLabelClassification
El tipo de proyecto.
customSingleLabelClassification
language
{LANGUAGE-CODE}
Una cadena que especifica el código de idioma de los documentos que se usan en el proyecto. Si el proyecto es un proyecto multilingüe, elija el código de idioma de la mayoría de los documentos. Consulte Compatibilidad de idiomas para obtener más información sobre los códigos de idioma admitidos.
en-us
multilingües
true
Un valor booleano que le permite tener documentos en varios idiomas del conjunto de datos y, cuando se implementa el modelo, puede consultar el modelo en cualquier idioma admitido (no necesariamente incluido en los documentos de entrenamiento. Consulte Compatibilidad de idiomas para obtener más información sobre la compatibilidad multilingüe.
true
storageInputContainerName
{CONTAINER-NAME}
Nombre del contenedor de almacenamiento de Azure donde ha cargado los documentos.
myContainer
clases
[]
Matriz que contiene todas las clases que tiene en el proyecto. Se trata de las clases en las que desea clasificar los documentos.
[]
Documentos
[]
Matriz que contiene todos los documentos del proyecto y a qué clase pertenece este documento.
[]
ubicación
{DOCUMENT-NAME}
Ubicación de los documentos en el contenedor de almacenamiento. Puesto que todos los documentos están en la raíz del contenedor, este debe ser el nombre del documento.
doc1.txt
dataset
{DATASET}
Conjunto de pruebas al que este documento irá cuando se divida antes del entrenamiento. Consulte Entrenamiento de un modelo para obtener más información sobre la división de datos. Los valores posibles que admite este campo son Train y Test.
Train
Una vez que envíe la solicitud de API, recibirá una respuesta 202 que indica que el trabajo se ha enviado correctamente. En los encabezados de respuesta, extraiga el valor operation-location. Tendrá el formato siguiente:
{JOB-ID} se usa para identificar la solicitud, ya que esta operación es asincrónica. Usará esta dirección URL para obtener el estado del trabajo de importación.
Posibles escenarios de error de esta solicitud:
El recurso seleccionado no tiene los permisos adecuados para la cuenta de almacenamiento.
El valor de storageInputContainerName especificado no existe.
Se ha usado un código de idioma no válido, o el tipo de código de idioma no es una cadena.
El valor de multilingual es una cadena y no un valor booleano.
Vaya a la página de configuración del proyecto en Language Studio.
Puede ver los detalles del proyecto.
En esta página puede actualizar la descripción del proyecto y habilitar o deshabilitar el conjunto de datos multilingüe en la configuración del proyecto.
También puede ver la cuenta de almacenamiento conectada y el contenedor en el recurso de idioma.
Igualmente, puede recuperar la clave de recurso principal en esta página.
Para obtener detalles del proyecto de clasificación de texto personalizado, envíe una solicitud GET usando la dirección URL y los encabezados siguientes. Reemplace los valores de los marcadores de posición por sus propios valores.
Este valor puede ser customSingleLabelClassification o customMultiLabelClassification.
storageInputContainerName
{CONTAINER-NAME}
Nombre del contenedor de almacenamiento de Azure donde ha cargado los documentos.
myContainer
projectName
{PROJECT-NAME}
Nombre del proyecto. Este valor distingue mayúsculas de minúsculas.
myProject
multilingual
Valor booleano que permite tener documentos en varios idiomas en el conjunto de datos. Cuando el modelo se implementa, se puede consultar en cualquier idioma admitido (no necesariamente incluido en los documentos de entrenamiento). Para obtener más información sobre la compatibilidad multilingüe, consulte Compatibilidad de idiomas.
true
language
{LANGUAGE-CODE}
Cadena que especifica el código de idioma de los documentos que se usan en el proyecto. Si el proyecto es un proyecto multilingüe, elija el código de idioma de la mayoría de los documentos. Consulte Compatibilidad de idiomas para obtener más información sobre los códigos de idioma admitidos.
en-us
Una vez que envíe la solicitud de API, recibirá una respuesta 200 que indica que se ha realizado correctamente y el cuerpo de la respuesta JSON con los detalles del proyecto.
Cuando ya no necesite el proyecto, puede eliminarlo mediante Language Studio. Seleccione Clasificación de texto personalizado en la parte superior y, a continuación, seleccione el proyecto que quiere eliminar. Seleccione Eliminar en el menú superior para eliminar el proyecto.
Cuando ya no necesite el proyecto, puede eliminarlo con la siguiente solicitud DELETE. Reemplace los valores de los marcadores de posición por sus propios valores.
Nombre del proyecto. Este valor distingue mayúsculas de minúsculas.
myProject
{API-VERSION}
Versión de la API a la que se llama. El valor al que se hace referencia aquí se corresponde con la versión más reciente publicada. Obtenga más información sobre otras versiones de API disponibles
2022-05-01
encabezados
Use el siguiente encabezado para autenticar la solicitud.
Clave
valor
Ocp-Apim-Subscription-Key
Clave para el recurso. Se usa para autenticar las solicitudes de API.
Una vez que envíe la solicitud de API, recibirá una respuesta 202 que indica que se ha realizado correctamente, lo que significa que el proyecto se ha eliminado. Una llamada correcta devuelve un encabezado Operation-Location que se usa para comprobar el estado del trabajo.
Pasos siguientes
Debe tener una idea del esquema de proyecto que usará para etiquetar los datos.
Una vez creado el proyecto, puede empezar a etiquetar los datos, lo que informará al modelo de clasificación de texto sobre cómo interpretar el texto y se usará para el entrenamiento y la evaluación.