Compartir a través de


Cómo realizar bancos de pruebas de modelos en Estudio de IA de Azure

Importante

Los elementos marcados (versión preliminar) en este artículo se encuentran actualmente en versión preliminar pública. Esta versión preliminar se ofrece sin acuerdo de nivel de servicio y no se recomienda para las cargas de trabajo de producción. Es posible que algunas características no sean compatibles o que tengan sus funcionalidades limitadas. Para más información, consulte Términos de uso complementarios de las Versiones Preliminares de Microsoft Azure.

En este artículo, aprenderá a comparar bancos de pruebas en modelos y conjuntos de datos mediante la herramienta Bancos de pruebas de modelos en Estudio de IA de Azure. También aprenderá a analizar los resultados del banco de pruebas y a realizar bancos de pruebas con los datos. Los bancos de pruebas pueden ayudarle a tomar decisiones fundamentadas sobre qué modelos cumplen los requisitos de su caso de uso o aplicación específicos.

Requisitos previos

Acceso a bancos de pruebas de modelos mediante el catálogo de modelos

Azure AI admite bancos de pruebas de modelos para los modelos seleccionados que se usan con más frecuencia y populares. Siga estos pasos para usar resultados de bancos de pruebas detallados para comparar y seleccionar modelos directamente desde el catálogo de modelos de Estudio de IA:

  1. Inicie sesión en Azure AI Studio.
  2. Si aún no está en el proyecto, selecciónelo.
  3. Seleccione Catálogo de modelos en el panel de navegación izquierdo.
  1. Seleccione el modelo que le interesa. Por ejemplo, seleccione gpt-4o. Esta acción abre la página de información general del modelo.

    Sugerencia

    En el catálogo de modelos, puede mostrar los modelos que tienen bancos de pruebas disponibles mediante el filtro Colecciones y seleccionando Resultados del banco de pruebas. Estos modelos tienen un icono de bancos de pruebas similar a un histograma.

  2. Vaya a la pestaña Bancos de pruebas para comprobar los resultados del banco de pruebas de modelo.

    Recorte de pantalla que muestra la pestaña de bancos de pruebas para gpt-4o.

  3. Vuelva a la página principal del catálogo de modelos.

  4. Seleccione Comparar modelos en la página principal del catálogo de modelos para explorar modelos con compatibilidad con bancos de pruebas, ver sus métricas y analizar las ventajas entre los diferentes modelos. Este análisis puede informar sobre la selección del modelo que mejor se adapte a sus requisitos.

    Recorte de pantalla que muestra el botón de comparación de modelos en la página principal del catálogo de modelos.

  5. Seleccione las tareas deseadas y especifique las dimensiones de interés, como Calidad de IA frente a Costo, para evaluar las ventajas entre los diferentes modelos.

  6. Puede cambiar a la vista de lista para obtener acceso a resultados más detallados de cada modelo.

    Recorte de pantalla que muestra un ejemplo de la vista de comparación de bancos de pruebas.

Análisis de los resultados del banco de pruebas

Cuando se encuentra en la pestaña "Bancos de pruebas" de un modelo específico, puede recopilar información amplia para comprender e interpretar mejor los resultados del banco de pruebas, entre los que se incluyen:

  • Puntuaciones agregadas generales: estas puntuaciones de la calidad de la inteligencia artificial, el costo, la latencia y el rendimiento proporcionan una visión general rápida del rendimiento del modelo.

  • Gráficos comparativos: estos gráficos muestran la posición relativa del modelo en comparación con los modelos relacionados.

  • Tabla de comparación de métricas: esta tabla presenta resultados detallados de cada métrica.

    Recorte de pantalla que muestra la pestaña de bancos de pruebas para gpt-4o.

De manera predeterminada, Estudio de IA muestra un índice promedio en varias métricas y conjuntos de datos para proporcionar información general de alto nivel sobre el rendimiento del modelo.

Para acceder a los resultados del banco de pruebas para una métrica y un conjunto de datos específicos:

  1. Seleccione el botón Expandir del gráfico. El gráfico de comparación emergente revela información detallada y ofrece mayor flexibilidad para la comparación.

    Recorte de pantalla que muestra el botón Expandir para seleccionar un gráfico de comparación detallado.

  2. Seleccione la métrica de su interés y elija diferentes conjuntos de datos, en función de su escenario específico. Para obtener definiciones más detalladas de las métricas y descripciones de los conjuntos de datos públicos usados para calcular los resultados, seleccione Leer más.

    Recorte de pantalla que muestra el gráfico de comparación con una métrica y un conjunto de datos específicos.

Evaluación de los resultados del banco de pruebas con sus datos

En las secciones anteriores, se muestran los resultados del banco de pruebas calculados por Microsoft mediante el uso de conjuntos de datos públicos. Sin embargo, puede probar a volver a generar el mismo conjunto de métricas con sus datos.

  1. Vuelva a la pestaña Bancos de pruebas en la tarjeta del modelo.

  2. Seleccione Probar con sus propios datos para evaluar el modelo con sus datos. La evaluación con sus datos le ayuda a ver cómo funciona el modelo en sus escenarios específicos.

    Recorte de pantalla que muestra el botón para seleccionar la evaluación con sus propios datos.