Compartir vía


Recomendaciones de administración para cargas de trabajo de IA en Azure

En este artículo se ofrecen recomendaciones de administración para organizaciones que ejecutan cargas de trabajo de IA en Azure. Se centra en las soluciones de plataforma como servicio (PaaS) de IA de Azure, incluidos Inteligencia artificial de Azure Studio, Azure OpenAI, Azure Machine Learning y Azure AI Services. Cubre cargas de trabajo de IA generativas y no generativas.

La administración eficaz de las cargas de trabajo de IA en Azure implica supervisar la implementación, el rendimiento del modelo, las operaciones, los datos y la recuperación ante desastres para respaldar sus cargas de trabajo de IA. Una administración adecuada ayuda a garantizar que las cargas de trabajo de IA sean fiables, dignas de confianza y seguras durante todo su ciclo de vida.

administre las implantaciones de IA

La administración de las implementaciones de IA ayuda a los equipos de cargas de trabajo a pasar de las fases de prueba de concepto a los entornos de producción con configuraciones coherentes que mejoran la seguridad y el cumplimiento en todos los equipos. Azure ofrece herramientas como hubs y proyectos de Inteligencia artificial de Azure Studio para reforzar la gobernanza y la seguridad. Azure Machine Learning tiene capacidades similares con sus espacios de trabajo centrales. Para obtener más información, consulte Administrar implementaciones de IA.

Administración de modelos de IA

La administración de los modelos de IA incluye la supervisión de sus resultados, rendimiento y alineación con los principios de IA responsable. Los modelos de IA pueden desviarse con el tiempo debido a cambios en los datos, comportamientos de los usuarios u otros factores externos. Si no se tienen en cuenta, estos cambios pueden dar lugar a resultados inexactos o a problemas éticos.

  • Supervisar los resultados de los modelos. Implemente un proceso de supervisión y prueba para garantizar que estas cargas de trabajo se mantienen alineadas con sus objetivos de IA responsable.

    • Supervise la IA generativa. Para cargas de trabajo de IA generativa, utilice las capacidades de evaluación y supervisión manual integradas de Inteligencia artificial de Azure Studio. Si utiliza prompt flow, supervise las implementaciones de flujo de avisos. Considere también el uso de herramientas de IA responsables para complementar la supervisión de modelos.

    • Supervise la IA no generativa. Para las cargas de trabajo de IA no generativa, supervise las etapas de procesamiento de datos y las métricas de rendimiento del modelo para garantizar que las predicciones sigan siendo precisas y fiables. Habilite la supervisión de modelos en Azure Machine Learning. Para los servicios de Azure AI, active la supervisión para cada servicio de AI que utilice.

  • Supervise el rendimiento del modelo. Cuando se detecta una caída en el rendimiento o la precisión, la supervisión ayuda a identificar el origen del problema. Al igual que con todas las cargas de trabajo, utilice Azure Monitor y Application Insights para supervisar el rendimiento de las cargas de trabajo de IA.

    • Supervise el rendimiento de la IA generativa. En la IA generativa, supervise la latencia en los tiempos de respuesta o la precisión de los resultados de vector de búsqueda para mejorar las experiencias de los usuarios. En la Inteligencia artificial de Azure Studio, active el rastreo para recopilar datos de seguimiento de cada solicitud, métricas agregadas y comentarios de los usuarios.

    • Supervise el rendimiento de la IA no generativa. Capture las métricas de rendimiento de los modelos desplegados en Azure Machine Learning. Para los servicios de Azure AI, active el registro de diagnóstico para cada servicio de Azure AI.

  • Considere una puerta de enlace de IA generativa para la supervisión. Un proxy inverso como Azure API Management le permite implementar el registro y la supervisión que no son nativos de la plataforma. API Management le permite recopilar IP de origen, texto de entrada y texto de salida. Para obtener más información, consulte Implementación de registro y supervisión para modelos de lenguaje de Azure OpenAI Service.

Administración de operaciones de IA

La administración de las operaciones de IA implica la estandarización de los recursos informáticos y la supervisión de los recursos de plataforma para las cargas de trabajo de Azure AI. Garantiza que los equipos utilicen los recursos informáticos correctos de forma eficiente y capturen métricas y registros de los recursos de plataforma.

  • Supervise los recursos de plataforma. Utilice la configuración de diagnóstico para capturar registros y métricas de todos los servicios clave, como Inteligencia artificial de Azure Studio, Azure Machine Learning y los servicios de Azure AI. Los servicios específicos deben capturar registros de auditoría y registros relevantes específicos del servicio. Implemente alertas de supervisión personalizadas basadas en las necesidades específicas de su arquitectura. Los ejemplos incluyen alertas para registros de contenedores, servicios de Machine Learning y operaciones del servicio Azure OpenAI.

  • Estandarice la administración de procesos. Necesita recursos de procesos para determinadas acciones, como flujos de avisos y modelos de entrenamiento. Un servicio como Machine Learning tiene diferentes opciones de procesos, como instancias de procesos, clústeres y opciones sin servidor. Estandarice el tipo de cálculo, los tiempos de ejecución y los periodos de desconexión. Para conocer las opciones de cómputo específicas del servicio, consulte Inteligencia artificial de Azure Studio y Machine Learning.

Administrar datos de IA

Los datos de alta calidad son la base de los modelos de IA precisos. El seguimiento de el desfase de los modelos ayuda a mantener la relevancia de las predicciones de IA a lo largo del tiempo y permite a las organizaciones adaptar los modelos según sea necesario para reflejar las condiciones actuales.

  • Supervise el desfase de los datos. Realice un seguimiento continuo de la precisión y el desfase de los datos en la IA generativa y no generativa para garantizar que los modelos siguen siendo relevantes. La supervisión puede alertarle cuando las predicciones del modelo o las respuestas del modelo de lenguaje amplio se desvían del comportamiento esperado. Esta desviación indica la necesidad de reentrenamiento o ajuste. Configure alertas personalizadas para detectar umbrales de rendimiento. Este enfoque permite una intervención temprana cuando surgen problemas. Utilice evaluaciones en Inteligencia artificial de Azure Studio y métricas compatibles con Machine Learning.

  • Garantice un procesamiento de datos de calidad. Para el aprendizaje automático, los datos de entrenamiento deben estar formateados, limpios y listos para el consumo del modelo. Para la IA generativa, los datos de base deben estar en el formato correcto, y probablemente fragmentados, enriquecidos e integrados para el consumo del modelo de IA. Para obtener más información, consulte la Guía para el diseño y desarrollo de una solución RAG.

Administración de continuidad empresarial

Implemente implementaciones multirregión para garantizar una alta disponibilidad y resistencia para los sistemas de IA generativa y no generativa Para obtener más información, consulte Implementación multirregión en Inteligencia artificial de Azure Studio, Azure Machine Learning y Azure OpenAI.

Paso siguiente