Principios de diseño de cargas de trabajo de aplicaciones inteligentes
La orientación sobre planificación, desarrollo y mantenimiento de cargas de trabajo de aplicaciones inteligentes se basa en Well-Architected y sus cinco pilares de excelencia arquitectónica. Power Platform
Pilar de buena arquitectura | Resumen |
---|---|
Fiabilidad | Una carga de trabajo de aplicación inteligente requiere resiliencia en la arquitectura capa para garantizar que los modelos y flujos de trabajo de IA tengan alta disponibilidad y puedan recuperarse rápidamente de fallas. Implementar mecanismos robustos de manejo de errores. Una arquitectura resiliente también mantiene la integridad de los datos utilizados por los modelos de IA, lo que garantiza resultados consistentes y precisos. |
Seguridad | Una carga de trabajo de aplicación inteligente a menudo maneja datos confidenciales. Proteja los datos confidenciales utilizados y generados por los modelos de IA. Implementar cifrado, controles de acceso y auditorías de seguridad periódicas. Asegúrese de que la carga de trabajo cumpla con los estándares regulatorios relevantes, como RGPD (Reglamento general de protección de datos) y HIPAA (Ley de Portabilidad y Responsabilidad del Seguro Médico), para proteger la privacidad y los datos del usuario. |
Eficiencia en el rendimiento | Una carga de trabajo de aplicación inteligente debe estar diseñada para escalar sin problemas a medida que aumentan los volúmenes de datos y las demandas de los usuarios. Identificar métricas de rendimiento clave e implementar el monitoreo para seguir el progreso hacia el logro de los objetivos de rendimiento de la carga de trabajo. En el contexto de las cargas de trabajo de aplicaciones inteligentes, el rendimiento también tiene en cuenta la cantidad de solicitudes e interacciones que se pueden completar a través del autoservicio, que de otro modo requerirían intervención humana. |
Excelencia operativa | Una carga de trabajo de aplicación inteligente requiere una supervisión y un registro exhaustivos para rastrear el rendimiento y el estado de los modelos de IA, los flujos de trabajo y las conversaciones. El monitoreo ayuda a identificar y resolver problemas rápidamente. El pilar de Excelencia Operacional recomienda utilizar la automatización para agilizar las operaciones, reducir la intervención manual y minimizar el riesgo de error humano. |
Optimización de la experiencia | Una carga de trabajo de aplicación inteligente debe priorizar el diseño de la conversación para garantizar una experiencia fácil de usar que permita a los usuarios alcanzar sus objetivos con el mínimo esfuerzo. El diseño debe tener en cuenta temas que la IA generativa no puede manejar e incorporar mecanismos de respaldo. También se deben implementar mecanismos para recopilar retroalimentación de los usuarios y perfeccionar continuamente los modelos de IA y la carga de trabajo en función de esta retroalimentación. |
Confiabilidad
Al diseñar una carga de trabajo de aplicación inteligente con Power Platform, concéntrese en la resiliencia y la disponibilidad.
- La resiliencia es la capacidad de un sistema de recuperarse de fallas y continuar funcionando.
- La disponibilidad garantiza un tiempo de funcionamiento ininterrumpido. La alta disponibilidad minimiza el tiempo de inactividad de las aplicaciones y mejora la recuperación ante incidentes.
La confiabilidad es importante en el desarrollo de cualquier carga de trabajo y la IA generativa no es una excepción. De hecho, hay factores únicos a tener en cuenta al diseñar cargas de trabajo de IA generativa. Reconocer y enfatizar la resiliencia es esencial para las cargas de trabajo de IA generativa para garantizar la disponibilidad organizacional y mantener la continuidad del negocio.
Pueden ocurrir fallos en la nube. En lugar de intentar prevenir las fallas por completo, su objetivo debería ser minimizar los efectos de un solo componente defectuoso. Utilice la siguiente información para minimizar el tiempo de inactividad y garantizar que las prácticas recomendadas para una alta disponibilidad estén incorporadas en la carga de trabajo de su aplicación inteligente:
- Asegúrese de que la carga de trabajo pueda manejar fallas y continuar funcionando, incluso si la funcionalidad es reducida. Identificar fallas potenciales y hacer que el sistema sea resiliente, para tolerar y recuperarse de estas fallas.
- Haga que la carga de trabajo sea observable para que los equipos de desarrollo aprendan de los errores. Identifique y aborde rápidamente los problemas implementando mecanismos de monitoreo, registro y alerta.
- Asegúrese de que la carga de trabajo pueda escalar para manejar cargas variables, lo que es especialmente importante para las cargas de trabajo de IA que pueden tener demandas fluctuantes.
- Implementar mecanismos robustos de manejo y recuperación de errores. Configure alertas automatizadas para fallas del sistema y tenga un plan claro para una recuperación rápida.
- Valide la arquitectura y la escala de destino comprendiendo los volúmenes objetivo de mensajes de chat o conversaciones. Los volúmenes objetivo también ayudan a validar los aspectos de licencia de la aplicación inteligente y el efecto potencial en el almacenamiento de las transcripciones de conversaciones. Dataverse
Para las aplicaciones inteligentes que utilizan capacidades de IA generativa, considere no solo la resiliencia y la disponibilidad, sino también la confiabilidad y precisión de las respuestas proporcionadas por la carga de trabajo inteligente. Tenga en cuenta las siguientes recomendaciones para cada consideración de diseño:
- Optimice para la recuperación de generación aumentada (RAG): asegúrese de que sus datos estén limpios y bien estructurados, cree incrustaciones e índices eficientes para una recuperación rápida e implemente mecanismos sólidos de monitoreo y retroalimentación para mejorar continuamente el rendimiento de la carga de trabajo.
- Indicaciones efectivas :Diseñe indicaciones precisas y contextualmente relevantes para guía la IA para producir respuestas precisas.
- Evaluación periódica :Implementar el monitoreo y la prueba continuos de los resultados de la IA para evaluar la precisión, la relevancia y el cumplimiento ético.
- Bucles de retroalimentación :Establecer mecanismos de retroalimentación donde los usuarios puedan reportar imprecisiones, que luego puedan usarse para refinar y mejorar los modelos. Microsoft Copilot Studio proporciona Análisis de la satisfacción del cliente, que brindan información útil sobre los factores que impulsan la satisfacción o insatisfacción con las respuestas de su copiloto.
- Capacitación específica del dominio :Ajustar modelos en datos específicos del dominio para mejorar la precisión en contextos específicos.
- Actualizaciones periódicas :Actualizar periódicamente los modelos con nuevos datos para mantener su relevancia y precisión.
- Intenciones no reconocidas: maneje las intenciones no reconocidas mediante el uso de Respuestas generativas para encontrar respuestas en las fuentes de datos disponibles y mediante el uso de agente por chat para integrar con otros sistemas.
Seguridad
En un modelo de responsabilidad compartida:
- Las organizaciones son las principales responsables de gestionar y operar las cargas de trabajo.
- Microsoft administra la seguridad de la infraestructura subyacente, incluidos los centros de datos, la seguridad de la red, las medidas de seguridad física y las funciones de seguridad integradas, como el cifrado, la gestión de identidad y el cumplimiento de los estándares de la industria. Obtenga más información en Seguridad en Microsoft Power Platform y Copilot Studio Seguridad y gobernanza.
Le recomendamos que evalúe periódicamente los servicios y las tecnologías para garantizar que su postura de seguridad se adapte al cambiante panorama de amenazas. Establecer una comprensión clara del modelo de responsabilidad compartida con los proveedores es esencial a la hora de colaborar para implementar medidas de seguridad.
Puede emplear varios métodos para proteger las cargas de trabajo de sus aplicaciones inteligentes:
- Autenticación de usuarios y control de acceso: Implemente medidas sólidas de autenticación y control de acceso para garantizar que solo los usuarios autorizados puedan acceder a la carga de trabajo de la aplicación inteligente. El acceso no autorizado a la carga de trabajo de la aplicación inteligente puede provocar violaciones de datos, uso indebido de recursos y posible exposición de información confidencial. Los mecanismos de autenticación débiles o ineficaces también podrían provocar que las cuentas de usuario se vean comprometidas.
- Cumplimiento: garantizar que los datos estén protegidos y gestionados de conformidad con los requisitos reglamentarios. Comprenda las regulaciones locales, manténgase informado sobre las leyes locales de protección de datos y asegúrese de que su estrategia de residencia de datos cumpla con estas regulaciones.
- Integración: Proteja todas las integraciones con los principales del servicio. Supervise y controle la integridad de la red de puntos finales internos y externos a través de capacidades y dispositivos de seguridad, como firewalls o firewalls de aplicaciones web.
- Monitoreo y auditoría continuos: Monitorear y auditar continuamente las actividades de las cargas de trabajo para detectar y responder de manera proactiva.
- Herramientas de seguridad de Azure: use las herramientas de seguridad integradas de Azure, como Microsoft Defender for Cloud y Azure Policy, para supervisar y aplicar políticas de seguridad.
- Capacitación de los empleados: capacite a los empleados sobre las mejores prácticas de protección de datos y la importancia de cumplir con los requisitos de residencia de datos.
Eficiencia en el desempeño
La eficiencia del rendimiento es la capacidad de su carga de trabajo de escalar eficientemente para satisfacer las demandas que le imponen los usuarios.
Aumente la eficiencia del rendimiento mediante:
- Comprender los volúmenes objetivo para validar la arquitectura y la escala objetivo. Los volúmenes objetivo también ayudan a validar los aspectos de licencia del copiloto y el efecto potencial en el almacenamiento de transcripciones de conversaciones. Dataverse
- Comprender los límites de la plataforma. Al integrar la carga de trabajo de su aplicación inteligente con sistemas externos, por ejemplo a través de solicitudes HTTP, es importante validar que cada componente pueda manejar la carga. Power Automate
- Supervisión continua del rendimiento y detección de anomalías mediante herramientas como Azure Monitor, Log Analytics, Application Insights y alertas.
- Comprender los tiempos respuesta esperados para:
- Primera carga de chat y primer mensaje respuesta
- Latencia máxima para que el copiloto responda las consultas del usuario
- Enfoque para gestionar acciones de larga duración (por ejemplo, esperar a que un sistema externo devuelva datos)
- Optimizar la tasa de desvío, o la velocidad a la que se completan las solicitudes de forma autoservicio gracias a la automatización (reduciendo la cantidad de solicitudes que requieren asistencia proteger). Obtenga más información en Optimización del rendimiento para cargas de trabajo de aplicaciones inteligentes.
Considerar cada uno de estos aspectos le ayudará a crear una carga de trabajo de aplicación inteligente con una experiencia de usuario consistente y cohesiva.
Excelencia operativa
La excelencia operativa implica desarrollar procesos eficientes para respaldar la carga de trabajo de su aplicación inteligente.
Las fallas operativas pueden afectar otras áreas de diseño, así como el éxito general de la carga de trabajo de la aplicación inteligente. Es importante adaptar sus procesos operativos para soportar una carga de trabajo de aplicaciones inteligentes en producción. Las siguientes recomendaciones impulsan la excelencia operativa:
- Automatice los procesos de compilación y lanzamiento. Los procesos de compilación y lanzamiento totalmente automatizados reducen la fricción y aumentan la velocidad de implementación de actualizaciones, brindando repetibilidad y consistencia en todos los entornos. La automatización acorta el proceso, desde que los desarrolladores impulsan cambios hasta que obtienen información sobre la calidad del código, la cobertura de las pruebas, la resiliencia, la seguridad y el rendimiento, todo lo cual contribuye a la productividad del desarrollador.
- Mantener la gobernanza y el cumplimiento.
- Analice el rendimiento y la salud de su ambiente en producción.
- Mantener documentación que capture:
- Procedimientos de solución de problemas
- Planes de recuperación ante desastres
- Proporcionar orientación sobre cómo acelerar el proceso de resolución de problemas.
- Adoptar la mejora operativa continua. Priorizar la mejora rutinaria del sistema y la experiencia del usuario. Utilice un modelo de salud para comprender y medir la eficiencia operativa, junto con mecanismos de retroalimentación para permitir que los equipos de aplicaciones comprendan y aborden las brechas de manera iterativa.
Estas recomendaciones pueden ayudar a su equipo a colaborar de manera eficiente y transparente.
Optimización de la experiencia
Una carga de trabajo de aplicación inteligente debe priorizar el diseño de la conversación para garantizar una experiencia fácil de usar que permita a los usuarios alcanzar sus objetivos con el mínimo esfuerzo. El diseño debe abordar temas que la IA generativa no puede manejar e incluir mecanismos de respaldo. También se deben implementar mecanismos para recopilar retroalimentación de los usuarios y perfeccionar continuamente los modelos de IA y la carga de trabajo en función de esta retroalimentación.
Optimizar la experiencia del usuario para una carga de trabajo de aplicación inteligente implica varias consideraciones clave:
Diseño de conversación :Diseñe conversaciones que sean intuitivas y fáciles de navegar. Utilice un lenguaje claro y conciso y asegúrese de que la IA pueda gestionar las consultas comunes de los usuarios de manera eficaz. Nos centramos en ayudar a los usuarios a alcanzar sus objetivos con el mínimo esfuerzo. Comprenda las intenciones del usuario y proporcione respuestas relevantes rápidamente para garantizar una experiencia de usuario fluida y eficiente.
Manejo de limitaciones: Implementar mecanismos de respaldo para temas que la IA generativa no puede manejar, como redirigir a los usuarios a agentes humanos o proporcionar recursos alternativos. Diseñe procesos robustos de manejo de errores para gestionar entradas inesperadas con elegancia. Informar a los usuarios cuando la IA no puede procesar su solicitud y ofrecer alternativas.
Retroalimentación del usuario: Integrar mecanismos para recopilar retroalimentación de los usuarios de forma continua. Microsoft Copilot Studio proporciona análisis de satisfacción del cliente que proporcionan información útil sobre los impulsores de la satisfacción o insatisfacción con las respuestas de su copiloto. Utilice los comentarios recopilados para refinar y mejorar los modelos de IA y la carga de trabajo general. Las actualizaciones periódicas basadas en las aportaciones del usuario pueden mejorar significativamente la experiencia del usuario.
Personalización y personalización: personalice las indicaciones y las instrucciones para alinear con sus casos de uso específicos y las necesidades del usuario, para garantizar respuestas más precisas y relevantes. Utilice encadenamiento dinámico para automatizar activadores y administrar flujos tema de manera eficiente para reducir la necesidad de temas predefinidos manualmente y mejorar la capacidad de la IA para reconocer la intención del usuario. Obtenga más información en Optimizar indicaciones y configuración de tema.
Pasos siguientes
Los principios de diseño de Well-Architected Framework se incorporan en las áreas de diseño de cargas de trabajo de aplicaciones inteligentes. Cada área de diseño proporciona orientación específica para ayudarlo a acceder rápidamente a la información que necesita para mejorar la productividad de manera eficiente.
Comience por revisar las consideraciones de diseño que se necesitan para soportar una carga de trabajo: