Principios de diseño de cargas de trabajo de aplicaciones inteligentes
La orientación sobre la planificación, el desarrollo y el mantenimiento de cargas de trabajo de aplicaciones inteligentes se basa en la Buena arquitectura de Power Platform y sus cinco pilares de excelencia arquitectónica.
Pilar de buena arquitectura | Resumen |
---|---|
Fiabilidad | Una carga de trabajo de aplicaciones inteligente requiere resiliencia en la capa de arquitectura para garantizar que los modelos y flujos de trabajo de IA tengan una alta disponibilidad y puedan recuperarse rápidamente de los errores. Implemente mecanismos sólidos de control de errores. Una arquitectura resiliente también mantiene la integridad de los datos utilizados por los modelos de IA, lo que garantiza resultados coherentes y precisos. |
Seguridad | Una carga de trabajo de aplicaciones inteligente a menudo maneja datos confidenciales. Proteja los datos confidenciales utilizados y generados por los modelos de IA. Implemente cifrado, controles de acceso y auditorías de seguridad periódicas. Asegúrese de que la carga de trabajo cumpla con los estándares normativos pertinentes, como RGPD (Reglamento general de protección de datos) e HIPAA (Ley de Portabilidad y Responsabilidad de Seguros Médicos), para proteger la privacidad y los datos de los usuarios. |
Eficiencia en el rendimiento | Una carga de trabajo de aplicación inteligente debe diseñarse para escalar sin problemas con el aumento de los volúmenes de datos y las demandas de los usuarios. Identifique las métricas clave de rendimiento e implemente la supervisión para realizar un seguimiento del progreso hacia el logro de los objetivos de rendimiento de la carga de trabajo. En el contexto de las cargas de trabajo de aplicaciones inteligentes, el rendimiento también tiene en cuenta el número de solicitudes e interacciones que se pueden completar a través del autoservicio, que de otro modo requeriría la intervención humana. |
Excelencia operativa | Una carga de trabajo de aplicaciones inteligente requiere una supervisión y un registro exhaustivos para realizar un seguimiento del rendimiento y el estado de los modelos, los flujos de trabajo y las conversaciones de IA. La supervisión ayuda a identificar y resolver problemas rápidamente. El pilar de excelencia operativa recomienda utilizar la automatización para optimizar las operaciones, reducir la intervención manual y minimizar el riesgo de error humano. |
Optimización de experiencia | Una carga de trabajo de aplicación inteligente debe priorizar el diseño de conversaciones para garantizar una experiencia fácil de usar que permita a los usuarios alcanzar sus objetivos con el mínimo esfuerzo. El diseño debe tener en cuenta los temas que la IA generativa no puede manejar e incorporar mecanismos alternativos. Implemente también mecanismos para recopilar comentarios de los usuarios y perfeccionar continuamente los modelos de IA y la carga de trabajo en función de estos comentarios. |
Confiabilidad
Cuando diseñe una carga de trabajo de aplicación inteligente con Power Platform, concéntrese en la resiliencia y la disponibilidad.
- Resistencia es la capacidad de un sistema para recuperarse de los fallos y seguir funcionando.
- La disponibilidad garantiza un tiempo de actividad ininterrumpido. La alta disponibilidad minimiza el tiempo de inactividad de las aplicaciones y mejora la recuperación de incidentes.
La fiabilidad es importante en el desarrollo de cualquier carga de trabajo, y la IA generativa no es una excepción. De hecho, hay factores únicos que hay que tener en cuenta a la hora de diseñar cargas de trabajo de IA generativa. Reconocer y enfatizar la resiliencia es esencial para que las cargas de trabajo de IA generativa garanticen la disponibilidad de la organización y mantengan la continuidad del negocio.
Los errores pueden ocurrir en la nube. En lugar de tratar de evitar los errores por completo, su objetivo debe ser minimizar los efectos de un solo componente que falla. Utilice la siguiente información para minimizar el tiempo de inactividad y asegurarse de que las prácticas recomendadas para la alta disponibilidad estén integradas en la carga de trabajo de su aplicación inteligente:
- Asegúrese de que la carga de trabajo pueda controlar errores y seguir funcionando, incluso si su funcionalidad es reducida. Identifique posibles fallos y haga que el sistema sea resistente, para tolerar y recuperarse de estos fallos.
- Haga que la carga de trabajo sea observable para que los equipos de desarrollo aprendan de los errores. Identifique y aborde rápidamente los problemas mediante la implementación de mecanismos de supervisión, registro y alerta.
- Asegúrese de que la carga de trabajo se pueda escalar para manejar cargas variables, lo que es especialmente importante para las cargas de trabajo de IA que pueden tener demandas fluctuantes.
- Implemente mecanismos sólidos de manejo y recuperación de errores. Configure alertas automáticas para fallas del sistema y tenga un plan claro para una recuperación rápida.
- Valide la arquitectura de destino y escale al comprender los volúmenes de destino de mensajes de chat o conversaciones. Los volúmenes de destino también ayudan a validar los aspectos de licencia de la aplicación inteligente y el efecto potencial en el almacenamiento de Dataverse de las transcripciones de conversaciones.
En el caso de las aplicaciones inteligentes que utilizan funcionalidades de IA generativa, tenga en cuenta no solo la resiliencia y la disponibilidad, sino también la fiabilidad y precisión de las respuestas proporcionadas por la carga de trabajo inteligente. Tenga en cuenta las siguientes recomendaciones para cada consideración de diseño:
- Optimice la generación aumentada de recuperación (RAG): asegúrese de que sus datos estén limpios y bien estructurados, cree incrustaciones e índices eficientes para una recuperación rápida e implemente mecanismos sólidos de supervisión y retroalimentación para mejorar continuamente el rendimiento de la carga de trabajo.
- Instrucciones eficaces: diseñe instrucciones precisas y contextualmente relevantes para guiar a la IA a producir respuestas precisas.
- Evaluación periódica: implemente la supervisión y las pruebas continuas de los resultados de la IA para evaluar la precisión, la relevancia y el cumplimiento ético.
- Bucles de retroalimentación: defina mecanismos de retroalimentación en los que los usuarios puedan informar de imprecisiones, que luego se pueden utilizar para refinar y mejorar los modelos. Microsoft Copilot Studio proporciona análisis de satisfacción del cliente, que proporcionan información procesable sobre los impulsores de la satisfacción o insatisfacción con las respuestas de su agente.
- Capacitación específica del dominio: ajuste los modelos en datos específicos del dominio para mejorar la precisión en contextos específicos.
- Actualizaciones periódicas: actualice periódicamente los modelos con nuevos datos para mantener su relevancia y precisión.
- Intenciones no reconocidas: gestione las intenciones no reconocidas mediante el uso de Respuestas generativas para encontrar respuestas de los orígenes de datos disponibles y mediante el uso del tema alternativo para la integración con otros sistemas.
Seguridad
En un modelo de responsabilidad compartida:
- Las organizaciones son las principales responsables de administrar y operar las cargas de trabajo.
- Microsoft gestiona la seguridad de la infraestructura subyacente, incluidos los centros de datos, la seguridad de la red y las medidas de seguridad física, así como las funciones de seguridad integradas, como el cifrado, la gestión de identidades y el cumplimiento de los estándares del sector. Obtenga más información en Seguridad en Microsoft Power Platform y Seguridad y gobernanza en Copilot Studio.
Le recomendamos que evalúe periódicamente los servicios y las tecnologías para asegurarse de que su postura de seguridad se adapta a la evolución del panorama de amenazas. Establecer una comprensión clara del modelo de responsabilidad compartida con los proveedores es esencial cuando se colabora para implementar medidas de seguridad.
Puede emplear varios métodos para proteger las cargas de trabajo de las aplicaciones inteligentes:
- Autenticación de usuarios y control de acceso: implemente medidas sólidas de autenticación y control de acceso para garantizar que solo los usuarios autorizados puedan acceder a la carga de trabajo de la aplicación inteligente. El acceso no autorizado a la carga de trabajo de las aplicaciones inteligentes puede dar lugar a filtraciones de datos, uso indebido de recursos y posible exposición de información confidencial. Los mecanismos de autenticación débiles o ineficaces también pueden dar lugar a cuentas de usuario comprometidas.
- Cumplimiento: asegúrese de que los datos estén protegidos y gestionados de acuerdo con los requisitos normativos. Comprenda las regulaciones locales y manténgase informado sobre las leyes locales de protección de datos, y asegúrese de que su estrategia de residencia de datos cumpla con estas regulaciones.
- Integración: proteja todas las integraciones con entidades de servicio. Supervise y proteja la integridad de la red de los puntos de conexión internos y externos a través de capacidades y dispositivos de seguridad, como firewalls o firewalls de aplicaciones web.
- Supervisión y auditoría continuas: supervise y audite continuamente las actividades de las cargas de trabajo para detectar y responder de forma proactiva.
- Herramientas de seguridad de Azure: use las herramientas de seguridad integradas de Azure, como Microsoft Defender for Cloud y Azure Policy, para supervisar y aplicar directivas de seguridad.
- Formación de empleados: forme a los empleados sobre las mejores prácticas de protección de datos y la importancia de cumplir con los requisitos de residencia de datos.
Eficiencia en el desempeño
La eficiencia del rendimiento es la capacidad de la carga de trabajo de escalar de manera eficiente para satisfacer las demandas que le imponen los usuarios.
Aumente la eficiencia del rendimiento de la siguiente manera:
- Comprender los volúmenes de destino para validar la arquitectura y la escala de destino. Los volúmenes de destino también ayudan a validar los aspectos de licencia de la IA generativa (agente) y el efecto potencial en el almacenamiento de Dataverse de las transcripciones de conversaciones.
- Comprender los límites de la plataforma. Cuando integra la carga de trabajo de su aplicación inteligente con sistemas externos, por ejemplo, a través de Power Automate o de solicitudes de HTTP, es importante validar que todos los componentes puedan manejar la carga.
- Supervisión continua del rendimiento y detección de anomalías mediante herramientas como Azure Monitor, Log Analytics, Application Insights y alertas.
- Comprender los tiempos de respuesta esperados para:
- Primera carga de chat y primera respuesta al mensaje
- Latencia máxima para que el agente responda a las consultas de los usuarios
- Enfoque para controlar acciones de larga duración (por ejemplo, esperar a que un sistema externo devuelva datos)
- Optimice la tasa de desviación, o la velocidad a la que las solicitudes se completan en forma de autoservicio debido a la automatización (lo que reduce el número de solicitudes que requieren asistencia humana). Más información: Optimización del rendimiento para cargas de trabajo de aplicaciones inteligentes.
Tener en cuenta cada uno de estos aspectos le ayuda a crear una carga de trabajo de aplicación inteligente con una experiencia de usuario coherente y cohesiva.
Excelencia operativa
La excelencia operativa implica el desarrollo de procesos eficientes para respaldar la carga de trabajo de las aplicaciones inteligentes.
Los fallos operativos pueden afectar a otras áreas de diseño, así como al éxito general de la carga de trabajo de la aplicación inteligente. Es importante adaptar sus procesos operativos para admitir una carga de trabajo de aplicaciones inteligente en producción. Las siguientes recomendaciones impulsan la excelencia operativa:
- Automatice los procesos de compilación y lanzamiento. Los procesos de compilación y lanzamiento totalmente automatizados reducen la fricción y aumentan la velocidad de implementación de actualizaciones, lo que aporta repetibilidad y coherencia en todos los entornos. La automatización acorta el ciclo de retroalimentación, desde los desarrolladores que impulsan los cambios hasta la obtención de información sobre la calidad del código, la cobertura de las pruebas, la resistencia, la seguridad y el rendimiento, todo lo cual contribuye a la productividad de los desarrolladores.
- Mantenimiento del cumplimiento y la gobernanza.
- Analice el rendimiento y el estado de su entorno en la producción.
- Mantenga una documentación que capture:
- Procedimientos de resolución de problemas
- Planes de recuperación ante desastres
- Proporcionar orientación de corrección sobre cómo acelerar el proceso de resolución de problemas.
- Adopte la mejora operativa continua. Priorizar la mejora rutinaria del sistema y la experiencia del usuario. Utilice un modelo de estado del sistema para comprender y medir la eficiencia operativa, junto con mecanismos de retroalimentación para permitir que los equipos de aplicaciones comprendan y aborden las brechas de manera iterativa.
Estas recomendaciones pueden ayudar a tu equipo a colaborar de forma eficiente y transparente.
Optimización de experiencia
Una carga de trabajo de aplicación inteligente debe priorizar el diseño de conversaciones para garantizar una experiencia fácil de usar que permita a los usuarios alcanzar sus objetivos con el mínimo esfuerzo. El diseño debe abordar temas que la IA generativa no puede manejar e incluir mecanismos alternativos. Implemente también mecanismos para recopilar comentarios de los usuarios y perfeccionar continuamente los modelos de IA y la carga de trabajo en función de estos comentarios.
La optimización de la experiencia del usuario para una carga de trabajo de aplicación inteligente implica varias consideraciones clave:
Diseño de conversaciones: diseñe conversaciones que sean intuitivas y fáciles de navegar. Utilice un lenguaje claro y conciso, y asegúrese de que la IA pueda manejar las consultas comunes de los usuarios de manera efectiva. Concéntrese en ayudar a los usuarios a alcanzar sus objetivos con el mínimo esfuerzo. Comprenda las intenciones de los usuarios y proporcione respuestas relevantes rápidamente para garantizar una experiencia de usuario fluida y eficiente.
Limitaciones de control: implemente mecanismos alternativos para temas que la IA generativa no pueda manejar, como redirigir a los usuarios a representantes de servicio al cliente o proporcionar recursos alternativos. Diseñe procesos sólidos de control de errores para administrar entradas inesperadas con agilidad. Informar a los usuarios cuando la IA no pueda procesar su solicitud y ofrecer alternativas.
Comentarios de los usuarios: integre mecanismos para recopilar comentarios de los usuarios de forma continua. Microsoft Copilot Studio proporciona análisis de satisfacción del cliente, con información procesable sobre los impulsores de la satisfacción o insatisfacción con las respuestas de su agente. Utilice los comentarios recopilados para refinar y mejorar los modelos de IA y la carga de trabajo general. Las actualizaciones periódicas basadas en las entradas del usuario pueden mejorar significativamente la experiencia del usuario.
Personalización y adaptación: personalice las indicaciones e instrucciones para que se adapten a sus casos de uso específicos y a las necesidades de los usuarios, a fin de garantizar respuestas más precisas y relevantes. Utilice el encadenamiento dinámico para automatizar los desencadenadores y administrar los flujos de temas de manera eficiente para reducir la necesidad de temas predefinidos manualmente y mejorar la capacidad de la IA para reconocer la intención del usuario. Más información en Optimizar las indicaciones y la configuración de tema.
Pasos siguientes
Los principios de diseño del marco de buena arquitectura se incorporan a las áreas de diseño de cargas de trabajo de aplicaciones inteligentes. Cada área de diseño proporciona orientación específica para ayudarle a acceder rápidamente a la información que necesita para mejorar la productividad de manera eficiente.
Empiece por revisar las consideraciones de diseño necesarias para admitir una carga de trabajo: