智能应用程序工作负载的设计原则

项目
01/15/2025

围绕智能应用工作负载的规划、开发和维护提供的指导建立在 Power Platform Well-Architected 及其五大卓越架构支柱的基础之上。

Well-Architected 支柱	总结
可靠性	智能应用程序工作负载需要架构层的弹性，以确保 AI 模型和工作流具有高可用性，并且可以从故障中快速恢复。实施可靠的错误处理机制。弹性架构还可以保持 AI 模型使用的数据的完整性，确保输出的一致性和准确性。
安全组	智能应用程序工作负载通常处理敏感数据。保护 AI 模型使用和生成的敏感数据。实施加密、访问控制和定期安全审核。确保工作负载符合相关法规标准，例如 GDPR（一般数据保护条例）和 HIPAA（健康保险流通与责任法案），以保护用户隐私和数据。
性能效率	智能应用程序工作负载的设计必须能够随着数据量和用户需求的增加而无缝扩展。确定关键性能指标并实施监视，以跟踪实现工作负载性能目标的进度。在智能应用程序工作负载的上下文中，性能还考虑了可以通过自助服务完成的请求和交互的数量，否则这将需要人工干预。
卓越运营	智能应用程序工作负载需要全面的监视和日志记录，以跟踪 AI 模型、工作流和对话的性能和运行状况。监视有助于快速识别和解决问题。卓越运营支柱建议使用自动化来简化运营，减少人工干预，并将人为错误的风险降至最低。
体验优化	智能应用程序工作负荷应优先考虑对话设计，以确保用户友好的体验，使用户能够以最少的工作量实现其目标。设计应考虑生成式 AI 无法处理的主题，并纳入回退机制。此外，还实施收集用户反馈的机制，并根据这些反馈不断完善 AI 模型和工作负载。

可靠性

使用 Power Platform 设计智能应用工作负载时，应重点关注弹性和可用性。

弹性是指系统从故障中恢复并继续运行的能力。
可用性确保不间断的正常运行时间。高可用性可最大限度地减少应用程序停机时间，并增强从事件中恢复的能力。

可靠性在任何工作负载的开发中都很重要，生成式 AI 也不例外。事实上，在设计生成式 AI 工作负载时，需要考虑一些独特的因素。识别和强调弹性对于生成式 AI 工作负载至关重要，以确保组织可用性并保持业务连续性。

故障可能发生在云中。与其试图完全防止故障，不如将单个故障组件的影响降到最低。使用以下信息可最大程度地减少停机时间，并确保将高可用性的建议做法内置到您的智能应用程序工作负载中：

确保工作负荷能够处理故障并继续运行，即使功能减少也是如此。识别潜在故障并使系统具有弹性，以容忍这些故障并从中恢复。
使工作负荷可观察，以便开发团队从失败中吸取教训。通过实施监视、日志记录和警报机制，快速识别和解决问题。
确保工作负载可以扩展以处理不同的负载，这对于需求可能波动的 AI 工作负载尤为重要。
实施强大的错误处理和恢复机制。设置系统故障自动警报，并制定明确的快速恢复计划。
通过了解聊天消息或对话的目标数量来验证目标体系结构和规模。目标容量还有助于验证智能应用的许可方面以及对 Dataverse 对话记录存储的潜在影响。

对于使用生成式 AI 功能的智能应用程序，不仅要考虑复原能力和可用性，还要考虑智能工作负载提供的响应的可靠性和准确性。对于每个设计注意事项，请考虑以下建议：

优化检索增强生成（RAG）：确保您的数据干净整洁、结构合理，创建高效的嵌入和索引以实现快速检索，并实施强大的监控和反馈机制以持续改进工作负载的性能。
有效的提示：设计精确且与上下文相关的提示，引导人工智能做出准确的回应。
定期评估：对人工智能的输出进行持续监控和测试，以评估准确性、相关性和道德遵守情况。
反馈回路：建立反馈机制，让用户可以报告不准确之处，然后用于完善和改进模型。 Microsoft Copilot Studio 提供客户满意度分析，这些分析可就对代理回复的满意或不满意的驱动因素提供可行的见解。
特定领域培训：根据特定领域的数据对模型进行微调，以提高在特定情况下的准确性。
定期更新：利用新数据定期更新模型，以保持其相关性和准确性。
未识别意图：使用生成式答案从可用数据源中寻找答案，并使用回退主题与其他系统集成，从而处理未识别的意图。

安全组

在共享责任模式中：

组织主要负责管理和操作工作负荷。
Microsoft 管理底层基础设施的安全性，包括数据中心、网络安全和物理安全措施以及内置安全功能，例如加密、身份管理和符合行业标准。在 Microsoft Power Platform 中的安全性和 Copilot Studio 安全与治理中了解更多信息。

我们建议您定期评估服务和技术，以确保您的安全态势能够适应不断变化的威胁形势。在协作实施安全措施时，与供应商建立对责任共担模型的清晰理解至关重要。

您可以采用多种方法来保护您的智能应用程序工作负载：

用户身份验证和访问控制：实施强大的身份验证和访问控制措施，确保只有授权用户才能访问智能应用工作负载。未经授权访问智能应用程序工作负载可能会导致数据泄露、资源滥用以及敏感信息的潜在泄露。身份验证机制薄弱或无效也可能导致用户帐户被盗用。
合规：确保数据得到保护和管理，符合法规要求。了解当地法规，随时了解当地数据保护法律，并确保您的数据驻留策略符合这些法规。
集成：确保与服务委托人的所有集成安全。通过安全功能和设备（如防火墙或 Web 应用程序防火墙）监控和保护内部和外部端点的网络完整性。
持续监控和审核：持续监控和审核工作负载活动，以便主动检测和响应。
Azure 安全工具：使用 Azure 的内置安全工具（如 Microsoft Defender for Cloud 和 Azure 策略）来监控和执行安全策略。
员工培训：就数据保护最佳实践以及遵守数据驻留要求的重要性对员工进行培训。

性能效率

性能效率是指工作负荷能够有效扩展以满足用户对其提出的要求。

通过以下方式提高性能效率：

了解目标卷以验证目标架构和规模。目标容量还有助于验证生成式人工智能（代理）的许可方面以及对 Dataverse 对话记录存储的潜在影响。
了解平台限制。当您通过 Power Automate 或 HTTP 请求等方式将智能应用工作负载与外部系统集成时，必须验证每个组件都能处理负载。
使用 Azure Monitor、日志分析 Application Insights 和警报等工具持续监控性能并检测异常。
了解以下各项的预期响应时间：
- 首次聊天加载和第一条消息响应
- 代理回答用户查询的最大延迟
- 处理长时间运行的操作（例如，等待外部系统返回数据）的方法
优化偏转率，或由于自动化而以自助服务方式完成请求的速率（减少需要人工协助的请求数量）。了解更多信息，请参阅智能应用工作负载的性能优化。

考虑这些方面中的每一个都有助于您构建具有一致、有凝聚力的用户体验的智能应用程序工作负载。

卓越运营

卓越运营涉及开发高效的流程来支持您的智能应用程序工作负载。

操作失败可能会影响其他设计领域以及智能应用程序工作负载的整体成功。定制操作流程以支持生产中的智能应用程序工作负载非常重要。以下建议可推动卓越运营：

自动执行生成和发布流程。完全自动化的生成和发布流程减少了摩擦，提高了部署更新的速度，从而实现了跨环境的可重复性和一致性。自动化缩短了反馈循环，从开发人员推动更改，到获得有关代码质量、测试覆盖率、弹性、安全性和性能的见解，所有这些都有助于提高开发人员的工作效率。
维护治理和合规性。
在生产环境中分析环境的性能和运行状况。
维护捕获以下内容的文档：
- 故障排除程序
- 灾难恢复计划
提供有关如何加快解决问题过程的修正指导。
拥抱持续的运营改进。优先考虑系统和用户体验的日常改进。使用运行状况模型来了解和衡量运营效率，并使用反馈机制使应用程序团队能够以迭代方式了解和解决差距。

这些建议可以帮助您的团队以高效、透明的方式进行协作。

体验优化

智能应用程序工作负荷应优先考虑对话设计，以确保用户友好的体验，使用户能够以最少的工作量实现其目标。该设计应解决生成式 AI 无法处理的主题，并包括回退机制。此外，还实施收集用户反馈的机制，并根据这些反馈不断完善 AI 模型和工作负载。

优化智能应用程序工作负载的用户体验涉及几个关键注意事项：

对话设计：设计直观、易于浏览的对话。使用清晰简洁的语言，并确保 AI 能够有效地处理常见的用户查询。专注于帮助用户以最小的努力实现他们的目标。了解用户意图并快速提供相关响应，以确保无缝高效的用户体验。
处理限制：针对生成式人工智能无法处理的主题实施后备机制，例如将用户重定向至客户服务代表或提供替代资源。设计强大的错误处理流程，以优雅地管理意外输入。当 AI 无法处理用户的请求并提供替代方案时通知用户。
用户反馈：整合持续收集用户反馈的机制。 Microsoft Copilot Studio 提供客户满意度分析，这些分析可就对代理回复的满意或不满意的驱动因素提供可行的见解。使用收集的反馈来完善和改进 AI 模型和整体工作负载。根据用户输入进行定期更新可以显著增强用户体验。
定制和个性化：根据您的特定使用案例和用户需求定制提示和说明，以确保更准确、更相关的回复。使用动态链接自动触发器并有效地管理主题流，以减少对手动预定义主题的需求，并提高 AI 识别用户意图的能力。了解更多信息，请参阅优化提示和主题配置。

后续步骤

Well-Architected Framework 设计原则已纳入智能应用程序工作负载设计领域。每个设计领域都提供有针对性的指导，帮助您快速访问高效提高生产率所需的信息。

首先查看支持工作负载所需的设计注意事项：

通过

智能应用程序工作负载的设计原则

可靠性

安全组

性能效率

卓越运营

体验优化

后续步骤

反馈

其他资源