Поделиться через


Принципы проектирования интеллектуальных прикладных рабочих нагрузок

Руководство по планированию, разработке и обслуживанию интеллектуальных рабочих нагрузок приложений основано на Power Platform Well-Architected и его пяти столпах архитектурного совершенства.

Хорошо спроектированная колонна Сводка.
Надежность Интеллектуальная рабочая нагрузка приложений требует отказоустойчивости архитектуры слой, чтобы гарантировать высокую доступность моделей и рабочих процессов ИИ и возможность быстрого восстановления после сбоев. Внедрите надежные механизмы обработки ошибок. Устойчивая архитектура также поддерживает целостность данных, используемых моделями ИИ, гарантируя единообразие и точность выходных данных.
Безопасность Интеллектуальная рабочая нагрузка приложения часто обрабатывает конфиденциальные данные. Защитите конфиденциальные данные, используемые и генерируемые моделями ИИ. Внедрите шифрование, контроль доступа и регулярные аудиты безопасности. Убедитесь, что рабочая нагрузка соответствует соответствующим стандартам регулирования, таким как GDPR (Общий регламент по защите данных) и HIPAA (Закон о переносимости и подотчетности медицинского страхования), для защиты конфиденциальности и данных пользователей.
Эффективность работы Интеллектуальная рабочая нагрузка приложения должна быть спроектирована так, чтобы легко масштабироваться в соответствии с растущими объемами данных и требованиями пользователей. Определите ключевые показатели производительности и внедрите мониторинг для отслеживания прогресса в достижении целевых показателей производительности рабочей нагрузки. В контексте интеллектуальных рабочих нагрузок приложений производительность также учитывает количество запросов и взаимодействий, которые могут быть выполнены посредством самообслуживания, что в противном случае потребовало бы вмешательства человека.
Оперативное совершенство Интеллектуальная рабочая нагрузка приложений требует комплексного мониторинга и ведения журнала для отслеживания производительности и работоспособности моделей ИИ, рабочих процессов и диалогов. Мониторинг помогает быстро выявлять и решать проблемы. В основе принципа «Операционное совершенство» лежит рекомендация использовать автоматизацию для оптимизации операций, сокращения ручного вмешательства и минимизации риска человеческих ошибок.
Оптимизация опыта Интеллектуальная рабочая нагрузка приложения должна отдавать приоритет дизайну диалога, чтобы обеспечить удобный пользовательский интерфейс, позволяющий пользователям достигать своих целей с минимальными усилиями. При проектировании следует учитывать темы, с которыми генеративный ИИ не может справиться, и включать резервные механизмы. Также реализуйте механизмы сбора отзывов пользователей и постоянного совершенствования моделей ИИ и рабочей нагрузки на основе этих отзывов.

Надежность

При проектировании интеллектуальной рабочей нагрузки приложения с помощью Power Platform сосредоточьтесь на устойчивости и доступности.

  • Устойчивость — это способность системы восстанавливаться после сбоев и продолжать функционировать.
  • Доступность обеспечивает бесперебойную работу. Высокая доступность сводит к минимуму время простоя приложений и ускоряет восстановление после инцидентов.

Надежность важна при разработке любой рабочей нагрузки, и генеративный ИИ не является исключением. На самом деле при проектировании генеративных рабочих нагрузок ИИ необходимо учитывать уникальные факторы. Признание и акцентирование внимания на устойчивости имеют решающее значение для генеративных рабочих нагрузок ИИ, поскольку позволяют гарантировать доступность организации и поддерживать непрерывность бизнеса.

В облаке могут случаться сбои. Вместо того чтобы пытаться полностью предотвратить отказы, вашей целью должно быть минимизация последствий отказа одного компонента. Используйте следующую информацию, чтобы минимизировать время простоя и убедиться, что рекомендуемые методы обеспечения высокой доступности встроены в рабочую нагрузку вашего интеллектуального приложения:

  • Убедитесь, что рабочая нагрузка может справиться со сбоями и продолжить работу даже при сниженной функциональности. Выявите потенциальные неисправности и сделайте систему устойчивой, чтобы она могла выдерживать эти неисправности и восстанавливаться после них.
  • Сделайте рабочую нагрузку наблюдаемой, чтобы команды разработчиков могли учиться на неудачах. Быстро выявляйте и устраняйте проблемы, внедряя механизмы мониторинга, регистрации и оповещения.
  • Убедитесь, что рабочая нагрузка может масштабироваться для обработки изменяющихся нагрузок, что особенно важно для рабочих нагрузок ИИ, которые могут иметь изменяющиеся требования.
  • Внедрите надежные механизмы обработки ошибок и восстановления. Настройте автоматические оповещения о сбоях системы и разработайте четкий план быстрого восстановления.
  • Проверьте целевую архитектуру и масштаб, поняв целевые объемы сообщений чата или разговоров. Целевые объемы также помогают проверить аспекты лицензирования интеллектуального приложения и потенциальное влияние на Dataverse хранение расшифровок разговоров.

Для интеллектуальных приложений, использующих возможности генеративного ИИ, следует учитывать не только устойчивость и доступность, но также надежность и точность ответов, предоставляемых интеллектуальной рабочей нагрузкой. Примите во внимание следующие рекомендации для каждого варианта проектирования:

  • Оптимизация для расширенной генерации извлечения (RAG): обеспечьте чистоту и хорошую структурированность данных, создайте эффективные внедрения и индексы для быстрого извлечения, а также внедрите надежные механизмы мониторинга и обратной связи для постоянного повышения производительности рабочей нагрузки.
  • Эффективные подсказки : Разрабатывайте точные и контекстно-релевантные подсказки, которые помогут ИИ выдавать точные ответы.
  • Регулярная оценка : Осуществлять непрерывный мониторинг и тестирование результатов ИИ для оценки точности, актуальности и соблюдения этических норм.
  • Циклы обратной связи: создайте механизмы обратной связи, с помощью которых пользователи могут сообщать о неточностях, что затем можно использовать для уточнения и улучшения моделей. Microsoft Copilot Studio обеспечивает аналитика удовлетворенности клиентов, которые предоставляют полезную информацию о факторах, вызывающих удовлетворенность или неудовлетворенность ответами вашего второго пилота.
  • Обучение по предметной области : Тонкая настройка моделей на основе данных, специфичных для предметной области, для повышения точности в определенных контекстах.
  • Регулярные обновления : Периодически обновляйте модели новыми данными, чтобы поддерживать их актуальность и точность.
  • Нераспознанные намерения: обрабатывайте нераспознанные намерения, используя генеративные ответы для поиска ответов из доступных источников данных и используя резервная тема для интеграции с другими системами.

Группа безопасности

В модели совместной ответственности:

  • Организации несут основную ответственность за управление и выполнение рабочих нагрузок.
  • Microsoft управляет безопасностью базовой инфраструктуры, включая центры обработки данных, сетевую безопасность, меры физической безопасности и встроенные функции безопасности, такие как шифрование, управление идентификацией и соответствие отраслевым стандартам. Узнайте больше в разделах Безопасность в Microsoft Power Platform и Copilot Studio Безопасность и управление.

Мы рекомендуем вам регулярно оценивать услуги и технологии, чтобы гарантировать, что ваша система безопасности адаптируется к меняющемуся ландшафту угроз. Четкое понимание модели совместной ответственности с поставщиками имеет решающее значение при совместной реализации мер безопасности.

Для защиты рабочих нагрузок интеллектуальных приложений можно использовать несколько методов:

  • Аутентификация пользователей и контроль доступа: реализуйте надежные меры аутентификации и контроля доступа, чтобы гарантировать, что доступ к интеллектуальной рабочей нагрузке приложения смогут получить только авторизованные пользователи. Несанкционированный доступ к рабочей нагрузке интеллектуальных приложений может привести к утечке данных, нецелевому использованию ресурсов и потенциальному раскрытию конфиденциальной информации. Слабые или неэффективные механизмы аутентификации также могут привести к взлому учетных записей пользователей.
  • Соответствие: гарантируйте, что данные защищены и управляются в соответствии с нормативными требованиями. Изучите местные правила, будьте в курсе местных законов о защите данных и убедитесь, что ваша стратегия размещения данных соответствует этим правилам.
  • Интеграция: Защитите все интеграции с субъектами услуг. Контролируйте и защищайте целостность сети внутренних и внешних конечных точек с помощью средств и устройств безопасности, таких как межсетевые экраны или межсетевые экраны веб-приложений.
  • Постоянный мониторинг и аудит: постоянно отслеживайте и проверяйте активность рабочих нагрузок для обнаружения и упреждающего реагирования.
  • Инструменты безопасности Azure: используйте встроенные инструменты безопасности Azure, такие как Microsoft Defender for Cloud и Azure Policy, для мониторинга и обеспечения соблюдения политик безопасности.
  • Обучение сотрудников: Обучайте сотрудников передовым методам защиты данных и важности соблюдения требований к размещению данных.

Эффективные процессы

Эффективность производительности — это способность вашей рабочей нагрузки эффективно масштабироваться для удовлетворения требований, предъявляемых к ней пользователями.

Повышение эффективности работы за счет:

  • Понимание целевых объемов для проверки целевой архитектуры и масштаба. Целевые объемы также помогают проверить аспекты лицензирования второго пилота и потенциальное влияние на Dataverse хранение стенограмм разговоров.
  • Понимание ограничений платформы. При интеграции рабочей нагрузки интеллектуального приложения с внешними системами, например, посредством Power Automate или HTTP-запросов, важно убедиться, что каждый компонент может справиться с нагрузкой.
  • Постоянный мониторинг производительности и обнаружение аномалий с помощью таких инструментов, как Azure Monitor, Log Analytics, Application Insights и оповещений.
  • Понимание ожидаемого времени ответ для:
    • Первая загрузка чата и первое сообщение ответ
    • Максимальная задержка ответа второго пилота на запросы пользователя
    • Подход к обработке длительных действий (например, ожидание возврата данных внешней системой)
  • Оптимизация скорости отклонения или скорости, с которой запросы выполняются в режиме самообслуживания за счет автоматизации (сокращение количества запросов, требующих помощи агент). Узнайте больше в разделе Оптимизация производительности для интеллектуальных рабочих нагрузок приложений.

Учет каждого из этих аспектов поможет вам создать интеллектуальную рабочую нагрузку приложения с согласованным и целостным пользовательским интерфейсом.

Операционная эффективность

Операционная эффективность подразумевает разработку эффективных процессов для поддержки рабочей нагрузки ваших интеллектуальных приложений.

Операционные сбои могут повлиять на другие области проектирования, а также на общую успешность рабочей нагрузки интеллектуального приложения. Важно адаптировать ваши операционные процессы для поддержки интеллектуальной рабочей нагрузки приложений в производстве. Следующие рекомендации способствуют повышению эффективности работы:

  • Автоматизируйте процессы сборки и выпуска. Полностью автоматизированные процессы сборки и выпуска сокращают трудности и увеличивают скорость развертывания обновлений, обеспечивая повторяемость и согласованность во всех средах. Автоматизация сокращает Цикл обратной связи — от внесения изменений разработчиками до получения информации о качестве кода, покрытии тестами, отказоустойчивости, безопасности и производительности, которые способствуют повышению производительности труда разработчиков.
  • Поддержание управления и соблюдения нормативных требований.
  • Проанализируйте производительность и состояние вашей производственной среды.
  • Ведите документацию, которая фиксирует:
    • Процедуры устранения неполадок
    • Планы восстановления после стихийных бедствий
  • Предоставить рекомендации по устранению неполадок, позволяющие ускорить процесс решения проблем.
  • Придерживайтесь постоянного совершенствования операционной деятельности. Отдайте приоритет регулярному улучшению системы и пользовательского опыта. Используйте модель работоспособности для понимания и измерения операционной эффективности, а также механизмы обратной связи, позволяющие группам разработчиков приложений выявлять и устранять пробелы итеративным образом.

Эти рекомендации помогут вашей команде организовать эффективное и прозрачное сотрудничество.

Оптимизация опыта

Интеллектуальная рабочая нагрузка приложения должна отдавать приоритет дизайну диалога, чтобы обеспечить удобный пользовательский интерфейс, позволяющий пользователям достигать своих целей с минимальными усилиями. Проект должен охватывать темы, с которыми не может справиться генеративный ИИ, и включать резервные механизмы. Также реализуйте механизмы сбора отзывов пользователей и постоянного совершенствования моделей ИИ и рабочей нагрузки на основе этих отзывов.

Оптимизация пользовательского опыта для интеллектуальной рабочей нагрузки приложения включает в себя несколько ключевых соображений:

  • Дизайн разговора : Создавайте интуитивно понятные и простые в навигации диалоги. Используйте понятный и лаконичный язык и убедитесь, что ИИ может эффективно обрабатывать общие запросы пользователей. Сосредоточьтесь на том, чтобы помочь пользователям достичь своих целей с минимальными усилиями. Понимайте намерения пользователей и быстро предоставляйте соответствующие ответы, чтобы обеспечить бесперебойный и эффективный пользовательский опыт.

  • Обработка ограничений: Реализуйте резервные механизмы для тем, с которыми генеративный ИИ не может справиться, например, перенаправление пользователей к агентам-людям или предоставление альтернативных ресурсов. Разработайте надежные процессы обработки ошибок, чтобы корректно справляться с неожиданными входными данными. Сообщать пользователям, когда ИИ не может обработать их запрос, и предлагать альтернативные варианты.

  • Обратная связь с пользователями: Интеграция механизмов для постоянного сбора отзывов пользователей. Microsoft Copilot Studio предоставляет аналитику удовлетворенности клиентов , которая дает полезную информацию о факторах удовлетворенности или неудовлетворенности ответами вашего второго пилота. Используйте собранные отзывы для уточнения и улучшения моделей ИИ и общей рабочей нагрузки. Регулярные обновления, основанные на отзывах пользователей, могут значительно улучшить пользовательский опыт.

  • Настройка и персонализация: настройте подсказки и инструкции в соответствии с вашими конкретными вариантами использования и потребностями пользователей, чтобы обеспечить более точные и релевантные ответы. Используйте динамическое построение цепочки для автоматизации триггеров и эффективного управления потоками тема, чтобы сократить необходимость в предварительно заданных вручную темах и улучшить способность ИИ распознавать намерения пользователя. Подробнее читайте в разделе Оптимизация подсказок и конфигурации тема.

Следующие шаги

Принципы проектирования Well-Architected Framework включены в области проектирования рабочей нагрузки интеллектуальных приложений. Каждая область проектирования предоставляет целевые рекомендации, которые помогут вам быстро получить доступ к информации, необходимой для эффективного повышения производительности.

Начните с рассмотрения проектных соображений, необходимых для поддержки рабочей нагрузки: