Принципы проектирования интеллектуальных прикладных рабочих нагрузок
Руководство по планированию, разработке и обслуживанию интеллектуальных рабочих нагрузок приложений основано на Power Platform Well-Architected и его пяти столпах архитектурного совершенства.
Хорошо спроектированная колонна | Сводка. |
---|---|
Надежность | Интеллектуальная рабочая нагрузка приложений требует отказоустойчивости архитектуры слой, чтобы гарантировать высокую доступность моделей и рабочих процессов ИИ и возможность быстрого восстановления после сбоев. Внедрите надежные механизмы обработки ошибок. Устойчивая архитектура также поддерживает целостность данных, используемых моделями ИИ, гарантируя единообразие и точность выходных данных. |
Безопасность | Интеллектуальная рабочая нагрузка приложения часто обрабатывает конфиденциальные данные. Защитите конфиденциальные данные, используемые и генерируемые моделями ИИ. Внедрите шифрование, контроль доступа и регулярные аудиты безопасности. Убедитесь, что рабочая нагрузка соответствует соответствующим стандартам регулирования, таким как GDPR (Общий регламент по защите данных) и HIPAA (Закон о переносимости и подотчетности медицинского страхования), для защиты конфиденциальности и данных пользователей. |
Эффективность работы | Интеллектуальная рабочая нагрузка приложения должна быть спроектирована так, чтобы легко масштабироваться в соответствии с растущими объемами данных и требованиями пользователей. Определите ключевые показатели производительности и внедрите мониторинг для отслеживания прогресса в достижении целевых показателей производительности рабочей нагрузки. В контексте интеллектуальных рабочих нагрузок приложений производительность также учитывает количество запросов и взаимодействий, которые могут быть выполнены посредством самообслуживания, что в противном случае потребовало бы вмешательства человека. |
Оперативное совершенство | Интеллектуальная рабочая нагрузка приложений требует комплексного мониторинга и ведения журнала для отслеживания производительности и работоспособности моделей ИИ, рабочих процессов и диалогов. Мониторинг помогает быстро выявлять и решать проблемы. В основе принципа «Операционное совершенство» лежит рекомендация использовать автоматизацию для оптимизации операций, сокращения ручного вмешательства и минимизации риска человеческих ошибок. |
Оптимизация опыта | Интеллектуальная рабочая нагрузка приложения должна отдавать приоритет дизайну диалога, чтобы обеспечить удобный пользовательский интерфейс, позволяющий пользователям достигать своих целей с минимальными усилиями. При проектировании следует учитывать темы, с которыми генеративный ИИ не может справиться, и включать резервные механизмы. Также реализуйте механизмы сбора отзывов пользователей и постоянного совершенствования моделей ИИ и рабочей нагрузки на основе этих отзывов. |
Надежность
При проектировании интеллектуальной рабочей нагрузки приложения с помощью Power Platform сосредоточьтесь на устойчивости и доступности.
- Устойчивость — это способность системы восстанавливаться после сбоев и продолжать функционировать.
- Доступность обеспечивает бесперебойную работу. Высокая доступность сводит к минимуму время простоя приложений и ускоряет восстановление после инцидентов.
Надежность важна при разработке любой рабочей нагрузки, и генеративный ИИ не является исключением. На самом деле при проектировании генеративных рабочих нагрузок ИИ необходимо учитывать уникальные факторы. Признание и акцентирование внимания на устойчивости имеют решающее значение для генеративных рабочих нагрузок ИИ, поскольку позволяют гарантировать доступность организации и поддерживать непрерывность бизнеса.
В облаке могут случаться сбои. Вместо того чтобы пытаться полностью предотвратить отказы, вашей целью должно быть минимизация последствий отказа одного компонента. Используйте следующую информацию, чтобы минимизировать время простоя и убедиться, что рекомендуемые методы обеспечения высокой доступности встроены в рабочую нагрузку вашего интеллектуального приложения:
- Убедитесь, что рабочая нагрузка может справиться со сбоями и продолжить работу даже при сниженной функциональности. Выявите потенциальные неисправности и сделайте систему устойчивой, чтобы она могла выдерживать эти неисправности и восстанавливаться после них.
- Сделайте рабочую нагрузку наблюдаемой, чтобы команды разработчиков могли учиться на неудачах. Быстро выявляйте и устраняйте проблемы, внедряя механизмы мониторинга, регистрации и оповещения.
- Убедитесь, что рабочая нагрузка может масштабироваться для обработки изменяющихся нагрузок, что особенно важно для рабочих нагрузок ИИ, которые могут иметь изменяющиеся требования.
- Внедрите надежные механизмы обработки ошибок и восстановления. Настройте автоматические оповещения о сбоях системы и разработайте четкий план быстрого восстановления.
- Проверьте целевую архитектуру и масштаб, поняв целевые объемы сообщений чата или разговоров. Целевые объемы также помогают проверить аспекты лицензирования интеллектуального приложения и потенциальное влияние на Dataverse хранение расшифровок разговоров.
Для интеллектуальных приложений, использующих возможности генеративного ИИ, следует учитывать не только устойчивость и доступность, но также надежность и точность ответов, предоставляемых интеллектуальной рабочей нагрузкой. Примите во внимание следующие рекомендации для каждого варианта проектирования:
- Оптимизация для расширенной генерации извлечения (RAG): обеспечьте чистоту и хорошую структурированность данных, создайте эффективные внедрения и индексы для быстрого извлечения, а также внедрите надежные механизмы мониторинга и обратной связи для постоянного повышения производительности рабочей нагрузки.
- Эффективные подсказки : Разрабатывайте точные и контекстно-релевантные подсказки, которые помогут ИИ выдавать точные ответы.
- Регулярная оценка : Осуществлять непрерывный мониторинг и тестирование результатов ИИ для оценки точности, актуальности и соблюдения этических норм.
- Циклы обратной связи: создайте механизмы обратной связи, с помощью которых пользователи могут сообщать о неточностях, что затем можно использовать для уточнения и улучшения моделей. Microsoft Copilot Studio обеспечивает аналитика удовлетворенности клиентов, которые предоставляют полезную информацию о факторах, вызывающих удовлетворенность или неудовлетворенность ответами вашего второго пилота.
- Обучение по предметной области : Тонкая настройка моделей на основе данных, специфичных для предметной области, для повышения точности в определенных контекстах.
- Регулярные обновления : Периодически обновляйте модели новыми данными, чтобы поддерживать их актуальность и точность.
- Нераспознанные намерения: обрабатывайте нераспознанные намерения, используя генеративные ответы для поиска ответов из доступных источников данных и используя резервная тема для интеграции с другими системами.
Группа безопасности
В модели совместной ответственности:
- Организации несут основную ответственность за управление и выполнение рабочих нагрузок.
- Microsoft управляет безопасностью базовой инфраструктуры, включая центры обработки данных, сетевую безопасность, меры физической безопасности и встроенные функции безопасности, такие как шифрование, управление идентификацией и соответствие отраслевым стандартам. Узнайте больше в разделах Безопасность в Microsoft Power Platform и Copilot Studio Безопасность и управление.
Мы рекомендуем вам регулярно оценивать услуги и технологии, чтобы гарантировать, что ваша система безопасности адаптируется к меняющемуся ландшафту угроз. Четкое понимание модели совместной ответственности с поставщиками имеет решающее значение при совместной реализации мер безопасности.
Для защиты рабочих нагрузок интеллектуальных приложений можно использовать несколько методов:
- Аутентификация пользователей и контроль доступа: реализуйте надежные меры аутентификации и контроля доступа, чтобы гарантировать, что доступ к интеллектуальной рабочей нагрузке приложения смогут получить только авторизованные пользователи. Несанкционированный доступ к рабочей нагрузке интеллектуальных приложений может привести к утечке данных, нецелевому использованию ресурсов и потенциальному раскрытию конфиденциальной информации. Слабые или неэффективные механизмы аутентификации также могут привести к взлому учетных записей пользователей.
- Соответствие: гарантируйте, что данные защищены и управляются в соответствии с нормативными требованиями. Изучите местные правила, будьте в курсе местных законов о защите данных и убедитесь, что ваша стратегия размещения данных соответствует этим правилам.
- Интеграция: Защитите все интеграции с субъектами услуг. Контролируйте и защищайте целостность сети внутренних и внешних конечных точек с помощью средств и устройств безопасности, таких как межсетевые экраны или межсетевые экраны веб-приложений.
- Постоянный мониторинг и аудит: постоянно отслеживайте и проверяйте активность рабочих нагрузок для обнаружения и упреждающего реагирования.
- Инструменты безопасности Azure: используйте встроенные инструменты безопасности Azure, такие как Microsoft Defender for Cloud и Azure Policy, для мониторинга и обеспечения соблюдения политик безопасности.
- Обучение сотрудников: Обучайте сотрудников передовым методам защиты данных и важности соблюдения требований к размещению данных.
Эффективные процессы
Эффективность производительности — это способность вашей рабочей нагрузки эффективно масштабироваться для удовлетворения требований, предъявляемых к ней пользователями.
Повышение эффективности работы за счет:
- Понимание целевых объемов для проверки целевой архитектуры и масштаба. Целевые объемы также помогают проверить аспекты лицензирования второго пилота и потенциальное влияние на Dataverse хранение стенограмм разговоров.
- Понимание ограничений платформы. При интеграции рабочей нагрузки интеллектуального приложения с внешними системами, например, посредством Power Automate или HTTP-запросов, важно убедиться, что каждый компонент может справиться с нагрузкой.
- Постоянный мониторинг производительности и обнаружение аномалий с помощью таких инструментов, как Azure Monitor, Log Analytics, Application Insights и оповещений.
- Понимание ожидаемого времени ответ для:
- Первая загрузка чата и первое сообщение ответ
- Максимальная задержка ответа второго пилота на запросы пользователя
- Подход к обработке длительных действий (например, ожидание возврата данных внешней системой)
- Оптимизация скорости отклонения или скорости, с которой запросы выполняются в режиме самообслуживания за счет автоматизации (сокращение количества запросов, требующих помощи агент). Узнайте больше в разделе Оптимизация производительности для интеллектуальных рабочих нагрузок приложений.
Учет каждого из этих аспектов поможет вам создать интеллектуальную рабочую нагрузку приложения с согласованным и целостным пользовательским интерфейсом.
Операционная эффективность
Операционная эффективность подразумевает разработку эффективных процессов для поддержки рабочей нагрузки ваших интеллектуальных приложений.
Операционные сбои могут повлиять на другие области проектирования, а также на общую успешность рабочей нагрузки интеллектуального приложения. Важно адаптировать ваши операционные процессы для поддержки интеллектуальной рабочей нагрузки приложений в производстве. Следующие рекомендации способствуют повышению эффективности работы:
- Автоматизируйте процессы сборки и выпуска. Полностью автоматизированные процессы сборки и выпуска сокращают трудности и увеличивают скорость развертывания обновлений, обеспечивая повторяемость и согласованность во всех средах. Автоматизация сокращает Цикл обратной связи — от внесения изменений разработчиками до получения информации о качестве кода, покрытии тестами, отказоустойчивости, безопасности и производительности, которые способствуют повышению производительности труда разработчиков.
- Поддержание управления и соблюдения нормативных требований.
- Проанализируйте производительность и состояние вашей производственной среды.
- Ведите документацию, которая фиксирует:
- Процедуры устранения неполадок
- Планы восстановления после стихийных бедствий
- Предоставить рекомендации по устранению неполадок, позволяющие ускорить процесс решения проблем.
- Придерживайтесь постоянного совершенствования операционной деятельности. Отдайте приоритет регулярному улучшению системы и пользовательского опыта. Используйте модель работоспособности для понимания и измерения операционной эффективности, а также механизмы обратной связи, позволяющие группам разработчиков приложений выявлять и устранять пробелы итеративным образом.
Эти рекомендации помогут вашей команде организовать эффективное и прозрачное сотрудничество.
Оптимизация опыта
Интеллектуальная рабочая нагрузка приложения должна отдавать приоритет дизайну диалога, чтобы обеспечить удобный пользовательский интерфейс, позволяющий пользователям достигать своих целей с минимальными усилиями. Проект должен охватывать темы, с которыми не может справиться генеративный ИИ, и включать резервные механизмы. Также реализуйте механизмы сбора отзывов пользователей и постоянного совершенствования моделей ИИ и рабочей нагрузки на основе этих отзывов.
Оптимизация пользовательского опыта для интеллектуальной рабочей нагрузки приложения включает в себя несколько ключевых соображений:
Дизайн разговора : Создавайте интуитивно понятные и простые в навигации диалоги. Используйте понятный и лаконичный язык и убедитесь, что ИИ может эффективно обрабатывать общие запросы пользователей. Сосредоточьтесь на том, чтобы помочь пользователям достичь своих целей с минимальными усилиями. Понимайте намерения пользователей и быстро предоставляйте соответствующие ответы, чтобы обеспечить бесперебойный и эффективный пользовательский опыт.
Обработка ограничений: Реализуйте резервные механизмы для тем, с которыми генеративный ИИ не может справиться, например, перенаправление пользователей к агентам-людям или предоставление альтернативных ресурсов. Разработайте надежные процессы обработки ошибок, чтобы корректно справляться с неожиданными входными данными. Сообщать пользователям, когда ИИ не может обработать их запрос, и предлагать альтернативные варианты.
Обратная связь с пользователями: Интеграция механизмов для постоянного сбора отзывов пользователей. Microsoft Copilot Studio предоставляет аналитику удовлетворенности клиентов , которая дает полезную информацию о факторах удовлетворенности или неудовлетворенности ответами вашего второго пилота. Используйте собранные отзывы для уточнения и улучшения моделей ИИ и общей рабочей нагрузки. Регулярные обновления, основанные на отзывах пользователей, могут значительно улучшить пользовательский опыт.
Настройка и персонализация: настройте подсказки и инструкции в соответствии с вашими конкретными вариантами использования и потребностями пользователей, чтобы обеспечить более точные и релевантные ответы. Используйте динамическое построение цепочки для автоматизации триггеров и эффективного управления потоками тема, чтобы сократить необходимость в предварительно заданных вручную темах и улучшить способность ИИ распознавать намерения пользователя. Подробнее читайте в разделе Оптимизация подсказок и конфигурации тема.
Следующие шаги
Принципы проектирования Well-Architected Framework включены в области проектирования рабочей нагрузки интеллектуальных приложений. Каждая область проектирования предоставляет целевые рекомендации, которые помогут вам быстро получить доступ к информации, необходимой для эффективного повышения производительности.
Начните с рассмотрения проектных соображений, необходимых для поддержки рабочей нагрузки: