지능형 애플리케이션 워크로드의 설계 원칙
지능형 애플리케이션 워크로드 계획, 개발 및 유지 관리에 대한 지침은 Power Platform Well-Architected와 아키텍처 우수성의 5가지 핵심 요소를 기반으로 합니다.
Well-Architected 핵심 요소 | 요약 |
---|---|
안정성 | 지능형 애플리케이션 워크로드는 AI 모델 및 워크플로의 가용성을 높이고 장애로부터 신속하게 복구할 수 있도록 아키텍처 계층의 복원력이 필요합니다. 강력한 오류 처리 메커니즘을 구현합니다. 또한 복원력 있는 아키텍처는 AI 모델에서 사용하는 데이터의 무결성을 유지하여 일관되고 정확한 출력을 보장합니다. |
보안 | 지능형 애플리케이션 워크로드는 민감한 데이터를 처리하는 경우가 많습니다. AI 모델에서 사용하고 생성하는 민감한 데이터를 보호합니다. 암호화, 액세스 제어 및 정기적인 보안 감사를 구현합니다. 워크로드가 GDPR(일반 데이터 보호 규정) 및 HIPAA(Health Insurance Portability and Accountability Act)와 같은 관련 규정 표준을 준수하여 사용자 개인 정보 및 데이터를 보호하도록 합니다. |
성능 효율성 | 지능형 애플리케이션 워크로드는 증가하는 데이터 볼륨과 사용자 요구에 따라 원활하게 확장되도록 설계되어야 합니다. 핵심 성과 지표를 식별하고 모니터링을 구현하여 워크로드 성능 목표 달성을 위한 진행 상황을 추적합니다. 지능형 애플리케이션 워크로드의 컨텍스트에서 성능은 셀프 서비스를 통해 완료할 수 있는 요청 및 상호 작용의 수도 고려하며, 그렇지 않으면 사람의 개입이 필요했을 것입니다. |
운영 효율성 | 지능형 애플리케이션 워크로드에는 AI 모델, 워크플로 및 대화의 성능과 상태를 추적하기 위한 포괄적인 모니터링 및 로깅이 필요합니다. 모니터링은 문제를 신속하게 식별하고 해결하는 데 도움이 됩니다. 운영 우수성 원칙은 자동화를 사용하여 운영을 간소화하고, 수동 개입을 줄이고, 인적 오류의 위험을 최소화할 것을 권장합니다. |
환경 최적화 | 지능형 애플리케이션 워크로드는 사용자가 최소한의 노력으로 목표를 달성할 수 있는 사용자 친화적인 환경을 보장하기 위해 대화 디자인의 우선 순위를 지정해야 합니다. 설계는 생성형 AI가 처리할 수 없는 주제를 고려하고 대체 메커니즘을 통합해야 합니다. 또한 사용자 피드백을 수집하고 이 피드백을 기반으로 AI 모델 및 워크로드를 지속적으로 개선하는 메커니즘을 구현합니다. |
안정성
Power Platform을 사용하여 지능형 애플리케이션 워크로드를 설계할 때 복원력과 가용성에 집중하세요.
- 복원력은 시스템이 장애에서 복구하고 계속 작동할 수 있는 능력을 말합니다.
- 가용성은 중단 없는 가동 시간을 보장합니다. 고가용성은 애플리케이션 다운타임을 최소화하고 사고로부터의 복구를 향상시킵니다.
안정성은 모든 워크로드 개발에서 중요하며 생성형 AI도 예외는 아닙니다. 실제로 생성형 AI 워크로드를 엔지니어링할 때 고려해야 할 고유한 요소가 있습니다. 복원력을 인식하고 강조하는 것은 생성형 AI 워크로드가 조직의 가용성을 보장하고 비즈니스 연속성을 유지하는 데 필수적입니다.
클라우드에서 오류가 발생할 수 있습니다. 실패를 완전히 방지하려고 하는 대신 단일 실패 구성 요소의 영향을 최소화하는 것이 목표여야 합니다. 다음 정보를 사용하여 가동 중지 시간을 최소화하고 고가용성을 위한 권장 사례가 지능형 애플리케이션 워크로드에 내장되어 있는지 확인합니다.
- 워크로드가 오류를 처리할 수 있고 기능이 저하된 경우에도 계속 작동할 수 있는지 확인합니다. 잠재적인 결함을 식별하고 시스템을 탄력적으로 만들어 이러한 결함을 용인하고 복구할 수 있습니다
- 개발 팀이 실패로부터 배울 수 있도록 워크로드를 관찰할 수 있도록 합니다. 모니터링, 로깅 및 경고 메커니즘을 구현하여 문제를 신속하게 식별하고 해결합니다.
- 다양한 부하를 처리할 수 있도록 워크로드를 확장할 수 있는지 확인하며, 특히 수요 변동이 있을 수 있는 AI 워크로드에 중요합니다.
- 강력한 오류 처리 및 복구 메커니즘을 구현합니다. 시스템 오류에 대한 자동 경고를 설정하고 빠른 복구를 위한 명확한 계획을 수립합니다.
- 대상 아키텍처의 유효성을 검사하고 채팅 메시지 또는 대화의 대상 볼륨을 이해하여 확장합니다. 목표 볼륨은 지능형 애플리케이션의 라이선싱 측면과 대화 내용을 저장하는 Dataverse 저장소에 미치는 잠재적 영향을 검증하는 데에도 도움이 됩니다.
생성형 AI 기능을 사용하는 지능형 애플리케이션의 경우 복원력과 가용성뿐만 아니라 지능형 워크로드가 제공하는 응답의 안정성과 정확성도 고려해야 합니다. 각 디자인 고려 사항에 대해 다음 권장 사항을 고려합니다.
- 검색 증강 생성(RAG)에 최적화: 데이터가 정제되고 잘 구조화되었는지 확인하고, 빠른 검색을 위한 효율적인 임베딩 및 인덱스를 생성하고, 강력한 모니터링 및 피드백 메커니즘을 구현하여 워크로드 성능을 지속적으로 개선합니다.
- 효과적인 프롬프트: AI가 정확한 응답을 생성하도록 안내하기 위해 정확하고 상황에 맞는 프롬프트를 설계합니다.
- 정기 평가: AI 결과물에 대한 지속적인 모니터링 및 테스트를 구현하여 정확성, 관련성 및 윤리적 준수를 평가합니다.
- 피드백 루프: 사용자가 부정확성을 보고할 수 있는 피드백 메커니즘을 설정하여 모델을 정제하고 개선하는 데 사용할 수 있습니다. Microsoft Copilot Studio는 고객 만족도 분석을 제공하며, 이는 에이전트의 응답에 대한 만족도 또는 불만족을 유발하는 요인에 대한 실행 가능한 인사이트를 제공합니다.
- 도메인별 학습: 도메인별 데이터에 대한 모델을 미세 조정하여 특정 컨텍스트에서 정확도를 향상시킵니다.
- 정기 업데이트: 새로운 데이터로 모델을 주기적으로 업데이트하여 관련성과 정확성을 유지합니다.
- 인식할 수 없는 의도: 생성형 답변을 사용하여 사용 가능한 데이터 소스에서 답변을 찾고 대체 토픽을 사용하여 다른 시스템과 통합하여 인식할 수 없는 의도를 처리합니다.
보안
공동 책임 모델:
- 조직은 주로 워크로드 관리 및 운영을 담당합니다.
- Microsoft는 데이터 센터, 네트워크 보안, 물리적 보안 조치, 암호화, ID 관리, 업계 표준 준수와 같은 기본 제공 보안 기능을 포함한 기본 인프라의 보안을 관리합니다. Microsoft Power Platform의 보안과 Copilot Studio 보안 및 거버넌스에서 자세히 알아보세요.
서비스 및 기술을 정기적으로 평가하여 보안 태세가 진화하는 위협 환경에 적응할 수 있도록 하는 것이 좋습니다. 공급업체와의 공동 책임 모델에 대한 명확한 이해를 확립하는 것은 보안 조치를 구현하기 위해 협업할 때 필수적입니다.
다음과 같은 여러 가지 방법을 사용하여 지능형 애플리케이션 워크로드를 보호할 수 있습니다.
- 사용자 인증 및 액세스 제어: 강력한 인증 및 액세스 제어 조치를 구현하여 권한이 있는 사용자만 지능형 애플리케이션 워크로드에 액세스할 수 있도록 합니다. 지능형 애플리케이션 워크로드에 대한 무단 액세스는 데이터 침해, 리소스 오용 및 민감한 정보의 잠재적 노출을 초래할 수 있습니다. 취약하거나 비효율적인 인증 메커니즘으로 인해 사용자 계정이 손상될 수도 있습니다.
- 규정 준수: 데이터가 규정 요구 사항에 따라 보호되고 관리되는지 확인합니다. 현지 규정을 이해하고, 현지 데이터 보호법에 대한 최신 정보를 얻고, 데이터 보존 전략이 이러한 규정을 준수하는지 확인합니다.
- 통합: 서비스 주체와의 모든 통합을 보호합니다. 방화벽 또는 웹 애플리케이션 방화벽과 같은 보안 기능 및 어플라이언스를 통해 내부 및 외부 엔드포인트의 네트워크 무결성을 모니터링하고 보호합니다.
- 지속적인 모니터링 및 감사: 워크로드 활동을 지속적으로 모니터링하고 감사하여 사전에 감지하고 대응합니다.
- Azure 보안 도구: 클라우드용 Microsoft Defender 및 Azure Policy와 같은 Azure의 기본 제공 보안 도구를 사용하여 보안 정책을 모니터링하고 적용합니다.
- 직원 교육: 직원들에게 데이터 보호 모범 사례와 데이터 보존 요구 사항을 준수하는 것의 중요성에 대해 교육합니다.
성능 효율성
성능 효율성은 사용자의 요구 사항을 충족하기 위해 워크로드의 크기를 효율적으로 조정할 수 있는 기능입니다.
성능 효율성 향상:
- 타겟 아키텍처를 검증하고 규모를 확장하기 위해 타겟 볼륨을 이해합니다. 목표 볼륨은 생성형 AI(에이전트)의 라이선싱 측면과 대화 내용을 저장하는 Dataverse 저장소에 미치는 잠재적 영향을 검증하는 데에도 도움이 됩니다.
- 플랫폼 제한 이해. 예를 들어 Power Automate 또는 HTTP 요청을 통해 지능형 애플리케이션 워크로드를 외부 시스템과 통합하는 경우 모든 구성 요소가 부하를 처리할 수 있는지 확인하는 것이 중요합니다.
- Azure Monitor, Log Analytics, Application Insights 및 경고와 같은 도구를 사용하여 성능을 지속적으로 모니터링하고 변칙을 검색합니다.
- 다음에 대한 예상 응답 시간 이해:
- 첫 번째 채팅 로드 및 첫 번째 메시지 응답
- 에이전트가 사용자 쿼리에 응답하는 최대 대기 시간
- 장기 실행 작업을 처리하는 방법(예: 외부 시스템이 데이터를 반환할 때까지 대기)
- 편향률 또는 자동화로 인해 셀프 서비스 방식으로 요청이 완료되는 속도를 최적화합니다(사람의 도움이 필요한 요청 수 감소). 지능형 애플리케이션 워크로드를 위한 성능 최적화에서 자세히 알아보세요.
이러한 각 측면을 고려하면 일관되고 응집력 있는 사용자 환경을 갖춘 지능형 애플리케이션 워크로드를 구축하는 데 도움이 됩니다.
운영 효율성
운영 우수성에는 지능형 애플리케이션 워크로드를 지원하는 효율적인 프로세스 개발이 포함됩니다.
운영 실패는 다른 설계 영역뿐만 아니라 지능형 애플리케이션 워크로드의 전반적인 성공에도 영향을 미칠 수 있습니다. 프로덕션에서 지능형 애플리케이션 워크로드를 지원하도록 운영 프로세스를 조정하는 것이 중요합니다. 다음 권장 사항은 운영 우수성을 주도합니다.
- 빌드 및 릴리스 프로세스를 자동화합니다. 완전히 자동화된 빌드 및 릴리스 프로세스는 마찰을 줄이고 업데이트 배포 속도를 높여 환경 전반에 걸쳐 반복성과 일관성을 제공합니다. 자동화는 개발자가 변경 사항을 푸시하는 것부터 코드 품질, 테스트 검사, 복원력, 보안 및 성능에 대한 인사이트를 얻는 것까지 피드백 루프를 단축하며, 이 모든 것이 개발자 생산성에 기여합니다.
- 거버넌스 및 규정 준수를 유지합니다.
- 프로덕션에서 환경의 성능 및 상태를 분석합니다.
- 다음을 캡처하는 문서를 유지 관리합니다.
- 문제 해결 절차
- 재해 복구 계획
- 문제 해결 프로세스를 가속화하는 방법에 대한 수정 지침을 제공합니다.
- 지속적인 운영 개선을 적극적으로 추구합니다. 시스템 및 사용자 경험의 일상적인 개선을 우선시합니다. 상태 모델을 사용하여 운영 효율성을 이해하고 측정하며, 피드백 메커니즘과 함께 애플리케이션 팀이 반복적인 방식으로 격차를 이해하고 해결할 수 있도록 합니다.
이러한 권장 사항은 팀이 효율적이고 투명한 방식으로 협업하는 데 도움이 될 수 있습니다.
환경 최적화
지능형 애플리케이션 워크로드는 사용자가 최소한의 노력으로 목표를 달성할 수 있는 사용자 친화적인 환경을 보장하기 위해 대화 디자인의 우선 순위를 지정해야 합니다. 설계는 생성형 AI가 처리할 수 없는 주제를 다루어야 하며 대체 메커니즘을 포함해야 합니다. 또한 사용자 피드백을 수집하고 이 피드백을 기반으로 AI 모델 및 워크로드를 지속적으로 개선하는 메커니즘을 구현합니다.
지능형 애플리케이션 워크로드에 대한 사용자 경험 최적화에는 다음과 같은 몇 가지 주요 고려 사항이 포함됩니다.
대화 디자인: 직관적이고 탐색하기 쉬운 대화를 디자인합니다. 명확하고 간결한 언어를 사용하고 AI가 일반적인 사용자 쿼리를 효과적으로 처리할 수 있도록 합니다. 사용자가 최소한의 노력으로 목표를 달성할 수 있도록 돕는 데 중점을 둡니다. 사용자 의도를 이해하고 관련 응답을 신속하게 제공하여 원활하고 효율적인 사용자 경험을 보장합니다.
처리 제한 사항: 생성형 AI가 처리할 수 없는 토픽에 대한 대체 메커니즘을 구현합니다, 예를 들면, 고객 지원 담당자에게 사용자를 리디렉션하거나 대체 리소스를 제공하는 것입니다. 예기치 않은 입력을 정상적으로 관리할 수 있도록 강력한 오류 처리 프로세스를 설계합니다. AI가 요청을 처리할 수 없는 경우 사용자에게 알리고 대안을 제공합니다.
사용자 피드백: 사용자 피드백을 지속적으로 수집하는 메커니즘을 통합합니다. Microsoft Copilot Studio는 에이전트의 응답에 대한 만족도 또는 불만족을 유발하는 요인에 대한 실행 가능한 인사이트를 제공하는 고객 만족도 분석을 제공합니다. 수집된 피드백을 사용하여 AI 모델 및 전체 워크로드를 구체화하고 개선합니다. 사용자 입력을 기반으로 하는 정기적인 업데이트는 사용자 경험을 크게 향상시킬 수 있습니다.
사용자 지정 및 개인 설정: 특정 사용 사례 및 사용자 요구 사항에 맞게 프롬프트와 지침을 사용자 지정하여 보다 정확하고 관련성 높은 응답을 보장합니다. 동적 체인을 사용하여 트리거를 자동화하고 토픽 흐름을 효율적으로 관리하여 수동으로 사전 정의된 토픽의 필요성을 줄이고 사용자 의도를 인식하는 AI의 기능을 개선합니다. 프롬프트 및 토픽 구성 최적화에서 자세히 알아보세요.
다음 단계:
Well-Architected Framework 디자인 원칙은 지능형 애플리케이션 워크로드 디자인 영역에 통합됩니다. 각 디자인 영역은 생산성을 효율적으로 개선하는 데 필요한 정보에 빠르게 액세스하는 데 도움이 되는 맞춤형 지침을 제공합니다.
먼저 워크로드를 지원하는 데 필요한 디자인 고려 사항을 검토합니다.