Compartilhar via


Princípios de design de cargas de trabalho de aplicativos inteligentes

A orientação sobre planejamento, desenvolvimento e manutenção de cargas de trabalho de aplicativos inteligentes é baseada no Well-Architected e seus cinco pilares de excelência arquitetônica. Power Platform

Pilar bem arquitetado Resumo
Confiabilidade Uma carga de trabalho de aplicativo inteligente requer resiliência na arquitetura camada para garantir que os modelos e fluxos de trabalho de IA estejam altamente disponíveis e possam se recuperar rapidamente de falhas. Implemente mecanismos robustos de tratamento de erros. Uma arquitetura resiliente também mantém a integridade dos dados usados pelos modelos de IA, garantindo resultados consistentes e precisos.
Segurança Uma carga de trabalho de aplicativo inteligente geralmente lida com dados confidenciais. Proteja dados confidenciais usados e gerados por modelos de IA. Implemente criptografia, controles de acesso e auditorias de segurança regulares. Garanta que a carga de trabalho esteja em conformidade com os padrões de regulamentação relevantes, como RGPD (Regulamento Geral sobre a Proteção de Dados) e HIPAA (Health Insurance Portability and Accountability Act), para proteger privacidade e dados do usuário.
Eficiência de desempenho Uma carga de trabalho de aplicativo inteligente deve ser projetada para escalar perfeitamente com o aumento dos volumes de dados e das demandas dos usuários. Identifique as principais métricas de desempenho e implemente o monitoramento para monitorar o progresso em direção ao alcance das metas de desempenho da carga de trabalho. No contexto de cargas de trabalho de aplicativos inteligentes, o desempenho também leva em consideração o número de solicitações e interações que podem ser concluídas por meio de autoatendimento, o que, de outra forma, exigiria intervenção humana.
Excelência operacional Uma carga de trabalho de aplicativo inteligente requer monitoramento e registro abrangentes para rastrear o desempenho e a integridade de modelos de IA, fluxos de trabalho e conversas. O monitoramento ajuda a identificar e resolver problemas rapidamente. O pilar Excelência Operacional recomenda o uso da automação para otimizar as operações, reduzir a intervenção manual e minimizar o risco de erro humano.
Otimização de experiência Uma carga de trabalho de aplicativo inteligente deve priorizar o design de conversação para garantir uma experiência amigável que permita aos usuários atingir seus objetivos com o mínimo de esforço. O design deve levar em conta tópicos que a IA generativa não consegue lidar e incorporar mecanismos de fallback. Implemente também mecanismos para coletar feedback do usuário e refinar continuamente os modelos de IA e a carga de trabalho com base nesse feedback.

Confiabilidade

Ao projetar uma carga de trabalho de aplicativo inteligente com Power Platform, concentre-se na resiliência e na disponibilidade.

  • Resiliência é a capacidade de um sistema se recuperar de falhas e continuar a funcionar.
  • Disponibilidade garante tempo de atividade ininterrupto. A alta disponibilidade minimiza o tempo de inatividade do aplicativo e melhora a recuperação de incidentes.

A confiabilidade é importante no desenvolvimento de qualquer carga de trabalho, e a IA generativa não é exceção. Na verdade, There são fatores únicos a serem considerados ao projetar cargas de trabalho de IA generativa. Reconhecer e enfatizar a resiliência é essencial para cargas de trabalho de IA generativa para garantir a disponibilidade organizacional e manter a continuidade dos negócios.

Falhas podem acontecer na nuvem. Em vez de tentar evitar falhas por completo, seu objetivo deve ser minimizar os efeitos de um único componente com falha. Use as seguintes informações para minimizar o tempo de inatividade e garantir que as práticas recomendadas para alta disponibilidade sejam incorporadas à carga de trabalho do seu aplicativo inteligente:

  • Garanta que a carga de trabalho possa lidar com falhas e continuar operando, mesmo com funcionalidade reduzida. Identificar falhas potenciais e tornar o sistema resiliente para tolerar e se recuperar dessas falhas.
  • Torne a carga de trabalho observável para que as equipes de desenvolvimento aprendam com as falhas. Identifique e resolva problemas rapidamente implementando mecanismos de monitoramento, registro e alerta.
  • Garanta que a carga de trabalho possa ser dimensionada para lidar com cargas variáveis, o que é especialmente importante para cargas de trabalho de IA que podem ter demandas flutuantes.
  • Implemente mecanismos robustos de tratamento e recuperação de erros. Configure alertas automatizados para falhas do sistema e tenha um plano claro para recuperação rápida.
  • Valide a arquitetura e a escala de destino entendendo os volumes de destino de mensagens de bate-papo ou conversas. Os volumes de destino também ajudam a validar os aspectos de licenciamento do aplicativo inteligente e o efeito potencial no armazenamento de transcrições de conversas. Dataverse

Para aplicativos inteligentes que usam recursos de IA generativa, considere não apenas a resiliência e a disponibilidade, mas também a confiabilidade e a precisão das respostas fornecidas pela carga de trabalho inteligente. Considere as seguintes recomendações para cada consideração de design:

  • Otimize para geração aumentada de recuperação (RAG): garanta que seus dados estejam limpos e bem estruturados, crie incorporações e índices eficientes para recuperação rápida e implemente mecanismos robustos de monitoramento e feedback para melhorar continuamente o desempenho da carga de trabalho.
  • Avisos eficazes : Crie prompts precisos e contextualmente relevantes para guia a IA e produzir respostas precisas.
  • Avaliação regular : Implementar monitoramento e testes contínuos de resultados de IA para avaliar precisão, relevância e adesão ética.
  • Ciclos de feedback : Estabelecer mecanismos de feedback onde os usuários podem relatar imprecisões, que podem então ser usadas para refinar e melhorar os modelos. Microsoft Copilot Studio fornece análise de satisfação do cliente, que fornecem insights acionáveis sobre os fatores de satisfação ou insatisfação com as respostas do seu copiloto.
  • Treinamento específico de domínio : Ajuste modelos em dados específicos de domínio para aumentar a precisão em contextos específicos.
  • Atualizações regulares : Atualize periodicamente os modelos com novos dados para manter sua relevância e precisão.
  • Intenções não reconhecidas: manipule intenções não reconhecidas usando Respostas generativas para encontrar respostas de fontes de dados disponíveis e usando tópico de fallback para integrar com outros sistemas.

Segurança

Em um modelo de responsabilidade compartilhada:

  • As organizações são as principais responsáveis por gerenciar e operar cargas de trabalho.
  • Microsoft gerencia a segurança da infraestrutura subjacente, incluindo data centers, segurança de rede e medidas de segurança física e recursos de segurança integrados, como criptografia, geranciamento de identidade e conformidade com os padrões do setor. Saiba mais em Segurança em Microsoft Power Platform e Copilot Studio segurança e governança.

Recomendamos que você avalie regularmente os serviços e tecnologias para garantir que sua postura de segurança se adapte ao cenário de ameaças em evolução. Estabelecer um entendimento claro do modelo de responsabilidade compartilhada com os fornecedores é essencial ao colaborar para implementar medidas de segurança.

Você pode empregar vários métodos para proteger suas cargas de trabalho de aplicativos inteligentes:

  • Autenticação de usuário e controle de acesso: implemente medidas robustas de autenticação e controle de acesso para garantir que somente usuários autorizados possam acessar a carga de trabalho do aplicativo inteligente. O acesso não autorizado à carga de trabalho do aplicativo inteligente pode resultar em violações de dados, uso indevido de recursos e possível exposição de informações confidenciais. Mecanismos de autenticação fracos ou ineficazes também podem resultar em contas de usuários comprometidas.
  • Conformidade: Garanta que os dados sejam protegidos e gerenciados em conformidade com os requisitos regulatórios. Entenda as regulamentações locais, mantenha-se informado sobre as leis locais de proteção de dados e garanta que sua estratégia de residência de dados esteja em conformidade com essas regulamentações.
  • Integração: Proteja todas as integrações com os principais serviços. Monitore e proteger a integridade da rede de endpoints internos e externos por meio de recursos e dispositivos de segurança, como firewalls ou firewalls de aplicativos da web.
  • Monitoramento e auditoria contínuos: Monitore e audite continuamente as atividades das cargas de trabalho para detectar e responder proativamente.
  • Ferramentas de segurança do Azure: use as ferramentas de segurança integradas do Azure, como o Microsoft Defender for Cloud e o Azure Policy, para monitorar e aplicar políticas de segurança.
  • Treinamento de funcionários: treine os funcionários sobre as melhores práticas de proteção de dados e a importância de aderir aos requisitos de residência de dados.

Eficiência de desempenho

Eficiência de desempenho é a capacidade da sua carga de trabalho de ser dimensionada com eficiência para atender às demandas colocadas sobre ela pelos usuários.

Aumente a eficiência do desempenho por:

  • Entender os volumes de destino para validar a arquitetura e a escala de destino. Os volumes de destino também ajudam a validar os aspectos de licenciamento do copiloto e o efeito potencial no armazenamento de transcrições de conversas. Dataverse
  • Compreendendo os limites da plataforma. Ao integrar sua carga de trabalho de aplicativo inteligente com sistemas externos, por exemplo, por meio de solicitações HTTP, é importante validar se cada componente pode lidar com a carga. Power Automate
  • Monitoramento contínuo do desempenho e detecção de anomalias usando ferramentas como Azure Monitor, Log Analytics, Application Insights e alertas.
  • Compreendendo os tempos esperados de resposta para:
    • Primeiro carregamento de chat e primeira mensagem resposta
    • Latência máxima para o copiloto responder às consultas do usuário
    • Abordagem para lidar com ações de longa duração (por exemplo, esperar que um sistema externo retorne dados)
  • Otimizar a taxa de deflexão, ou a taxa na qual as solicitações são concluídas de forma self-service devido à automação (reduzindo o número de solicitações que exigem assistência agente humano). Saiba mais em Otimização de desempenho para cargas de trabalho de aplicativos inteligentes.

Considerar cada um desses aspectos ajuda você a criar uma carga de trabalho de aplicativo inteligente com uma experiência de usuário consistente e coesa.

Excelência operacional

A excelência operacional envolve o desenvolvimento de processos eficientes para dar suporte à carga de trabalho de seus aplicativos inteligentes.

Falhas operacionais podem afetar outras áreas de design, bem como o sucesso geral da carga de trabalho do aplicativo inteligente. É importante adaptar seus processos operacionais para dar suporte a uma carga de trabalho de aplicativos inteligentes em produção. As recomendações a seguir impulsionam a excelência operacional:

  • Automatize processos de criação e lançamento. Processos de criação e lançamento totalmente automatizados reduzem o atrito e aumentam o velocidade de implantação de atualizações, trazendo repetibilidade e consistência entre ambientes. A automação encurta o loop de feedback, desde os desenvolvedores forçando mudanças até a obtenção de insights sobre qualidade de código, cobertura de testes, resiliência, segurança e desempenho, tudo isso contribuindo para a produtividade do desenvolvedor.
  • Manter governança e conformidade.
  • Analise o desempenho e a saúde do seu ambiente na produção.
  • Manter documentação que capture:
    • Procedimentos de solução de problemas
    • Planos de recuperação de desastres
  • Forneça orientação de correção sobre como acelerar o processo de resolução de problemas.
  • Adote a melhoria operacional contínua. Priorize a melhoria rotineira do sistema e da experiência do usuário. Use um modelo de saúde para entender e medir a eficiência operacional, juntamente com mecanismos de feedback para permitir que as equipes de aplicativos entendam e solucionem lacunas de maneira iterativa.

Essas recomendações podem ajudar sua equipe a colaborar de forma eficiente e transparente.

Otimização de experiência

Uma carga de trabalho de aplicativo inteligente deve priorizar o design de conversação para garantir uma experiência amigável que permita aos usuários atingir seus objetivos com o mínimo de esforço. O design deve abordar tópicos que a IA generativa não consegue lidar e incluir mecanismos de fallback. Implemente também mecanismos para coletar feedback do usuário e refinar continuamente os modelos de IA e a carga de trabalho com base nesse feedback.

Otimizar a experiência do usuário para uma carga de trabalho de aplicativo inteligente envolve diversas considerações importantes:

  • Design de conversação : Crie conversas que sejam intuitivas e fáceis de navegar. Use uma linguagem clara e concisa e garanta que a IA possa lidar com consultas comuns dos usuários de forma eficaz. Concentre-se em ajudar os usuários a atingir seus objetivos com o mínimo de esforço. Entenda as intenções do usuário e forneça respostas relevantes rapidamente para garantir uma experiência de usuário eficiente e contínua.

  • Lidando com limitações: implemente mecanismos de fallback para tópicos que a IA generativa não consegue lidar, como redirecionar usuários para agentes humanos ou fornecer recursos alternativos. Crie processos robustos de tratamento de erros para gerenciar entradas inesperadas com elegância. Informe os usuários quando a IA não puder processar sua solicitação e ofereça alternativas.

  • Feedback do usuário: Integre mecanismos para coletar feedback do usuário continuamente. Microsoft Copilot Studio fornece análises de satisfação do cliente que fornecem insights acionáveis sobre os fatores de satisfação ou insatisfação com as respostas do seu copiloto. Use o feedback coletado para refinar e melhorar os modelos de IA e a carga de trabalho geral. Atualizações regulares com base na entrada do usuário podem melhorar significativamente a experiência do usuário.

  • Personalização e personalização: personalize prompts e instruções para alinhar com seus casos de uso específicos e necessidades do usuário, para garantir respostas mais precisas e relevantes. Use encadeamento dinâmico para automatizar gatilhos e gerenciar fluxos tópico de forma eficiente para reduzir a necessidade de tópicos predefinidos manualmente e melhorar a capacidade da IA de reconhecer a intenção do usuário. Saiba mais em Otimizar prompts e configuração tópico.

Próximas etapas

Os princípios de design do Well-Architected Framework são incorporados em áreas de design de carga de trabalho de aplicativos inteligentes. Cada área de design fornece orientação direcionada para ajudar você a acessar rapidamente as informações necessárias para melhorar a produtividade de forma eficiente.

Comece revisando as considerações de design necessárias para dar suporte a uma carga de trabalho: