Partilhar via


Princípios de design de cargas de trabalho de aplicativos inteligentes

A orientação sobre planeamento, desenvolvimento e manutenção de cargas de trabalho de aplicativos inteligentes é construída com base no Power Platform Well-Architected e em seus cinco pilares de excelência arquitetônica.

Pilar bem arquitetado Resumo
Fiabilidade Uma carga de trabalho de aplicativo inteligente requer resiliência no camada de arquitetura para garantir que os modelos e fluxos de trabalho de IA estejam altamente disponíveis e possam se recuperar rapidamente de falhas. Implementar mecanismos robustos de tratamento de erros. Uma arquitetura resiliente também mantém a integridade dos dados usados pelos modelos de IA, garantindo saídas consistentes e precisas.
Segurança Uma carga de trabalho de aplicativo inteligente geralmente lida com dados confidenciais. Proteja dados confidenciais usados e gerados por modelos de IA. Implemente criptografia, controles de acesso e auditorias de segurança regulares. Garantir que a carga de trabalho esteja em conformidade com as normas regulamentares relevantes, como RGPD (Regulamento Geral sobre a Proteção de Dados) e HIPAA (Health Insurance Portability and Accountability Act), para proteger a privacidade e os dados do utente.
Eficiência de desempenho Uma carga de trabalho inteligente de aplicativos deve ser projetada para ser dimensionada perfeitamente com volumes de dados e demandas crescentes dos usuários. Identifique as principais métricas de desempenho e implemente o monitoramento para acompanhar o progresso em direção ao cumprimento das metas de desempenho da carga de trabalho. No contexto de cargas de trabalho de aplicativos inteligentes, o desempenho também leva em conta o número de solicitações e interações que podem ser concluídas por meio de autoatendimento, o que, de outra forma, exigiria intervenção humana.
Excelência operacional Uma carga de trabalho de aplicativo inteligente requer monitoramento e registro abrangentes para acompanhar o desempenho e a integridade de modelos, fluxos de trabalho e conversas de IA. O monitoramento ajuda a identificar e resolver problemas rapidamente. O pilar Excelência Operacional recomenda o uso da automação para agilizar as operações, reduzir a intervenção manual e minimizar o risco de erro humano.
Otimização da experiência Uma carga de trabalho de aplicativo inteligente deve priorizar o design de conversação para garantir uma experiência amigável que permita que os usuários atinjam seus objetivos com o mínimo de esforço. O design deve levar em conta tópicos que a IA generativa não pode lidar e incorporar mecanismos de fallback. Implemente também mecanismos para coletar feedback do utente e refinar continuamente os modelos de IA e a carga de trabalho com base nesse feedback.

Fiabilidade

Ao projetar uma carga de trabalho Power Platform de aplicativo inteligente, concentre-se na resiliência e disponibilidade.

  • Resiliência é a capacidade de um sistema se recuperar de falhas e continuar a funcionar.
  • A disponibilidade garante um tempo de atividade ininterrupto. A alta disponibilidade minimiza o tempo de inatividade dos aplicativos e melhora a recuperação de incidentes.

A fiabilidade é importante no desenvolvimento de qualquer carga de trabalho, e a IA generativa não é exceção. Na verdade, há fatores únicos a serem considerados ao projetar cargas de trabalho de IA generativas. Reconhecer e enfatizar a resiliência é essencial para cargas de trabalho de IA generativas para garantir a disponibilidade organizacional e manter a continuidade dos negócios.

Falhas podem acontecer na nuvem. Em vez de tentar evitar completamente as falhas, seu objetivo deve ser minimizar os efeitos de um único componente com falha. Use as seguintes informações para minimizar o tempo de inatividade e garantir que as práticas recomendadas para alta disponibilidade sejam incorporadas à carga de trabalho inteligente do aplicativo:

  • Certifique-se de que a carga de trabalho possa lidar com falhas e continuar a operar, mesmo que com funcionalidade reduzida. Identificar possíveis falhas e tornar o sistema resiliente, para tolerar e recuperar dessas falhas.
  • Torne a carga de trabalho observável para que as equipes de desenvolvimento aprendam com as falhas. Identifique e resolva problemas rapidamente implementando mecanismos de monitoramento, registro e alerta.
  • Certifique-se de que a carga de trabalho possa ser dimensionada para lidar com cargas variáveis, especialmente importante para cargas de trabalho de IA que podem ter demandas flutuantes.
  • Implemente mecanismos robustos de tratamento e recuperação de erros. Configure alertas automatizados para falhas do sistema e tenha um plano claro para recuperação rápida.
  • Valide a arquitetura e a escala de destino compreendendo os volumes de destino de mensagens de bate-papo ou conversas. Os volumes de destino também ajudam a validar os aspetos de licenciamento do aplicativo inteligente e o efeito potencial no Dataverse armazenamento de transcrições de conversas.

Para aplicações inteligentes que usam recursos de IA generativa, considere não apenas a resiliência e a disponibilidade, mas também a fiabilidade e a precisão das respostas fornecidas pela carga de trabalho inteligente. Considere as seguintes recomendações para cada consideração de design:

  • Otimizar para recuperação de geração aumentada (RAG): garanta que seus dados estejam limpos e bem estruturados, crie incorporações e índices eficientes para recuperação rápida e implemente mecanismos robustos de monitoramento e feedback para melhorar continuamente o desempenho da carga de trabalho.
  • Prompts eficazes: crie prompts precisos e contextualmente relevantes para orientar a IA a produzir respostas precisas.
  • Avaliação regular: Implementar monitoramento e testes contínuos de resultados de IA para avaliar a precisão, relevância e adesão ética.
  • Ciclos de feedback: Estabeleça mecanismos de feedback onde os usuários possam relatar imprecisões, que podem ser usados para refinar e melhorar os modelos. Microsoft Copilot Studio fornece análises de satisfação do cliente, que fornecem informações acionáveis sobre os fatores de satisfação ou insatisfação com as respostas do seu copiloto.
  • Treinamento específico de domínio: ajuste modelos em dados específicos de domínio para melhorar a precisão em contextos específicos.
  • Atualizações regulares: atualize periodicamente os modelos com novos dados para manter a sua relevância e precisão.
  • Intenções não reconhecidas: manipule intenções não reconhecidas usando respostas generativas para encontrar respostas de fontes de dados disponíveis e usando o tópico de fallback para integração com outros sistemas.

Segurança

Num modelo de responsabilidade partilhada:

  • As organizações são as principais responsáveis pelo gerenciamento e operação de cargas de trabalho.
  • Microsoft gerencia a segurança da infraestrutura subjacente, incluindo data centers, segurança de rede e medidas de segurança física e recursos de segurança integrados, como criptografia, gerenciamento de identidade e conformidade com os padrões do setor. Saiba mais em Segurança e Microsoft Power Platform Copilot Studio segurança e governança.

Recomendamos que você avalie regularmente os serviços e tecnologias para garantir que sua postura de segurança se adapte ao cenário de ameaças em evolução. Estabelecer uma compreensão clara do modelo de responsabilidade compartilhada com os fornecedores é essencial ao colaborar para implementar medidas de segurança.

Você pode empregar vários métodos para proteger suas cargas de trabalho de aplicativos inteligentes:

  • Autenticação de usuários e controle de acesso: implemente medidas robustas de autenticação e controle de acesso para garantir que apenas usuários autorizados possam acessar a carga de trabalho inteligente do aplicativo. O acesso não autorizado à carga de trabalho inteligente do aplicativo pode resultar em violações de dados, uso indevido de recursos e exposição potencial de informações confidenciais. Mecanismos de autenticação fracos ou ineficazes também podem resultar em contas de utente comprometidas.
  • Conformidade: Garanta que os dados sejam protegidos e gerenciados em conformidade com os requisitos regulamentares. Compreenda os regulamentos locais e mantenha-se informado sobre as leis locais de proteção de dados e garanta que sua estratégia de residência de dados esteja em conformidade com esses regulamentos.
  • Integração: Proteja todas as integrações com entidades de serviço. Monitore e proteger a integridade da rede de endpoints internos e externos por meio de recursos e dispositivos de segurança, como firewalls ou firewalls de aplicativos da Web.
  • Monitoramento e auditoria contínuos: monitore e audite continuamente as atividades de cargas de trabalho para detetar e responder proativamente.
  • Ferramentas de segurança do Azure: use as ferramentas de segurança internas do Azure, como Microsoft o Defender for Cloud e a Política do Azure, para monitorar e aplicar políticas de segurança.
  • Treinamento de funcionários: Treinar os funcionários sobre as melhores práticas de proteção de dados e a importância de aderir aos requisitos de residência de dados.

Eficiência do desempenho

A eficiência de desempenho é a capacidade de sua carga de trabalho de escalar eficientemente para atender às demandas colocadas pelos usuários.

Aumente a eficiência do desempenho ao:

  • Compreender os volumes de destino para validar a arquitetura e a escala de destino. Os volumes de destino também ajudam a validar os aspetos de licenciamento do copiloto e o efeito potencial no Dataverse armazenamento de transcrições de conversas.
  • Compreender os limites da plataforma. Quando você integra sua carga de trabalho de aplicativo inteligente com sistemas externos, por exemplo, por meio Power Automate de solicitações HTTP ou HTTP, é importante validar se cada componente pode lidar com a carga.
  • Monitore continuamente o desempenho e detete anomalias usando ferramentas como Azure Monitor, Log Analytics Application Insights e alertas.
  • Compreender os tempos de resposta esperados para:
    • Primeiro carregamento de chat e primeira mensagem resposta
    • Latência máxima para o copiloto responder às perguntas do utente
    • Abordagem para lidar com ações de longa duração (por exemplo, esperar que um sistema externo retorne dados)
  • Otimizar a taxa de deflexão, ou a taxa na qual as solicitações são concluídas de forma self-service devido à automação (reduzindo o número de solicitações que exigem assistência do agente ao vivo). Saiba mais em Otimização de desempenho para cargas de trabalho inteligentes de aplicativos.

Considerar cada um desses aspetos ajuda você a criar uma carga de trabalho de aplicativo inteligente com uma experiência de utente consistente e coesa.

Excelência operacional

A excelência operacional envolve o desenvolvimento de processos eficientes para dar suporte à carga de trabalho inteligente de seus aplicativos.

Falhas operacionais podem afetar outras áreas de projeto, bem como o sucesso geral da carga de trabalho de aplicativos inteligentes. É importante adaptar seus processos operacionais para dar suporte a uma carga de trabalho inteligente de aplicativos na produção. As seguintes recomendações impulsionam a excelência operacional:

  • Automatize os processos de compilação e lançamento. Processos de compilação e liberação totalmente automatizados reduzem o atrito e aumentam a velocidade de implantação de atualizações, trazendo repetibilidade e consistência entre ambientes. A automação reduz o ciclo de feedback, desde desenvolvedores que promovem alterações até a obtenção de insights sobre qualidade de código, cobertura de testes, resiliência, segurança e desempenho, o que contribui para a produtividade do desenvolvedor.
  • Mantenha a governança e a conformidade.
  • Analise o desempenho e a saúde do seu ambiente na produção.
  • Manter documentação que capture:
    • Procedimentos de solução de problemas
    • Planos de recuperação de catástrofes
  • Fornecer orientações sobre como acelerar o processo de resolução de problemas.
  • Adote a melhoria operacional contínua. Priorizar a melhoria da rotina do sistema e da experiência do utente. Use um modelo de integridade para entender e medir a eficiência operacional, juntamente com mecanismos de feedback para permitir que as equipes de aplicativos compreendam e resolvam as lacunas de maneira iterativa.

Essas recomendações podem ajudar sua equipa a colaborar de forma eficiente e transparente.

Otimização da experiência

Uma carga de trabalho de aplicativo inteligente deve priorizar o design de conversação para garantir uma experiência amigável que permita que os usuários atinjam seus objetivos com o mínimo de esforço. O design deve abordar tópicos que a IA generativa não pode lidar e incluir mecanismos de fallback. Implemente também mecanismos para coletar feedback do utente e refinar continuamente os modelos de IA e a carga de trabalho com base nesse feedback.

A otimização da experiência do utente para uma carga de trabalho de aplicativo inteligente envolve várias considerações importantes:

  • Design de conversação: crie conversas intuitivas e fáceis de navegar. Use uma linguagem clara e concisa e garanta que a IA possa lidar com consultas comuns de usuários de forma eficaz. Concentre-se em ajudar os usuários a atingir seus objetivos com o mínimo de esforço. Compreenda as intenções do utente e forneça respostas relevantes rapidamente para garantir uma experiência de utente perfeita e eficiente.

  • Limitações de manipulação: implemente mecanismos de fallback para tópicos que a IA generativa não pode lidar, como redirecionar usuários para agentes humanos ou fornecer recursos alternativos. Projete processos robustos de tratamento de erros para gerenciar entradas inesperadas graciosamente. Informe os utilizadores quando a IA não conseguir processar o seu pedido e ofereça alternativas.

  • Feedback do utente: integre mecanismos para coletar feedback do utente continuamente. Microsoft Copilot Studio fornece análises de satisfação do cliente que fornecem informações acionáveis sobre os fatores de satisfação ou insatisfação com as respostas do seu copiloto. Use o feedback coletado para refinar e melhorar os modelos de IA e a carga de trabalho geral. Atualizações regulares com base na entrada do utente podem melhorar significativamente a experiência do utente.

  • Personalização e personalização: Personalize prompts e instruções para se alinhar com seus casos de uso específicos e necessidades do utente, para garantir respostas mais precisas e relevantes. Use encadeamento dinâmico para automatizar gatilhos e gerenciar fluxos de tópico de forma eficiente para reduzir a necessidade de tópicos predefinidos manualmente e melhorar a capacidade da IA de reconhecer a intenção do utente. Saiba mais em Otimizar prompts e tópico configuração.

Próximos passos

Os princípios de design do Well-Architected Framework são incorporados em áreas de projeto de carga de trabalho de aplicativos inteligentes. Cada área de design fornece orientação direcionada para ajudá-lo a acessar rapidamente as informações de que precisa para melhorar a produtividade de forma eficiente.

Comece analisando as considerações de design necessárias para dar suporte a uma carga de trabalho: