Partilhar via


Modelos de aplicativos de IA

Esta seção da documentação apresenta os modelos de aplicativo de IA e artigos relacionados que usam esses modelos para demonstrar como executar tarefas importantes do desenvolvedor. Os modelos de aplicativos de IA fornecem implementações de referência bem mantidas e fáceis de implantar que ajudam a garantir um ponto de partida de alta qualidade para seus aplicativos de IA.

Há duas categorias de modelos de aplicativos de IA, blocos de construção e soluções de ponta a ponta. As seções a seguir apresentam alguns dos principais modelos em cada categoria para a linguagem de programação que você selecionou na parte superior deste artigo. Para navegar por uma lista mais abrangente, incluindo esses e outros modelos, consulte os modelos de aplicativo AI na galeria AI App Template.

Blocos de criação

Os blocos de construção são exemplos de menor escala que se concentram em cenários e tarefas específicos. A maioria dos blocos de construção demonstra a funcionalidade que aproveita a solução completa para um aplicativo de bate-papo que usa seus próprios dados.

Bloco de construção Description
Balanceamento de carga com Aplicativos de Contêiner do Azure Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Bloco de construção Description
Configurar a segurança de documentos para o aplicativo de chat Ao criar um aplicativo de bate-papo usando o padrão RAG com seus próprios dados, certifique-se de que cada usuário receba uma resposta com base em suas permissões. Um usuário autorizado deve ter acesso às respostas contidas nos documentos do aplicativo de bate-papo. Um utilizador não autorizado não deve ter acesso a respostas de documentos seguros que não tenha autorização para ver.
Avaliar as respostas do aplicativo de bate-papo Saiba como avaliar as respostas de um aplicativo de bate-papo em relação a um conjunto de respostas corretas ou ideais (conhecidas como verdade básica). Sempre que você alterar seu aplicativo de bate-papo de uma forma que afete as respostas, execute uma avaliação para comparar as alterações. Este aplicativo de demonstração oferece ferramentas que você pode usar hoje para facilitar a execução de avaliações.
Balanceamento de carga com Aplicativos de Contêiner do Azure Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Balanceamento de carga com gerenciamento de API Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa o Gerenciamento de API do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Teste de carga do aplicativo de bate-papo Python com Locust Aprenda o processo para executar o teste de carga em um aplicativo de chat Python usando o padrão RAG com Locust, uma ferramenta popular de teste de carga de código aberto. O objetivo principal do teste de carga é garantir que a carga esperada em seu aplicativo de chat não exceda a cota atual do Azure OpenAI Transactions Per Minute (TPM). Ao simular o comportamento do usuário sob carga pesada, você pode identificar possíveis gargalos e problemas de escalabilidade em seu aplicativo.
Proteja seu aplicativo de IA com autenticação sem chave Aprenda o processo para proteger seu aplicativo de chat Python Azure OpenAI com autenticação sem chave. As solicitações de aplicativos para a maioria dos serviços do Azure devem ser autenticadas com conexões sem chave ou sem senha. A autenticação sem chave oferece benefícios aprimorados de gerenciamento e segurança em relação à chave da conta, pois não há nenhuma chave (ou cadeia de conexão) para armazenar.
Bloco de construção Description
Balanceamento de carga com Aplicativos de Contêiner do Azure Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Bloco de construção Description
Avaliar as respostas do aplicativo de bate-papo Saiba como avaliar as respostas de um aplicativo de bate-papo em relação a um conjunto de respostas corretas ou ideais (conhecidas como verdade básica). Sempre que você alterar seu aplicativo de bate-papo de uma forma que afete as respostas, execute uma avaliação para comparar as alterações. Este aplicativo de demonstração oferece ferramentas que você pode usar hoje para facilitar a execução de avaliações.
Balanceamento de carga com Aplicativos de Contêiner do Azure Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Balanceamento de carga com gerenciamento de API Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa o Gerenciamento de API do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.

Soluções end-to-end

As soluções completas são exemplos de referência abrangentes, incluindo documentação, código-fonte e implantação, para permitir que você pegue e estenda para seus próprios propósitos.

Converse com seus dados usando o Azure OpenAI e o Azure AI Search com .NET

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Retrieval-Augmented Generation) em execução no Azure. Ele usa o Azure AI Search para recuperação e modelos de linguagem grandes do Azure OpenAI para potencializar experiências de perguntas e respostas no estilo ChatGPT.

Para começar a usar esse modelo, consulte Introdução ao bate-papo usando seu próprio exemplo de dados para .NET. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-search-openai-demo-csharp .

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end para .NET.

Captura de tela do aplicativo de bate-papo .NET no navegador mostrando várias sugestões para entrada de bate-papo e a caixa de texto do bate-papo para inserir uma pergunta.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps
Funções do Azure
Azure OpenAI
Azure Computer Vision
Reconhecedor de Formato do Azure
Pesquisa de IA do Azure
Armazenamento do Azure
GPT 3.5 Turbo
GPT 4,0

Copiloto de varejo de bate-papo da Contoso com .NET e Kernel Semântico

Este modelo implementa a Contoso Outdoors, uma loja conceitual especializada em equipamentos ao ar livre para entusiastas de caminhadas e camping. Esta loja virtual melhora o envolvimento do cliente e o suporte de vendas através de um agente de chat inteligente. Este agente é alimentado pelo padrão Retrieval Augmented Generation (RAG) dentro do Microsoft Azure AI Stack, enriquecido com suporte a Kernel Semântico e Prompty.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub contoso-chat-csharp-prompty .

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end para o aplicativo de caminhadas.

Screenshot da loja de entusiastas de caminhadas e campismo .NET.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps
Azure OpenAI
Microsoft Entra ID
Identidade Gerida do Azure
Azure Monitor
Pesquisa de IA do Azure
Azure AI Studio
SQL do Azure
Armazenamento do Azure
GPT 3.5 Turbo
GPT 4,0

Automação de processos com fala para texto e sumarização com .NET e GPT 3.5 Turbo

Este modelo é uma solução de automação de processos que recebe problemas relatados por trabalhadores de campo e chão de fábrica em uma empresa chamada Contoso Manufacturing, uma empresa de fabricação que fabrica baterias de carros. Os problemas são compartilhados pelos trabalhadores ao vivo através da entrada do microfone ou pré-gravados como arquivos de áudio. A solução traduz a entrada de áudio de fala para texto e, em seguida, usa um LLM e Prompty ou Promptflow para resumir o problema e retornar os resultados em um formato especificado pela solução.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub summarization-openai-csharp-prompty .

Captura de tela do aplicativo Web .NET com bate-papo lateral para conversão de fala em texto e resumo para a Contoso Manufacturing.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps Conversão de Voz em Texto
Resumo
Azure OpenAI
GPT 3.5 Turbo

Converse com seus dados usando o Azure OpenAI e o Azure AI Search com Python

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Retrieval-Augmented Generation) em execução no Azure. Ele usa a Pesquisa de IA do Azure para recuperação e modelos de linguagem grandes do Azure OpenAI para potencializar experiências no estilo ChatGPT e Perguntas e Respostas (P&R).

Para começar a usar esse modelo, consulte Introdução ao bate-papo usando seu próprio exemplo de dados para Python. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-search-openai-demo .

Captura de tela do aplicativo de bate-papo no navegador mostrando várias sugestões para entrada de bate-papo e a caixa de texto do bate-papo para inserir uma pergunta.

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps Azure OpenAI
Pesquisa de IA do Azure
Armazenamento de Blobs do Azure
Azure Monitor
Azure Document Intelligence
GPT 3.5 Turbo
GPT 4
GPT 4o
GPT 4o-mini

Copiloto de Escrita Criativa Multimodal com DALL-E

Este modelo é uma solução multiagente de escrita criativa para ajudar os usuários a escrever artigos. Ele demonstra como criar e trabalhar com agentes de IA orientados pelo Azure OpenAI.

Inclui:

  1. Um aplicativo Flask que recebe um artigo e instruções de um usuário.
  2. Um agente de pesquisa que usa a API de Pesquisa do Bing para pesquisar o artigo.
  3. Um agente de produto que usa a Pesquisa de IA do Azure para fazer uma pesquisa de semelhança semântica para produtos relacionados de um repositório de vetores.
  4. Um agente escritor para combinar a pesquisa e as informações do produto em um artigo útil.
  5. Um agente editor para refinar o artigo apresentado ao usuário.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub agent-openai-python-prompty .

Diagrama arquitetónico da aplicação copiloto de escrita criativa multi-modal python.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Registo de Contentores do Azure
Azure Kubernetes
Azure OpenAI
Pesquisa Bing
Identidade Gerida do Azure
Azure Monitor
Pesquisa de IA do Azure
Azure AI Studio
GPT 3.5 Turbo
GPT 4,0
DALL-E

Copiloto de varejo de bate-papo da Contoso com o AI Studio

Este modelo implementa o Contoso Chat - uma solução copiloto de varejo para a Contoso Outdoor que usa um padrão de design de geração aumentada de recuperação para fundamentar as respostas do chatbot nos dados do produto e do cliente do varejista. Os clientes podem fazer perguntas do site em linguagem natural e obter respostas relevantes com possíveis recomendações com base em seu histórico de compras - com práticas de IA responsáveis para garantir a qualidade e a segurança da resposta.

Este modelo ilustra o fluxo de trabalho de ponta a ponta (GenAIOps) para criar um copiloto baseado em RAG com o Azure AI e o Prompty. Ao explorar e implantar este exemplo, aprenda a:

  1. Idealize e itere rapidamente em protótipos de aplicativos usando o Prompty
  2. Implantar e usar modelos do Azure OpenAI para bate-papo, incorporações e avaliação
  3. Usar o Azure AI Search (índices) e o Azure Cosmos DB (bancos de dados) para seus dados
  4. Avalie as respostas do chat quanto à qualidade usando fluxos de avaliação assistidos por IA
  5. Hospede o aplicativo como um ponto de extremidade FastAPI implantado em Aplicativos de Contêiner do Azure
  6. Provisionar e implantar a solução usando a CLI do Desenvolvedor do Azure
  7. Apoie práticas de IA responsável com avaliações de segurança de conteúdo e avaliações

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub contoso-chat .

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end para o aplicativo de caminhadas.

Captura de tela do aplicativo de chat com fluxo de prompt no editor visual para o copiloto de varejo de bate-papo da Contoso.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps
Azure OpenAI
Pesquisa de IA do Azure
Azure AI Studio
Prontidão
Azure Cosmos DB
GPT 3.5 Turbo
GPT 4,0
Tempo de execução de integração gerenciada (MIR)

Automação de processos com fala para texto e sumarização com AI Studio

Este modelo cria um aplicativo baseado na Web que permite que os trabalhadores de uma empresa chamada Contoso Manufacturing relatem problemas por meio de texto ou fala. A entrada de áudio é traduzida para texto e, em seguida, resumida para destacar informações importantes e o relatório é enviado para o departamento apropriado.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub summarization-openai-python-promptflow .

Diagrama arquitetônico para automação de processos com fala para texto e sumarização com AI Studio for Python.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps Azure AI Studio
Serviço de Fala para Texto
Prontidão
Tempo de execução de integração gerenciada (MIR)
GPT 3.5 Turbo

Copiloto Assistente de Análise de API com Python e Azure AI Studio

Este modelo é uma API do Assistente para conversar com dados tabulares e realizar análises em linguagem natural.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub assistant-data-openai-python-promptflow .

Diagrama de arquitetura para uma API do Assistente para conversar com dados tabulares e executar análises em linguagem natural.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Serviço do Machine Learning Pesquisa de IA do Azure
Azure AI Studio
Tempo de execução de integração gerenciada (MIR)
Azure OpenAI
GPT 3.5 Turbo
GPT 4

Converse com seus dados usando o Azure OpenAI e o Azure AI Search com Java

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Retrieval-Augmented Generation) em execução no Azure. Ele usa o Azure AI Search para recuperação e modelos de linguagem grandes do Azure OpenAI para potencializar experiências de perguntas e respostas no estilo ChatGPT.

Para começar a usar esse modelo, consulte Introdução ao bate-papo usando seu próprio exemplo de dados para Java. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-search-openai-demo-java .

Diagrama mostrando a arquitetura do cliente para o aplicativo back-end em Java.

Captura de tela do aplicativo de bate-papo Java no navegador mostrando várias sugestões para entrada de bate-papo e a caixa de texto do bate-papo para inserir uma pergunta.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Serviço de Aplicações do Azure
Azure Container Apps
Azure Kubernetes Service
Azure OpenAI
Pesquisa de IA do Azure
Armazenamento do Azure
Azure Monitor

Converse com seus dados usando o Azure OpenAI e o Azure AI Search com JavaScript

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Retrieval-Augmented Generation) em execução no Azure. Ele usa o Azure AI Search para recuperação e modelos de linguagem grandes do Azure OpenAI para potencializar experiências de perguntas e respostas no estilo ChatGPT.

Para começar a usar esse modelo, consulte Introdução ao bate-papo usando seu próprio exemplo de dados para JavaScript. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-search-openai-javascript .

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end.

Captura de tela do aplicativo de bate-papo no navegador mostrando várias sugestões para entrada de bate-papo e a caixa de texto do bate-papo para inserir uma pergunta.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps
Aplicações Web Estáticas do Azure
Azure OpenAI
Pesquisa de IA do Azure
Armazenamento do Azure
Azure Monitor
incorporação de texto-ada-002

Frontend de chat do Azure OpenAI

Este modelo é um componente web de bate-papo OpenAI mínimo que pode ser conectado a qualquer implementação de back-end como cliente.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-openai-chat-frontend .

Vídeo demonstrando o aplicativo de frontend de bate-papo JavaScript.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Aplicações Web Estáticas do Azure Pesquisa de IA do Azure
Azure OpenAI
GPT 3.5 Turbo
GPT4

Bate-papo de IA sem servidor com RAG usando LangChain.js

O modelo é um chatbot de IA sem servidor com Geração Aumentada de Recuperação usando LangChain.js e Azure que usa um conjunto de documentos corporativos para gerar respostas às consultas dos usuários. Ele usa uma empresa fictícia chamada Contoso Real Estate, e a experiência permite que seus clientes façam perguntas de suporte sobre o uso de seus produtos. Os dados de exemplo incluem um conjunto de documentos que descreve seus termos de serviço, política de privacidade e um guia de suporte.

Para saber como implantar e executar esse modelo, consulte Introdução ao bate-papo de IA sem servidor com o RAG usando o LangChain.js. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub serverless-chat-langchainjs .

Saiba como implantar e executar este modelo de referência JavaScript.

Diagrama mostrando a arquitetura da API sem servidor usando LangChainjs para integração com o Serviço OpenAI do Azure e o Azure AI Search.

Vídeo do navegador de demonstração do aplicativo de bate-papo JavaScript usando RAG e Langchain.js

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Aplicações Web Estáticas do Azure
Funções do Azure
Pesquisa de IA do Azure
Azure OpenAI
Azure Cosmos DB
Armazenamento do Azure
Identidade Gerida do Azure
GPT4
Mistral
Ollama