Saiba como gerar incorporações com o Azure OpenAI
Uma incorporação é um formato especial de representação de dados que pode ser facilmente utilizado por modelos e algoritmos de aprendizado de máquina. A incorporação é uma representação densa de informação do significado semântico de um pedaço de texto. Cada incorporação é um vetor de números de ponto flutuante, de tal forma que a distância entre duas incorporações no espaço vetorial está correlacionada com a semelhança semântica entre duas entradas no formato original. Por exemplo, se dois textos são semelhantes, então suas representações vetoriais também devem ser semelhantes. Incorpora pesquisa de semelhança de vetor de energia em Bancos de Dados do Azure, como Azure Cosmos DB para MongoDB vCore , Banco de Dados SQL do Azure ou Banco de Dados do Azure para PostgreSQL - Servidor Flexível.
Como obter incorporações
Para obter um vetor de incorporação para uma parte do texto, fazemos uma solicitação ao ponto de extremidade de incorporações, conforme mostrado nos seguintes trechos de código:
curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
-H 'Content-Type: application/json' \
-H 'api-key: YOUR_API_KEY' \
-d '{"input": "Sample Document goes here"}'
Melhores práticas
Verifique se as entradas não excedem o comprimento máximo
- O comprimento máximo do texto de entrada para nossos modelos de incorporação mais recentes é de 8.192 tokens. Você deve verificar se suas entradas não excedem esse limite antes de fazer uma solicitação.
- Se enviar uma matriz de entradas em uma única solicitação de incorporação, o tamanho máximo da matriz é 2048.
- Ao enviar uma matriz de entradas em uma única solicitação, lembre-se de que o número de tokens por minuto em suas solicitações deve permanecer abaixo do limite de cota atribuído na implantação do modelo. Por padrão, os modelos de incorporação de 3 gerações mais recentes estão sujeitos a um limite de 350 K TPM por região.
Limitações e riscos
Nossos modelos de incorporação podem não ser confiáveis ou representar riscos sociais em certos casos, e podem causar danos na ausência de mitigações. Reveja o nosso conteúdo de IA Responsável para obter mais informações sobre como abordar a sua utilização de forma responsável.
Próximos passos
- Saiba mais sobre como usar o Azure OpenAI e incorporações para realizar a pesquisa de documentos com nosso tutorial de incorporações.
- Saiba mais sobre os modelos subjacentes que alimentam o Azure OpenAI.
- Armazene suas incorporações e realize pesquisas vetoriais (semelhança) usando o serviço de sua escolha:
- Azure AI Search
- Azure Cosmos DB para MongoDB vCore
- Base de Dados SQL do Azure
- Azure Cosmos DB para NoSQL
- Azure Cosmos DB para PostgreSQL
- Base de Dados do Azure para PostgreSQL – Servidor Flexível
- Cache do Azure para Redis
- Usar o Eventhouse como um banco de dados vetorial - Inteligência em tempo real no Microsoft Fabric