Noções básicas sobre inserção
Uma inserção é um tipo de representação de dados que é usada por modelos de aprendizado de máquina. Uma inserção representa o significado semântico de uma parte do texto. Você pode visualizar uma inserção como uma matriz de números, e a distância numérica entre duas inserções representa a semelhança semântica delas. Por exemplo, se dois textos forem semelhantes, as representações deles também deverão ser semelhantes.
Inserir modelos
A eficácia dos resultados da pesquisa será uma correlação direta com a eficácia do modelo inserido.
Existem modelos criados especificamente para executar bem uma tarefa específica. Use as inserções de pesquisa de Similaridade para capturar a semelhança semântica entre as partes de um texto. Uma inserção de pesquisa de Texto pode examinar a relevância de um documento longo para uma consulta curta. Use snippets de código de inserção e consultas de pesquisa em linguagem natural por meio de uma inserção de pesquisa de Código.
Os usuários fornecem uma entrada para uma consulta de um modelo de inserção que é convertido de texto em um vetor usando, por exemplo, o modelo text-embedding-ada-002 para gerar inserções de texto.
O resultado mostrará todos os documentos correspondentes à consulta contidos no índice de pesquisa. Os documentos, com as inserções contendo campos vetoriais, precisam existir no índice de pesquisa, e o mesmo modelo precisa ser usado para indexação e consulta.
Espaço de inserção
O espaço de inserção é o centro das consultas vetoriais, que compreende todos os campos vetoriais do mesmo modelo de inserção. Ele é composto por todos os campos vetoriais preenchidos com base no mesmo modelo.
Nesse espaço de inserção, os itens semelhantes estão localizados próximos uns dos outros, e os itens diferentes estão mais distantes.
Por exemplo, os documentos que falam sobre hotéis com parque aquático estariam próximos uns dos outros no espaço de inserção, ao passo que os hotéis sem essa instalação estariam mais distantes, mas ainda assim na vizinhança dos hotéis. Conceitos diferentes, como restaurantes, ficarão ainda mais distantes. Na prática, os espaços de inserção são abstratos e não têm significados bem definidos e compreensíveis para as pessoas, mas a ideia básica permanece a mesma.