ScalarQuantizationCompression interface
Contém opções de configuração específicas para o método de compactação de quantização escalar usado durante a indexação e a consulta.
- Extends
Propriedades
kind | Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser |
parameters | Contém os parâmetros específicos para a Quantização Escalar. |
Propriedades herdadas
compression |
O nome a ser associado a essa configuração específica. |
default |
Fator de sobrecarga padrão. A sobrecarga solicitará internamente mais documentos (especificados por esse multiplicador) na pesquisa inicial. Isso aumenta o conjunto de resultados que serão reclassificados usando pontuações de similaridade recomputadas de vetores de precisão total. O valor mínimo é 1, o que significa que não há sobrecarga (1x). Esse parâmetro só pode ser definido quando rerankWithOriginalVectors for true. Valores mais altos melhoram o recall em detrimento da latência. |
rerank |
Se definido como true, depois que o conjunto ordenado de resultados calculado usando vetores compactados for obtido, eles serão reclassificados novamente recalculando as pontuações de similaridade de precisão total. Isso melhorará o recall em detrimento da latência. |
Detalhes da propriedade
kind
Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser
kind: "scalarQuantization"
Valor da propriedade
"scalarQuantization"
parameters
Contém os parâmetros específicos para a Quantização Escalar.
parameters?: ScalarQuantizationParameters
Valor da propriedade
Detalhes das propriedades herdadas
compressionName
O nome a ser associado a essa configuração específica.
compressionName: string
Valor da propriedade
string
defaultOversampling
Fator de sobrecarga padrão. A sobrecarga solicitará internamente mais documentos (especificados por esse multiplicador) na pesquisa inicial. Isso aumenta o conjunto de resultados que serão reclassificados usando pontuações de similaridade recomputadas de vetores de precisão total. O valor mínimo é 1, o que significa que não há sobrecarga (1x). Esse parâmetro só pode ser definido quando rerankWithOriginalVectors for true. Valores mais altos melhoram o recall em detrimento da latência.
defaultOversampling?: number
Valor da propriedade
number
rerankWithOriginalVectors
Se definido como true, depois que o conjunto ordenado de resultados calculado usando vetores compactados for obtido, eles serão reclassificados novamente recalculando as pontuações de similaridade de precisão total. Isso melhorará o recall em detrimento da latência.
rerankWithOriginalVectors?: boolean
Valor da propriedade
boolean
Herdado deBaseVectorSearchCompression.rerankWithOriginalVectors