Compartir a través de


Uso del conector en memoria (versión preliminar)

Advertencia

La funcionalidad Almacén de vectores de kernel semántico está en versión preliminar y las mejoras que requieren cambios importantes pueden producirse en circunstancias limitadas antes de la versión.

Información general

El conector del almacén de vectores en memoria es una implementación del almacén de vectores proporcionada por kernel semántico que no usa ninguna base de datos externa y almacena datos en memoria. Este almacén de vectores es útil para escenarios de creación de prototipos o en los que se requieren operaciones de alta velocidad en memoria.

El conector tiene las siguientes características.

Área de características Soporte técnico
La colección se asigna a Diccionario en memoria
Tipos de propiedades de clave admitidos Cualquier tipo que se pueda comparar
Tipos de propiedad de datos admitidos Cualquier tipo
Tipos de propiedades vectoriales admitidos ReadOnlyMemory<float>
Tipos de índice admitidos Plano
Funciones de distancia admitidas
  • CosineSimilarity
  • CosineDistance
  • DotProductSimilarity
  • EuclideanDistance
Cláusulas de filtro admitidas
  • AnyTagEqualTo
  • EqualTo
Admite varios vectores en un registro
¿Se admite IsFilterable?
¿Se admite IsFullTextSearchable?
¿Se admite StoragePropertyName? No, dado que el almacenamiento está en memoria y la reutilización de datos no es posible, por lo tanto, no es posible asignar nombres personalizados.

Introducción

Agregue el paquete nuget Kernel Core semántico al proyecto.

dotnet add package Microsoft.SemanticKernel.Connectors.InMemory --prerelease

Puede agregar el almacén de vectores al contenedor de inserción de dependencias disponible en KernelBuilder o al IServiceCollection contenedor de inserción de dependencias mediante métodos de extensión proporcionados por kernel semántico.

using Microsoft.SemanticKernel;

// Using Kernel Builder.
var kernelBuilder = Kernel
    .CreateBuilder()
    .AddInMemoryVectorStore();
using Microsoft.SemanticKernel;

// Using IServiceCollection with ASP.NET Core.
var builder = WebApplication.CreateBuilder(args);
builder.Services.AddInMemoryVectorStore();

Puede construir directamente una instancia de Almacén de vectores de InMemory.

using Microsoft.SemanticKernel.Connectors.InMemory;

var vectorStore = new InMemoryVectorStore();

Es posible construir una referencia directa a una colección con nombre.

using Microsoft.SemanticKernel.Connectors.InMemory;

var collection = new InMemoryVectorStoreRecordCollection<string, Hotel>("skhotels");

Búsqueda de propiedades de clave y vector

De forma predeterminada, el conector del almacén de vectores In-Memory leerá los valores de las claves y vectores utilizando reflexión. Se supone que las claves y los vectores son propiedades directas en el modelo de datos.

Si se requiere un modelo de datos que tiene una estructura en la que las claves y los vectores no son propiedades directas del modelo de datos, es posible proporcionar funciones para leer los valores de estos.

Al utilizar esto, también es necesario suministrar un VectorStoreRecordDefinition para que se pueda comunicar información sobre el tamaño de la dimensión vectorial y la función de distancia al almacén de vectores de In-Memory.

var collection = new InMemoryVectorStoreRecordCollection<string, MyDataModel>(
    "mydata",
    new()
    {
        VectorStoreRecordDefinition = vectorStoreRecordDefinition,
        KeyResolver = (record) => record.Key,
        VectorResolver = (vectorName, record) => record.Vectors[vectorName]
    });

private class MyDataModel
{
    public string Key { get; set; }
    public Dictionary<string, ReadOnlyMemory<float>> Vectors { get; set; }
}

Información general

El conector del almacén de vectores en memoria es una implementación del almacén de vectores proporcionada por kernel semántico que no usa ninguna base de datos externa y almacena datos en memoria. Este almacén de vectores es útil para escenarios de creación de prototipos o en los que se requieren operaciones de alta velocidad en memoria.

El conector tiene las siguientes características.

Área de características Soporte técnico
La colección se asigna a Diccionario en memoria
Tipos de propiedades de clave admitidos Cualquiera que pueda ser una clave dict, consulte la documentación de Python para obtener más información aquí
Tipos de propiedad de datos admitidos Cualquier tipo
Tipos de propiedades vectoriales admitidos list[float | int] | matriz numpy
Tipos de índice admitidos Plano
Funciones de distancia admitidas
  • Similitud de coseno
  • Distancia de coseno
  • Similitud de producto de puntos
  • Distancia euclidiana
  • Distancia cuadrada euclidiana
  • Distancia de Manhattan
  • Distancia de Hamming
Admite varios vectores en un registro
¿Se admite is_filterable?
¿Está admitido is_full_text_searchable?

Introducción

Agregue el paquete kernel semántico al proyecto.

pip install semantic-kernel

Puede crear el almacén y las colecciones desde allí o crear las colecciones directamente.

En los fragmentos de código siguientes, se supone que tiene una clase de modelo de datos definida denominada "DataModel".

from semantic_kernel.connectors.memory.in_memory import InMemoryVectorStore

vector_store = InMemoryVectorStore()
vector_collection = vector_store.get_collection("collection_name", DataModel)

Es posible construir una referencia directa a una colección con nombre.

from semantic_kernel.connectors.memory.in_memory import InMemoryCollection

vector_collection = InMemoryCollection("collection_name", DataModel)

Próximamente

Más información próximamente.