Compartir vía


P+F sobre el modelado de Intelligent Recommendations

Este artículo proporciona una investigación más profunda de los tipos de algoritmos de modelado que utiliza el servicio de Intelligent Recommendations y proporciona respuestas a las preguntas de modelado comunes.

Contenido

Información general de los algoritnos de Intelligent Recommendations

El componente Modelado de Intelligent Recommendations utiliza algunos algoritmos diferentes para crear listas clasificadas. La List API responde a las consultas y devuelve resultados según el tipo de algoritmo seleccionado para el modelado. En la siguiente tabla se proporciona más información sobre los tipos de Algoritmos utilizados por el servicio de Intelligent Recommendations:

[!Nota]

Como práctica recomendada, use Experimentación para comparar los resultados de algunos tipos de lista diferentes tipos de lista y/o tipos de datos antes de tomar una decisión final sobre qué algoritmo es mejor para su caso de uso empresarial y conjunto de datos (que es un una combinación de los tipos de datos y el comportamiento real).

Tipo de algoritmo Descripción
Factorización de matrices (MF) La factorización matricial es un tipo de algoritmo de filtrado colaborativo que se centra en la creación de usuario a elemento y de elemento a elemento Relaciones en función de las interacciones específicas del usuario (compra, uso, clics, visualizaciones, descargas, etc.). Este tipo de algoritmo clasifica listas basadas en las preferencias históricas de un usuario específico, que es lo que llamamos su clasificación personal basada en "Gustos". También deriva similitudes entre elementos en función de las interacciones de los usuarios con los elementos.

La factorización de matrices genera simétrica (si 'A' es similar a 'B' entonces 'B' también es similar a 'A') y transitiva (si 'A' es similar a 'B', y 'B' es similar a 'C', entonces 'A' es similar a 'C') clasificaciones. Para obtener los mejores resultados, use el tipo de algoritmo Matrix Factorization cuando use un conjunto de datos con señales de interacción sustanciales y metadatos de catálogo. Esta característica es excelente para dominios de entretenimiento como películas y televisión, juegos o transmisión, pero funciona bien en otros dominios que dependen de las señales de interacción del cliente, incluidos: comercio minorista, supermercado, itinerarios de viaje, fabricación y más.
Similitudes asociadas directas (DAS) El algoritmo de similitudes asociadas directas (DAS) es adecuado para dominios de afinidad locales/dirigidos con necesidades basadas en la utilidad, como las aplicaciones, donde la utilidad es más importante que la preferencia histórica (gusto). Por ejemplo, las personas que hacen acciones 'A', luego 'B' y luego 'C', tienden a hacer acciones 'D' después. DAS es asimétrico y no asociativo.

Nuestro servicio utiliza el algoritmo DAS para potenciar la API Next Best Action, que crea sugerencias de contenido basadas en agrupaciones distintas y repetibles. Una aplicación común de Next Best Action se ve a menudo en las experiencias de pago minorista en escenarios de "completar cesta" como Frecuentemente comprados juntos, que proporciona sugerencias de artículos complementarios en función del contenido del carrito de un usuario.

DAS también puede recombinar grupos y recomendar elementos de diferentes subdominios. Por ejemplo, a un comprador de una tienda de comestibles se le pueden recomendar servilletas y platos con sus hamburguesas y panecillos en su carrito.

Los dominios que se benefician de "Next Best Action" incluyen Supermercados, Ventas, Solución de problemas, Contabilidad y más.
Similitud basada en elementos visuales (VBS) Visual-Based Similarity (VBS) es un algoritmo de cognición visual de aprendizaje profundo que devuelve recomendaciones visualmente similares para elementos con imágenes similares, para un elemento inicial determinado. Al igual que la factorización de matrices, las recomendaciones producidas por el algoritmo VBS son simétricas.

Esta red neuronal convolucional de aprendizaje profundo utiliza 'Argus' como columna vertebral, sin embargo, se entrena aún más utilizando técnicas más profundas en las imágenes del inquilino para ver invariantes, proporcionando recomendaciones mucho más relevantes para el dominio del inquilino. VBS es increíblemente poderoso en dominios como la moda, el diseño y la joyería, donde los atributos visuales son una parte importante de las ventas del producto.
Similitud basada en texto (TBS) El algoritmo de similitud basada en texto (TBS) devuelve recomendaciones textualmente similares para un elemento semilla dado, al enfocarse en entrenar un modelo de lenguaje en los títulos y descripciones de los elementos en el catálogo proporcionado. Este algoritmo funciona especialmente bien en dominios donde los títulos y las descripciones son descriptivos, produciendo recomendaciones únicas e intuitivas. El modelo utiliza el modelo de lenguaje basado en el transformador 'TNLR' como columna vertebral; sin embargo, el modelo también utiliza transferencia de aprendizaje y técnicas de capacitación más profundas en el conjunto de datos proporcionado, lo que permite que este algoritmo proporcione recomendaciones de última generación que semánticamente tienen sentido. .

TBS utiliza procesamiento de lenguaje natural (NLP) como entrada, lo que hace que este algoritmo sea aplicable en muchos dominios diferentes, incluidos: itinerarios de viaje y excursiones, bodegas, bases de datos de investigación de revistas científicas, solución de problemas y más.
Listas de exploración Las listas de exploración permiten explorar un catálogo utilizando gráficos basados en heurística ordenados por información como ventas totales, suma de clics, fecha de lanzamiento o una combinación de diferentes métricas. Las listas admitidas son: 'Nuevo', 'Tendencia', 'Popular'. Los gráficos son un excelente punto de partida para que los usuarios finales interactúen rápidamente con sus productos y vean lo mejor y más nuevo de su catálogo de productos.

Las listas de navegación se pueden aumentar aún más cambiando el tipo de interacción de entrada. Por ejemplo, un modelo basado en señales de compra devuelve "productos comprados más populares", mientras que cambiar las señales del modelo a vistas devuelve "Productos vistos más populares".

Volver al principio

Preguntas frecuentes

Esta sección cubre una serie de preguntas frecuentes sobre los modelos de Intelligent Recommendations y sus aplicaciones.

¿Cómo puedo hacer un seguimiento del estado de modelado?

Los clientes de Intelligent Recommendations pueden realizar un seguimiento del estado de modelado de cada uno de los modelos que han creado en su cuenta. Después de configurar un modelo, el servicio creará periódicamente un archivo de registro de estado para informar sobre el estado actual de todos los algoritmos (con respecto a su nivel de modelado). Para obtener más información sobre cómo acceder a estos registros, consulte la Guía de informes de estado de modelado.

Volver al principio

¿Qué algoritmo y tipo de lista debo usar para mi empresa?

La selección de un tipo de lista y un algoritmo para usar depende del caso de uso comercial, la experiencia y los datos disponibles para el modelado. Consulte Tablas ListNames, AlgoTypes y Refinements para obtener una lista completa de nombres de listas y combinaciones de algoritmos disponibles.

En general, las interacciones de modelado reflejan aquello con lo que interactúan las personas. Por ejemplo, describimos el tipo de lista "Personas también", que utiliza el algoritmo MF, como "clientes que realizan esta acción, también realizan esta acción". Cuando la acción es compra, la lista se convierte en "Personas que compraron esto, también compraron".

Los metadatos de elementos también se pueden utilizar para establecer similitudes entre elementos, suponiendo que los metadatos sean suficientes en volumen y calidad. Por ejemplo, los artículos con descripciones similares pueden considerarse estrechamente relacionados, al igual que los artículos con imágenes de productos similares pueden estar estrechamente relacionados. Estos metadatos han sido útiles para crear resultados para elementos cuando es posible que no haya interacciones disponibles (también conocido como modelado de "elementos fríos").

Los enfoques que combinan interacciones y basados en metadatos (para elementos y/o usuarios) se pueden usar con Intelligent Recommendations para personalizar los escenarios y las experiencias. Use múltiples modelos diferentes (y use un modelo por cuenta) para experimentar y ver qué enfoque funciona mejor para sus casos de uso.

Asignación de tipos de datos disponibles y casos de uso al tipo de algoritmo

Tipo de datos disponible Escenarios Algoritmo
Interacciones
Por ejemplo, visualizaciones, compras, uso, etc. ¿Qué hicieron los usuarios?
Picking para usted
Personalización
La gente también hace
Próxima mejor acción
Factorización de matrices (MF)

Asociación dirigida (DAS)
Metadatos textuales
Ej.: título y descripción
Descripción similar Similitud basada en elementos textuales (TBS)
Metadatos visuales
P.ej., imágenes de productos desde múltiples ángulos
Aspecto similar
Nota: No todos los dominios se ajustan a este escenario. Debe usarlo en el caso de que las imágenes sean una buena representación de un elemento.
Similitud basada en elementos visuales (VBS)
Otros metadatos de elemento
P.ej., Forma, Categoría, Etiquetas, etc.
Igual que Interacciones.
El servicio también permite construir modelos de diferentes formas:
- De manera híbrida combinando metadatos de elementos con interacciones
- O construido utilizando solo metadatos de artículos (con algoritmos MF o DAS)
Factorización de matrices (MF)

Asociación dirigida (DAS)
Metadatos de usuario
Ej., datos demográficos
Los escenarios relevantes están relacionados con la personalización del usuario:
- Picking para usted
- Personalización

El servicio permite construir modelos de diferentes formas:
- De manera híbrida combinando metadatos de usuario con interacciones
- O construido utilizando solo metadatos de usuario (con algoritmos MF o DAS)
Factorización de matrices (MF)

Asociación dirigida (DAS)

Volver al principio

¿Cómo debo decidir si usar los algoritmos de factorización matricial o de asociación directa?

Se recomienda probar ambos con sus datos para ver qué algoritmo arroja resultados más adecuados según los requisitos de su negocio.

Pruebe el algoritmo de factorización matricial (MF) si:

  • La conexión entre los elementos de su dominio es principalmente conmutativa (simétrica, es decir, si A=>B entonces B=>A) y asociativa (es decir, si A=>B y B=>C entonces A=>B).
  • Sus datos son escasos y aún desea obtener suficientes recomendaciones para muchos artículos.

Pruebe el algoritmo de asociación directa (DAS) si:

  • La conexión entre los elementos de su dominio es principalmente directiva (asimétrica, es decir, A=>B no significa B=>A) y directa (no asociativa).
  • La 'Próxima mejor acción' (dada una lista ordenada de elementos, cuál debería ser la siguiente) es un escenario importante para usted.
  • Desea recomendar un subdominio de sus artículos a otro.
  • La conexión directa que aparece más debería reflejarse más en los resultados.

Para obtener más información, consulte Tablas ListNames, AlgoTypes y Refinements.

Volver al principio

¿Cuántas interacciones necesito para garantizar buenas recomendaciones?

Para modelar correctamente un damian para un conjunto de productos importantes, cada producto debe contener al menos cinco interacciones o más para escenarios como "A la gente también le gusta" o "Selecciones" (personalización). También necesitaría suficientes interacciones que incluyan más de un producto, que está agrupado por InteractionGroupingId (cada artículo en el mismo pedido tendría una fila en la entidad de datos Interactions con el mismo InteractionGroupingId) para generar resultados para "Siguiente mejor acción".

Una buena regla general es intentar tener unas cinco veces la cantidad de interacciones que la cantidad de elementos. por ejemplo, si hay 1000 artículos en el catálogo, sería bueno intentar modelar con al menos 5000 interacciones.

En caso de duda, ayuda probarlo con un modelo simple (menos columnas) y tantas interacciones (más filas) en la entrada conjunto de datos como sea posible. Para evaluar la calidad de su contrato de datos y ver métricas sobre el rendimiento del modelo, consulte Paneles de recomendaciones inteligentes.

Volver al principio

¿Por qué necesito que se incluyan InteractionGroupingId, UserId, ItemId e ItemVariantId con mi entidad de datos de interacciones?

InteractionGroupingId indica para los grupos conectados al sistema, especialmente para los elementos, para una mejor inferencia general en todos los ámbitos. Por ejemplo, agrupar transacciones por InteractionGroupingId en el escenario minorista puede ayudar al sistema a saber qué productos se "compran juntos con frecuencia" en un carrito de compras, o tareas que se completan en un rol para "Próxima mejor acción", o artículos similares en "Personas". también como".

UserId es usado por el sistema para modelar las relaciones formadas entre los elementos y los usuarios que interactúan con los elementos, que dependiendo de cómo se enfoque el modelo, puede crear escenarios de modelado personalizados y no personalizados. En el enfoque personalizado con UserId, el sistema modela una asignación entre usuarios y artículos, basado en las preferencias históricas de cada usuario individual. Luego produce el modelo "basado en su historial anterior, le podría gustar", denominado "Selecciones para usted".

ItemId es la referencia al artículo real. Es esencial conectar cada elemento con sus interacciones y permitir que los patrones emerjan en el modelo. Los ItemIds que no tienen interacciones no aparecerán en las recomendaciones de otros productos y también pueden sufrir recomendaciones deficientes cuando se usan como semilla para modelos como "A las personas a las que les gusta este artículo también les gusta".

ItemVariantId se utiliza principalmente para el escenario de "apariencia similar" y el algoritmo de similitud basado en visualización (VBS), que tiene en cuenta los metadatos de la imagen en lugar de las interacciones. Este campo no es obligatorio para modelos y algoritmos que se basan en interacciones.

Para obtener más información sobre las entidades de datos requeridas por escenario, consulte la Tabla de asignación de entidades de datos.

Volver al principio

¿Puedo usar metadatos de artículos, como categoría, color, modelo, etc.?

Los metadatos de elementos pueden ser útiles de muchas maneras:

  • Es mejor modelar los elementos además para la entrada de interacciones, por lo que los elementos con pocas o incluso ninguna interacción (elementos fríos) aún pueden obtener recomendaciones de “A la gente también le gusta”.
  • Es posible tener un modelo basado completamente en los metadatos del elemento (como las etiquetas de contenido) y devolver un resultado de recomendaciones del tipo "elementos similares".
    • Cómo hacer esto: Dé al elemento de metadatos un TagId. En la entidad de datos de interacciones, para cada fila de interacción, establezca InteractionGroupingId como TagId, manteniendo el elemento como ItemId y el usuario como UserID. Para obtener más información sobre cómo funcionan los TagIds, consulta la guía para el etiquetado y la clasificación de metadatos.

[!NOTA IMPORTANTE]

Utilice una cuenta separada para el modelo basado en metadatos de elementos, de modo que tenga 1 modelo de IR por cuenta de IR, y estén separados del modelo/cuenta puramente basados en las interacciones del usuario.

  • Los elementos con descripciones textuales informativas pueden obtener recomendaciones de "Descripción similar", impulsadas por nuestro modelo profundo de NLP.
  • Los elementos y variantes con imágenes pueden obtener recomendaciones de "aspecto similar", impulsadas por nuestro modelo de aprendizaje profundo de cognición visual.

Volver arriba.

¿Puedo usar metadatos de usuario, como datos demográficos, para personalizar recomendaciones?

El servicio de Intelligent Recommendations permite a los clientes incluir metadatos de usuario a través de un proceso de etiquetado de metadatos. Los metadatos del usuario pueden ser útiles para recomendar contenido relevante a todos los usuarios, como

  • Clientes nuevos o poco frecuentes (también conocidos como "usuarios en frío").
  • Conectando usuarios con atributos comunes con etiquetado de metadatos. Para obtener más información sobre la clasificación de datos demográficos con recomendaciones y ver ejemplos, consulte la guía para el etiquetado y clasificación de metadatos.

Volver arriba.

¿Puedo hacer recomendaciones de usuario a usuario?

Por el momento, no se admiten las recomendaciones completas de usuario a usuario. Por ahora, es posible que algunos conjuntos de datos obtengan recomendaciones de usuario a usuario al realizar algunos cambios en el contrato de datos:

  • Para cada entrada de interacción original, construya cada fila para:
    • Escriba ItemID en la columna InteractionGroupingId
    • Escriba UserID en la columna ItemId
    • Realice la solicitud de API: después de realizar los cambios anteriores en el contrato de datos, se llamará al tipo de lista "Personas también" con el ID de usuario y devolverá una lista de usuarios similares.

Volver arriba.

¿Dónde puedo obtener más información sobre el modelo de factorización matricial que se utiliza con las Intelligent Recommendations?

Nuestro modelo MF: filtrado colaborativo de una clase con gráficos aleatorios. Desarrollamos una versión interna de factorización de matriz bayesiana, que describimos aquí y se puede usar para aprender cualquier incrustación como explicamos aquí.

Volver arriba.

Consulte también

Guía de solución de problemas
Códigos de estado de API
Contrato de datos
Tabla de asignación de entidades de datos.
Guía de etiquetado y agrupación de metadatos.