Умные рекомендации: как направить генеративные системы знаниями экспертов

Автор: Денис Аветисян


Новый подход позволяет интегрировать экспертные знания в генеративные рекомендательные системы, повышая их точность и персонализацию без радикальной перестройки архитектуры.

Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.

Купить акции "голубых фишек"
Учет предпочтений пользователей приводит к более персонализированным рекомендациям, особенно для малочисленных групп, что позволяет улучшить качество предлагаемого контента для всех категорий пользователей.
Учет предпочтений пользователей приводит к более персонализированным рекомендациям, особенно для малочисленных групп, что позволяет улучшить качество предлагаемого контента для всех категорий пользователей.

В статье представлена схема, использующая адаптеры для эффективного внедрения структурированных человеческих приоритетов в генеративные модели рекомендаций.

Несмотря на растущую популярность генеративных рекомендательных систем, накопленные индустрией знания о предметной области, такие как таксономии товаров и временные закономерности, часто упускаются из виду. В статье ‘Don’t Waste It: Guiding Generative Recommenders with Structured Human Priors via Multi-head Decoding’ предложен фреймворк, интегрирующий эти структурированные знания непосредственно в процесс обучения генеративных моделей посредством легковесных адаптеров. Такой подход позволяет одновременно повысить точность, разнообразие и персонализацию рекомендаций, не требуя значительных изменений в архитектуре базовой модели. Способны ли подобные методы открыть новые возможности для эффективного использования накопленного опыта в разработке интеллектуальных рекомендательных систем?


За Пределами Последовательного Моделирования: Понимание Контекста

Традиционные системы рекомендаций, основанные на последовательном моделировании, часто не способны уловить полную картину предпочтений пользователя и характеристик элементов. Эти модели ориентированы на краткосрочные взаимодействия, упуская долгосрочные интересы. Проблема в том, что существующие подходы игнорируют контекст взаимодействия. Это приводит к рекомендациям, релевантным лишь моменту, но не соответствующим общим интересам. Необходим переход к целостному представлению поведения пользователя.

Представление пространства признаков для конкретного пользователя на Pixel8M демонстрирует разделение истории просмотров, целевых элементов и наиболее рекомендуемых позиций, при этом различные цвета указывают на рекомендации, сформированные разными интересами или
Представление пространства признаков для конкретного пользователя на Pixel8M демонстрирует разделение истории просмотров, целевых элементов и наиболее рекомендуемых позиций, при этом различные цвета указывают на рекомендации, сформированные разными интересами или «головами» модели.

Для получения всесторонней картины поведения требуется выйти за рамки предсказания последовательностей и включить богатый контекст. Это подразумевает учет не только действий пользователя, но и причин, мотивировавших их. Такой подход позволяет создавать рекомендации, соответствующие интересам и долгосрочным потребностям. Истинная элегантность рекомендаций – в их логической непротиворечивости и соответствии глубинным мотивам пользователя.

Генеративные Системы: Новый Подход к Рекомендациям

Генеративные системы рекомендаций предлагают альтернативу традиционным подходам, формулируя задачу как задачу трансдукции. Это позволяет создавать гибкие и контекстно-зависимые прогнозы, адаптированные к потребностям пользователей. Они используют архитектуру Transformer для моделирования сложных последовательных зависимостей в поведении пользователей, улавливая долгосрочные связи и контекст. В отличие от коллаборативной фильтрации или контентного анализа, генеративные системы учитывают сложные паттерны взаимодействия.

Анализ данных Pixel8M показывает, что история просмотров пользователя, целевые элементы и предсказания базовой модели HLLM (отфильтрованные по категориям
Анализ данных Pixel8M показывает, что история просмотров пользователя, целевые элементы и предсказания базовой модели HLLM (отфильтрованные по категориям «Информационные и образовательные») соответствуют предсказаниям разработанной модели, ориентированной на долгосрочные «Информационные и образовательные» интересы пользователя.

Эффективность подтверждена на больших наборах данных (Pixel8M, MerRec, EB-NeRD). Результаты демонстрируют улучшение до 2.000 в метрике Recall@10 по сравнению с базовыми моделями, что свидетельствует о значительном превосходстве генеративных подходов.

Обогащение Знаниями: Приоритизация и Представление

Эффективное включение априорных знаний о пользователе ($Human Priors$) критически важно для управления генеративными моделями и повышения качества рекомендаций. Использование обучения с разделением представлений ($Disentangled Representation Learning$) и сетей мульти-интересов ($Multi-Interest Networks$) позволяет получить более тонкое понимание предпочтений пользователей.

Использование иерархической композиции стратегии с временными ($LT/ST2$) и графовыми приоритетами позволяет эффективно структурировать и комбинировать различные источники информации для формирования более точных и релевантных рекомендаций.
Использование иерархической композиции стратегии с временными ($LT/ST2$) и графовыми приоритетами позволяет эффективно структурировать и комбинировать различные источники информации для формирования более точных и релевантных рекомендаций.

Иерархическая композиция усиливает этот процесс, позволяя наслоить несколько априорных знаний и представлений. Графовые априорные знания ($Graph-Based Priors$) обеспечивают структурное понимание взаимосвязей между элементами. Адаптерные головы ($Adapter Heads$) – легковесные модули для интеграции этих знаний в предварительно обученные генеративные модели, включая большие языковые модели ($LLMs$), с минимальными накладными расходами (всего 0.14%).

Влияние и Перспективы: К Холистическим Рекомендациям

Эффективное сочетание генеративного моделирования и внедрения знаний позволяет создавать системы, которые выходят за рамки простого предсказания и понимают потребности пользователей, формируя полные профили и предлагая релевантные рекомендации, подтвержденные улучшением метрики NDCG@10. Предложенная схема демонстрирует относительное увеличение NDCG на 15.76% для пользователей с новыми интересами на EB-NeRD, подчеркивая способность персонализировать рекомендации даже для ранее неизвестных предпочтений.

Контрастивное обучение может быть использовано для дальнейшей оптимизации векторных представлений элементов. Будущие исследования сосредоточатся на изучении более сложных методов представления и интеграции различных типов знаний, а также на решении проблем масштабируемости и интерпретируемости. Истинное понимание потребностей пользователя должно привести к предсказуемо релевантным рекомендациям.

Представленное исследование демонстрирует стремление к математической чистоте в области рекомендательных систем. Авторы, подобно истинному математику, ищут элегантное решение, интегрируя человеческий опыт в генеративные модели посредством адаптеров. Этот подход, избегая сложных архитектурных изменений, напоминает о стремлении к доказательству корректности, а не просто к эмпирической работе на тестовых данных. Как однажды заметил Карл Фридрих Гаусс: «Если бы я мог, я бы построил математическую теорию всего». Данная работа, фокусируясь на интеграции человеческих приоритетов и дизентангованном представлении данных, является шагом в этом направлении, стремясь к созданию более надежных и понятных рекомендательных систем.

Куда же дальше?

Представленный подход, интегрирующий априорные знания экспертов в генеративные рекомендательные системы посредством адаптеров, безусловно, является шагом в правильном направлении. Однако, не стоит обманываться кажущейся элегантностью. Простое добавление «адаптеров» не решает фундаментальную проблему: как формализовать и представить сложные, часто неявные, человеческие предпочтения в виде математически строгой модели. Недостаточно знать, что пользователь предпочитает «фантастику», необходимо понимать нюансы его вкусов, эволюцию интересов во времени и контекст, в котором совершается выбор. Иначе, мы лишь создаем более изощренную версию существующего хаоса.

Будущие исследования должны быть сосредоточены на разработке более выразительных и интерпретируемых представлений человеческих приоритетов. Необходимы методы, позволяющие извлекать априорные знания не только из явных категорий или временных шаблонов, но и из неструктурированных данных – отзывов, социальных взаимодействий, даже мимолетных выражений. Крайне важно уйти от эмпирической оценки «работоспособности» и стремиться к доказательной базе, подтверждающей математическую корректность модели.

В конечном счете, в хаосе данных спасает только математическая дисциплина. Лишь строгое формальное описание позволит создавать действительно интеллектуальные рекомендательные системы, способные предвосхищать желания пользователя, а не просто перебирать варианты в надежде на удачу. И это – задача не для инженеров, а для математиков.


Оригинал статьи: https://arxiv.org/pdf/2511.10492.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-11-14 14:43