Умные рекомендации: как понять поведение пользователя

Автор: Денис Аветисян


Новая модель MB-DGT использует динамические графы и нейронные сети для более точного предсказания интересов пользователя, учитывая историю его действий.

Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.

Купить акции "голубых фишек"
Последовательная рекомендация множественных действий анализирует взаимодействие пользователей с течением времени, демонстрируя динамику выбора для каждого из трёх рассматриваемых субъектов.
Последовательная рекомендация множественных действий анализирует взаимодействие пользователей с течением времени, демонстрируя динамику выбора для каждого из трёх рассматриваемых субъектов.

Исследование посвящено разработке и анализу Boundary-Aware Multi-Behavior Dynamic Graph Transformer (MB-DGT) для улучшения рекомендаций на основе последовательности действий пользователя.

В современных рекомендательных системах учет динамики пользовательских взаимодействий и разнообразия поведенческих паттернов представляет собой сложную задачу. В данной работе, посвященной ‘Boundary-Aware Multi-Behavior Dynamic Graph Transformer for Sequential Recommendation’, предложена модель MB-DGT, использующая динамические графы и трансформаторные сети для более точного моделирования предпочтений пользователей. Ключевой особенностью подхода является учет границ между различными типами поведения и адаптация структуры графа к изменяющимся взаимодействиям, что позволяет получить более полное представление о предпочтениях. Способна ли данная архитектура обеспечить существенный прогресс в области многоповеденческих последовательных рекомендаций и адаптироваться к новым типам пользовательской активности?


Пределы Традиционных Рекомендательных Систем

Существующие системы рекомендаций, такие как основанные на матричной факторизации (DMF, NGCF), зачастую испытывают трудности при моделировании всей сложности поведения пользователей. Эти методы, как правило, рассматривают взаимодействия пользователя как независимые сигналы, упуская из виду последовательность и многогранность реальных выборов. Например, при просмотре видео пользователь не просто выбирает ролик, а движется по цепочке контента, зависящей от предыдущих просмотров, времени суток и даже настроения. Игнорирование этих факторов приводит к упрощенному представлению о предпочтениях, что снижает точность рекомендаций и, как следствие, уменьшает вовлеченность пользователя. Неспособность учесть динамику поведения и контекст взаимодействия является ключевым ограничением традиционных подходов к построению рекомендательных систем.

Традиционные системы рекомендаций зачастую рассматривают каждое взаимодействие пользователя с контентом как изолированное событие, игнорируя последовательность и сложность реальных потребительских решений. Вместо анализа динамики выбора, когда предыдущие действия оказывают влияние на последующие, эти методы полагаются на статичные профили и общие закономерности. Например, покупка одного товара не рассматривается в контексте предыдущих приобретений или текущих потребностей, что приводит к неполному пониманию предпочтений. Подобный подход не учитывает, что поведение пользователя формируется под влиянием множества факторов, включая временные рамки, контекст использования и личные цели. В результате, рекомендации могут быть нерелевантными или предсказуемыми, не отражая истинные интересы и потребности пользователя, и упуская возможности для персонализированного опыта.

В результате, существующие системы рекомендаций зачастую не способны обеспечить действительно персонализированный и релевантный опыт для пользователя. Не учитывая динамику предпочтений и многогранность поведения, они предлагают варианты, которые не соответствуют текущим потребностям или интересам. Это приводит к разочарованию пользователей, снижению вовлеченности и, как следствие, к упущенным возможностям для бизнеса — будь то потерянные продажи, снижение лояльности или неэффективное использование рекламного бюджета. Пользователи, не получающие адекватные рекомендации, склонны искать альтернативные источники информации и услуг, что подчеркивает важность разработки более совершенных алгоритмов, способных предвидеть и удовлетворять индивидуальные запросы.

Архитектура MB-DGT, рассматривающая пользователей как целевые узлы, состоит из двух основных модулей: кодирования сериализованных представлений для восприятия поведенческих ассоциаций и агрегации информации о соседних узлах с учетом времени.
Архитектура MB-DGT, рассматривающая пользователей как целевые узлы, состоит из двух основных модулей: кодирования сериализованных представлений для восприятия поведенческих ассоциаций и агрегации информации о соседних узлах с учетом времени.

Последовательность и Мультиповеденческие Данные: Новый Взгляд

Последовательные модели рекомендаций, такие как SASRec, BERT4Rec, Caser и GRU4Rec, представляют собой значительный прогресс по сравнению с традиционными подходами, поскольку они учитывают порядок действий пользователей. В отличие от методов, рассматривающих взаимодействия как независимые события, эти модели анализируют последовательность действий, что позволяет выявлять временные зависимости и паттерны поведения. Использование рекуррентных нейронных сетей (RNN) или механизмов внимания позволяет моделям «помнить» предыдущие действия пользователя и использовать эту информацию для прогнозирования следующих. Это особенно важно в сценариях, где порядок взаимодействий влияет на предпочтения пользователя, например, при просмотре видео или прослушивании музыки.

Традиционные модели последовательных рекомендаций, такие как SASRec, BERT4Rec, Caser и GRU4Rec, зачастую рассматривают каждое действие пользователя как изолированное событие. Это означает, что взаимосвязи между различными типами взаимодействий — например, просмотры, добавления в корзину и покупки — не учитываются. В результате, модель может неверно интерпретировать намерения пользователя, поскольку не использует информацию о том, как различные типы поведения коррелируют друг с другом. Например, последовательность «просмотр -> добавление в корзину -> покупка» предоставляет более полную информацию о предпочтениях пользователя, чем просто последовательность просмотров, но многие модели не используют эти взаимосвязи в полной мере.

Многоповеденческая рекомендация направлена на улучшение качества предсказаний за счет одновременного анализа различных типов сигналов взаимодействия пользователя. Вместо рассмотрения каждого действия изолированно, данный подход учитывает совокупность действий, таких как просмотры, добавления в корзину, покупки и оценки. Это позволяет сформировать более полное представление о предпочтениях пользователя, поскольку разные типы поведения могут указывать на различные аспекты его интересов и намерений. Например, частые просмотры определенной категории товаров в сочетании с добавлением нескольких позиций в корзину могут сигнализировать о высокой вероятности совершения покупки, в то время как только просмотры могут указывать на исследовательский интерес.

Истинный потенциал рекомендательных систем заключается в объединении последовательного моделирования и учета множественных типов поведения пользователя. Такой подход позволяет не просто предсказывать следующий элемент взаимодействия, но и понимать как и почему пользователь совершает те или иные действия. Последовательное моделирование, например, с использованием SASRec или BERT4Rec, фиксирует порядок действий, а учет множественных типов поведения (клики, покупки, просмотры) позволяет учитывать взаимосвязи между различными сигналами. Комбинирование этих двух подходов дает возможность создавать более точные и персонализированные рекомендации, отражающие сложные паттерны поведения пользователя и его истинные предпочтения.

Представленные графы временных взаимодействий, построенные для пользователя и элемента в момент <span class="katex-eq" data-katex-display="false">T_4</span>, демонстрируют двухшаговые мультиповеденческие связи между ними.
Представленные графы временных взаимодействий, построенные для пользователя и элемента в момент T_4, демонстрируют двухшаговые мультиповеденческие связи между ними.

MB-DGT: Динамический Графовый Трансформер в Действии

MB-DGT представляет собой новый подход к моделированию взаимодействия пользователей и элементов, объединяющий динамические графовые структуры, сети-трансформеры и агрегацию с учетом времени. В основе метода лежит представление поведения пользователей в виде узлов динамического графа, что позволяет адаптироваться к изменяющимся интересам и контексту взаимодействия. Использование трансформеров обеспечивает моделирование корреляций между различными типами поведения, а агрегация с учетом времени позволяет учитывать временные тенденции и последовательность действий пользователя для повышения точности рекомендаций. Данная интеграция позволяет MB-DGT эффективно захватывать сложные взаимосвязи между пользователями и элементами, превосходя традиционные методы.

В основе подхода MB-DGT лежит представление поведения пользователей в виде узлов динамического графа. Каждый узел соответствует конкретному действию пользователя (например, просмотр товара, добавление в корзину, покупка). Связи между узлами отражают последовательность действий и их взаимосвязь. Динамичность графа обеспечивается его постоянным обновлением в соответствии с новыми действиями пользователя, что позволяет модели адаптироваться к изменяющимся интересам и учитывать контекст взаимодействия. Такое представление позволяет учитывать не только текущее поведение, но и историю действий, что критически важно для точного прогнозирования будущих предпочтений и формирования персонализированных рекомендаций.

Модель MB-DGT использует трансформаторную архитектуру для моделирования корреляции между различными сигналами поведения пользователя. Вместо обработки каждого типа поведения изолированно, трансформаторы позволяют учитывать взаимосвязи между просмотрами, добавлениями в корзину, покупками и другими действиями. Это достигается путем представления каждого поведения как отдельного входного вектора, которые затем обрабатываются слоями внимания (attention layers). Эти слои выявляют, какие типы поведения оказывают наибольшее влияние друг на друга, позволяя модели улавливать сложные паттерны и генерировать более точные прогнозы. В результате, модель способна учитывать контекст каждого действия и формировать более полное представление о предпочтениях пользователя.

Персонализированное прогнозирование с учетом границ (Boundary-Aware Personalized Prediction) и агрегация с учетом времени (Time-Aware Aggregation) позволяют уточнить рекомендации, принимая во внимание индивидуальные пороги чувствительности пользователей и временные тенденции их поведения. В частности, для каждого пользователя устанавливается индивидуальный порог принятия решения о взаимодействии с элементом, что предотвращает перегрузку нерелевантными предложениями. Временная агрегация учитывает, что влияние предыдущих действий пользователя со временем ослабевает, а также позволяет выявлять сезонные или краткосрочные изменения в предпочтениях, что повышает точность и актуальность рекомендаций. Алгоритм адаптирует веса исторических взаимодействий, придавая больший вес недавним событиям и учитывая изменение интересов пользователя во времени.

Визуализация зависимостей между различными поведенческими стратегиями, полученная с помощью MB-DGT, показывает, как важно учитывать взаимосвязь между ними для достижения оптимального результата, где интенсивность цвета указывает на степень этой взаимосвязи.
Визуализация зависимостей между различными поведенческими стратегиями, полученная с помощью MB-DGT, показывает, как важно учитывать взаимосвязь между ними для достижения оптимального результата, где интенсивность цвета указывает на степень этой взаимосвязи.

Влияние и Перспективы: Новый Горизонт Рекомендаций

Результаты всесторонних оценок на авторитетных наборах данных, включая Yelp, Taobao и Tmall, демонстрируют устойчивое превосходство модели MB-DGT над существующими передовыми рекомендательными системами, такими как DMF, NGCF, SASRec, BERT4Rec, BINN, DIPN, MGNN-SPred, DMT, MBHT и MB-STR. Постоянно более высокие показатели, достигнутые MB-DGT в ходе экспериментов, свидетельствуют о ее повышенной способности к точному прогнозированию предпочтений пользователей и эффективному формированию релевантных рекомендаций. Данное превосходство подтверждается в различных сценариях и при использовании различных метрик оценки, что подчеркивает надежность и универсальность предлагаемого подхода к построению рекомендательных систем.

Оценка предложенной модели MB-DGT проводилась с использованием стандартных метрик, таких как Hit Ratio (HR) и Normalized Discounted Cumulative Gain (NDCG), которые широко применяются для оценки качества систем рекомендаций. Результаты демонстрируют устойчивое превосходство MB-DGT над существующими моделями на этих показателях. Более высокие значения HR и NDCG указывают на то, что система более эффективно предоставляет релевантные рекомендации, повышая вероятность того, что пользователь найдет интересующий его контент или продукт. Достижение лучших результатов по этим метрикам подтверждает эффективность предложенного подхода к моделированию предпочтений пользователей и его потенциал для улучшения качества рекомендаций в различных приложениях.

Модель MB-DGT демонстрирует выдающуюся эффективность, достигая превосходных результатов при анализе последовательностей соседей длиной всего в 10 единиц. Это особенно примечательно, учитывая, что существующие передовые модели для достижения сопоставимой точности требуют обработки значительно более длинных последовательностей — до 50 единиц. Сокращение необходимой длины последовательности не только оптимизирует вычислительные затраты и ускоряет процесс обучения, но и повышает устойчивость модели к шуму в данных, что делает MB-DGT более практичным решением для реальных рекомендательных систем. Такая эффективность указывает на более эффективное извлечение и использование информации о взаимодействиях пользователей и объектов, позволяя модели делать точные прогнозы даже при ограниченном объеме данных о соседях.

Успех модели MB-DGT выходит за рамки исключительно высокой производительности, предлагая принципиально новую, более понятную и гибкую структуру рекомендаций. В отличие от многих современных алгоритмов, функционирующих как “черные ящики”, MB-DGT обеспечивает возможность анализа процесса принятия решений, позволяя понять, какие факторы влияют на формирование рекомендаций для конкретного пользователя. Такая прозрачность критически важна для повышения доверия к системе и облегчения выявления потенциальных предвзятостей. Более того, архитектура модели позволяет легко адаптировать ее к различным типам данных и сценариям использования, что делает ее ценным инструментом не только для электронной коммерции, но и для персонализированной рекламы и рекомендаций контента, где важна динамическая адаптация к меняющимся предпочтениям пользователей.

Разработанный подход имеет далеко идущие последствия для широкого спектра приложений, в первую очередь в сфере электронной коммерции, где он позволяет значительно повысить точность рекомендаций товаров, что приводит к увеличению продаж и лояльности клиентов. В области рекомендаций контента, будь то новости, видео или музыка, MB-DGT способствует более релевантному и персонализированному опыту для пользователей, увеличивая время, проведенное на платформе, и уровень вовлеченности. Кроме того, в сфере персонализированной рекламы, данный метод позволяет создавать более эффективные рекламные кампании, ориентированные на конкретные интересы и предпочтения каждого пользователя, что приводит к повышению коэффициента конверсии и снижению затрат на рекламу. В целом, MB-DGT представляет собой универсальное решение, способное значительно улучшить пользовательский опыт и повысить эффективность различных онлайн-сервисов.

Эксперименты по исключению вспомогательных поведенческих данных показали, что их использование существенно улучшает метрики HR@10 и NDCG@10.
Эксперименты по исключению вспомогательных поведенческих данных показали, что их использование существенно улучшает метрики HR@10 и NDCG@10.

Будущее за Динамикой: Расширяя Рамки MB-DGT

Перспективные исследования направлены на интеграцию графов знаний для обогащения представлений пользователей и элементов, что позволит значительно повысить точность и интерпретируемость рекомендаций. Использование графов знаний предоставляет возможность учитывать сложные взаимосвязи между элементами, выходящие за рамки простого взаимодействия пользователь-объект. Например, можно учитывать атрибуты объекта, его категорию, связи с другими объектами и даже внешние знания из общедоступных баз данных. Такой подход позволяет моделировать более полное представление о предпочтениях пользователя и предлагать рекомендации, основанные не только на истории взаимодействий, но и на более глубоком понимании контекста и характеристик объектов. Ожидается, что обогащенные представления, полученные благодаря графам знаний, позволят создавать более релевантные, разнообразные и объяснимые рекомендации, способствуя повышению удовлетворенности пользователей и доверия к системе.

Адаптация модели MB-DGT к ситуациям “холодного старта” и разреженности данных представляет собой существенную задачу для дальнейшего развития. В условиях ограниченного количества информации о новых пользователях или элементах, традиционные методы рекомендаций часто сталкиваются с трудностями в формировании точных предсказаний. Исследователи сосредоточены на разработке стратегий, позволяющих эффективно использовать доступные данные, например, за счет применения мета-обучения или трансферного обучения, чтобы обобщать знания из существующих пользователей и элементов на новые. Особое внимание уделяется методам, способным выявлять скрытые связи и закономерности в разреженных данных, используя, например, техники заполнения пропусков или совместной фильтрации на основе сходства признаков. Решение этой проблемы позволит значительно расширить применимость MB-DGT и обеспечить качественные рекомендации даже в условиях недостатка информации.

Дальнейшее развитие предложенной структуры возможно за счет интеграции механизмов обратной связи от пользователей и стратегий активного обучения. Включение оценок и предпочтений пользователей в процесс формирования рекомендаций позволит не только повысить их релевантность, но и адаптировать систему к индивидуальным потребностям каждого человека. Активное обучение, в свою очередь, предполагает, что система сама запрашивает у пользователя уточнения или отзывы о предложенных вариантах, что существенно ускоряет процесс персонализации и позволяет более эффективно выявлять скрытые закономерности в предпочтениях. Такой подход обещает не просто предоставить пользователю список релевантных элементов, но и создать интерактивный, увлекательный опыт, формируя долгосрочную лояльность и повышая удовлетворенность от использования системы.

Принципы динамического моделирования графов и корреляционного анализа на основе трансформеров демонстрируют широкую применимость за пределами задач рекомендаций. Исследования показывают, что подобный подход, позволяющий учитывать временные зависимости и сложные взаимосвязи между данными, эффективно работает в различных областях, включая анализ временных рядов, обработку естественного языка и даже прогнозирование поведения в социальных сетях. Способность моделировать динамические изменения в графовых структурах и выявлять неявные корреляции посредством механизмов внимания трансформеров открывает новые возможности для построения более точных и интерпретируемых моделей, способных эффективно обрабатывать последовательные и мультимодальные данные. Перспективные направления включают в себя анализ медицинских изображений, предсказание трафика и оптимизацию логистических цепочек, где учет контекста и взаимосвязей между элементами играет ключевую роль.

Эксперименты по исключению вспомогательных поведенческих данных показали, что их использование существенно улучшает метрики HR@10 и NDCG@10.
Эксперименты по исключению вспомогательных поведенческих данных показали, что их использование существенно улучшает метрики HR@10 и NDCG@10.

Исследование демонстрирует стремление к пониманию сложных систем взаимодействия, где пользовательские предпочтения формируются под влиянием множества факторов и последовательности действий. Модель MB-DGT, представленная в работе, пытается не просто предсказать следующее действие, но и осознать контекст, в котором оно происходит. Как заметил Клод Шеннон: «Информация — это не то, что мы передаем, а то, что принимают». Эта фраза отражает суть подхода, предложенного авторами: важно не просто собрать данные о поведении пользователя, но и правильно интерпретировать их, учитывая индивидуальные границы и динамику предпочтений. Осознание границ поведения, как ключевой аспект модели, позволяет более точно уловить истинные сигналы, скрытые в потоке данных.

Куда Дальше?

Представленная работа, хоть и демонстрирует определенный прогресс в области рекомендательных систем, лишь приоткрывает завесу над истинной сложностью человеческих предпочтений. Построение динамических графов и использование трансформеров — это, скорее, элегантный способ структурировать известные факты, нежели радикальный прорыв в понимании причинно-следственных связей. Вопрос о том, как эффективно учитывать контекст, выходящий за рамки явных взаимодействий пользователя с системой, остается открытым. Реальность — это открытый исходный код, который мы еще не прочитали, и каждый новый алгоритм — лишь попытка расшифровать небольшой фрагмент.

Особое внимание следует уделить проблеме интерпретируемости. Модели, способные не только предсказывать, но и объяснять свои решения, представляют куда больший интерес, чем просто «черные ящики», выдающие статистически значимые результаты. Необходимо двигаться в сторону создания моделей, способных адаптироваться к изменениям во времени и учитывать индивидуальные особенности каждого пользователя, не ограничиваясь усредненными представлениями о его поведении. Иначе говоря, необходим переход от пассивного наблюдения к активному исследованию.

Перспективы дальнейших исследований лежат в области объединения различных модальностей данных — не только истории взаимодействий, но и социальных связей, демографических характеристик, а также неявных сигналов, отражающих эмоциональное состояние пользователя. Создание действительно интеллектуальной рекомендательной системы требует не просто обработки данных, а понимания лежащих в их основе принципов. В конечном итоге, задача состоит не в том, чтобы предсказать, что пользователь захочет, а в том, чтобы понять, почему он этого хочет.


Оригинал статьи: https://arxiv.org/pdf/2602.10493.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-02-12 21:49