По следам перемещений: Новый подход к предсказанию точек интереса

Автор: Денис Аветисян

Исследователи предлагают инновационную систему, способную более точно прогнозировать, куда пользователь отправится дальше, учитывая сложность и изменчивость его маршрутов.

Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.

Купить акции "голубых фишек"

Модель ADS-POI декомпозирует поведение пользователя на множество скрытых состояний с разнородными пространственно-временными переходами и выполняет контекстно-адаптивную агрегацию этих состояний для ранжирования следующей точки интереса (POI).

Предложена методика ADS-POI, использующая декомпозицию состояния для улучшения рекомендаций точек интереса на основе анализа пространственно-временных паттернов мобильности.

Моделирование мобильности пользователей в задачах рекомендации следующей точки интереса (POI) часто сталкивается с трудностями при разделении различных поведенческих факторов, эволюционирующих в разных пространственно-временных масштабах. В данной работе, представленной в статье ‘ADS-POI: Agentic Spatiotemporal State Decomposition for Next Point-of-Interest Recommendation’, предложен новый подход, основанный на декомпозиции состояния пользователя на несколько параллельных латентных под-состояний, каждое из которых управляется собственной динамикой. Такой подход позволяет более эффективно учитывать разнообразие и эволюцию паттернов мобильности, улучшая точность рекомендаций. Возможно ли дальнейшее повышение эффективности таких моделей за счет учета контекстных факторов и индивидуальных предпочтений пользователей?

Поведение в Пространстве: За пределами Однородности

Традиционные системы рекомендации следующей точки интереса (POI) часто упрощают поведение пользователей, сводя их перемещения к единственному скрытому состоянию. Такой подход игнорирует сложность человеческого поведения, которое характеризуется множеством различных аспектов — от ежедневных рабочих поездок до спонтанных прогулок в свободное время. Представление всей траектории как единого состояния не позволяет учитывать, что различные виды активности могут иметь разные закономерности и динамику, что существенно снижает точность прогнозирования следующего пункта назначения. Данное упрощение не отражает реальное разнообразие мотивов и целей, определяющих выбор пользователя, и, следовательно, ограничивает возможности построения действительно персонализированных рекомендаций.

Поведение пользователей в пространстве, будь то ежедневные поездки на работу или спонтанные развлечения, редко бывает однородным. Упрощенные модели, обобщающие все перемещения в единое состояние, не учитывают, что различные аспекты поведения развиваются с разной скоростью. Например, привычный маршрут до работы формируется постепенно, в течение недель или месяцев, в то время как выбор места для вечернего отдыха может определяться текущим настроением и обстоятельствами. Игнорирование этих временных различий приводит к неточным прогнозам следующего пункта назначения, поскольку модель не способна адекватно отразить динамику меняющихся потребностей и предпочтений пользователя.

Для точного предсказания следующего пункта назначения необходимы модели, способные разделять и представлять разнообразные поведенческие аспекты человека. Исследования показывают, что траектории перемещений формируются не единым паттерном, а представляют собой комбинацию различных намерений — от ежедневных поездок на работу до спонтанных развлечений. Эффективные модели должны учитывать, что эти поведенческие измерения развиваются с разной скоростью и подвержены различным факторам. Разделение этих измерений позволяет более точно уловить контекст текущего местоположения и предсказать, куда пользователь вероятнее всего отправится дальше, учитывая его текущее состояние и намерения. Таким образом, способность модели к декомпозиции поведенческих аспектов является ключевым фактором в повышении точности рекомендаций пунктов назначения.

Несмотря на значительный прогресс в области последовательных рекомендаций, существующие методы испытывают трудности при моделировании сложной и разнородной динамики человеческой мобильности. Традиционные подходы, как правило, рассматривают траектории перемещений как единую последовательность, не учитывая, что поведение пользователя может существенно различаться в зависимости от контекста — будь то поездки на работу, развлечения или выполнение других задач. Эта гетерогенность проявляется в различных временных масштабах: одни аспекты поведения остаются стабильными в течение длительного времени, в то время как другие меняются быстро и непредсказуемо. В результате, модели, не способные разделять и учитывать эти различные пространственно-временные измерения, часто демонстрируют ограниченную точность в прогнозировании следующего пункта назначения, особенно в ситуациях, когда поведение пользователя претерпевает значительные изменения.

Моделирование поведения пользователя на основе единого состояния смешивает разнородные предпочтения в мобильности, в то время как пространственно-временное разложение состояния позволяет представлять поведение через множество состояний принятия решений, адаптируемых к меняющимся контекстам.

ADS-POI: Разложение Состояний для Моделирования Мобильности

Методика ADS-POI представляет поведение пользователя не как единое латентное состояние, а как декомпозицию на несколько параллельных состояний. Вместо одного вектора, описывающего текущий контекст и намерения, система оперирует набором независимых состояний, каждое из которых моделирует определенный аспект поведения. Данный подход позволяет более точно отразить сложность и многогранность человеческой мобильности, поскольку позволяет учитывать различные факторы, влияющие на перемещение пользователя, как одновременно существующие и развивающиеся независимо друг от друга. Каждое из этих состояний характеризуется собственной динамикой и эволюционирует во времени и пространстве, отражая различные аспекты намерения пользователя и контекста его перемещения.

В рамках ADS-POI, множественные латентные состояния предназначены для отражения различных аспектов поведения пользователя. Каждое из этих состояний характеризуется собственной динамикой изменения во времени и пространстве, что позволяет учитывать гетерогенность человеческой мобильности. В отличие от моделей, использующих единое состояние для представления всего поведения, ADS-POI позволяет моделировать отдельные компоненты активности, такие как перемещение к конкретной цели, исследование окружающей среды или ожидание. Эти состояния не являются взаимоисключающими и могут существовать и развиваться параллельно, отражая сложность и многогранность человеческого поведения в реальном мире.

В основе ADS-POI лежит агентно-ориентированный подход, при котором латентные состояния пользователя структурируются и взаимодействуют друг с другом, моделируя намерения и контекст его поведения. Данная структура позволяет рассматривать пользователя как активного агента, чьи действия определяются совокупностью внутренних состояний, каждое из которых отвечает за определенный аспект поведения. Взаимодействие между этими состояниями определяет общую стратегию пользователя и позволяет предсказывать его дальнейшие действия, учитывая как пространственные, так и временные характеристики перемещений. Агентный подход обеспечивает более гибкое и точное представление о пользовательском поведении, чем традиционные модели, основанные на едином латентном состоянии.

В основе ADS-POI лежит преобразование исходных данных о перемещениях (траекторий) в формат, пригодный для представления в виде множественных латентных состояний. Этот процесс, называемый кодированием траекторий, включает в себя извлечение релевантных признаков из последовательности координат времени и местоположения. Полученные признаки, такие как скорость, ускорение, углы поворота и продолжительность остановок, формируют векторное представление траектории. Данный вектор затем используется для инициализации и обновления латентных состояний, отражающих различные аспекты поведения пользователя. Эффективность кодирования траекторий напрямую влияет на способность системы точно моделировать и предсказывать дальнейшие перемещения пользователя, учитывая разнообразие его намерений и контекста.

Вклад различных компонентов ADS-POI в улучшение результатов в Нью-Йорке показывает, что наибольший эффект достигается за счет декомпозиции состояний и контекстно-зависимой агрегации, при этом неоднородные переходы обеспечивают дополнительный прирост.

Детали Реализации: Оптимизация и Точность

ADS-POI использует контекстно-адаптивную агрегацию для динамического комбинирования под-состояний, определяя приоритетность наиболее релевантных состояний на основе текущего пространственно-временного контекста. Данный подход позволяет модели учитывать изменения в окружающей среде и поведении пользователя, в режиме реального времени адаптируя веса различных под-состояний. Это достигается за счет использования механизмов внимания, которые автоматически оценивают значимость каждого под-состояния в зависимости от текущей позиции пользователя, времени суток, и других факторов, влияющих на его предпочтения и намерения. В результате, агрегированное представление состояния более точно отражает текущую ситуацию и позволяет повысить точность прогнозирования будущих действий пользователя.

Для оптимизации процесса обучения, в рамках ADS-POI используется комбинация методов sampling softmax и label smoothing. Sampling softmax позволяет снизить вычислительную сложность при работе с большими словарями, отбирая подмножество наиболее вероятных классов для вычисления градиентов, что значительно ускоряет сходимость модели. Label smoothing, в свою очередь, предотвращает переобучение путем смягчения жестких меток классов, заменяя их вероятностными распределениями, что способствует обобщающей способности модели и повышает устойчивость к зашумленным данным. Комбинация этих методов обеспечивает эффективное обучение и высокую точность предсказаний.

Для моделирования пространственных взаимосвязей между точками интереса (POI) в ADS-POI используются графовые нейронные сети (GNN). Каждая POI представляется как узел в графе, а взаимосвязи между ними — как ребра. GNN позволяют агрегировать информацию от соседних POI, формируя более полное и контекстуально-обогащенное представление окружающей среды пользователя. Это достигается путем итеративного обмена сообщениями между узлами графа, что позволяет модели учитывать не только атрибуты отдельной POI, но и ее расположение относительно других объектов, а также характер их взаимосвязи. Использование GNN способствует более точному пониманию контекста и улучшает качество предсказаний относительно будущих перемещений пользователя.

В рамках системы ADS-POI динамика изменения внутренних состояний моделируется с использованием рекуррентных нейронных сетей, что позволяет учитывать временную последовательность взаимодействий пользователя с точками интереса. Это достигается путем представления каждого состояния как вектора, отражающего текущее понимание модели о предпочтениях и намерениях пользователя, и обновления этого вектора на основе поступающих данных о перемещениях и взаимодействиях. Моделирование динамики состояний критически важно для прогнозирования будущих действий пользователя, поскольку позволяет учитывать историю его поведения и адаптироваться к изменениям в его предпочтениях, что напрямую влияет на точность ранжирования точек интереса.

Результаты тестирования ADS-POI на наборах данных NYC, TKY и CA демонстрируют стабильное превосходство над существующими базовыми моделями в задачах ранжирования. В частности, ADS-POI достигает более высоких значений метрик HR@10 (Hit Rate на уровне 10), NDCG@10 (Normalized Discounted Cumulative Gain на уровне 10) и MRR (Mean Reciprocal Rank), что подтверждает эффективность предложенного подхода к моделированию предпочтений пользователей и прогнозированию релевантных точек интереса в различных городских средах. Более высокие значения этих метрик указывают на улучшенную способность системы выдавать наиболее релевантные результаты в верхних позициях ранжированного списка.

Метод ADS-POI демонстрирует оптимальное соотношение между точностью ранжирования и вычислительными затратами.

Влияние и Перспективы: Будущее Интеллекта Местоположения

Метод ADS-POI, точно улавливая особенности передвижения людей, открывает возможности для создания действительно персонализированных рекомендаций интересных мест. В отличие от традиционных систем, которые часто предлагают усредненные варианты, данный подход учитывает индивидуальные паттерны мобильности — любимые маршруты, часто посещаемые места, предпочтительное время суток и даже скорость передвижения. Это позволяет предлагать пользователям заведения и объекты, которые с наибольшей вероятностью окажутся им полезными и интересными, значительно повышая эффективность рекомендаций и удовлетворенность пользователей. Например, система может предложить кофейню не просто рядом с текущим местоположением, а именно ту, которую человек часто посещает по пути на работу, или ресторан, соответствующий его вкусовым предпочтениям, выявленным на основе предыдущих посещений.

Предлагаемый фреймворк обладает значительным потенциалом для оптимизации работы различных сервисов, использующих геолокацию. В сфере навигации, он позволяет формировать более точные и актуальные маршруты, учитывая реальные паттерны перемещения людей. Для рекламных кампаний, это открывает возможности для таргетированной рекламы, основанной на посещаемых местах и предпочтениях пользователей. В области городского планирования, анализ данных о перемещениях позволяет оптимизировать транспортные потоки, планировать инфраструктурные проекты и улучшать качество жизни в городах, предоставляя более глубокое понимание потребностей населения и динамики городской среды. Повышение эффективности этих и других сервисов, зависящих от точного определения местоположения и анализа пространственных данных, является ключевым преимуществом данной разработки.

Дальнейшие исследования направлены на интеграцию системы ADS-POI с различными контекстуальными факторами, такими как погодные условия и общественные мероприятия. Предполагается, что учет этих переменных значительно повысит прогностическую способность системы, позволяя более точно предсказывать перемещения людей и их предпочтения. Например, влияние дождя на посещаемость парков или проведение концертов на загруженность определенных районов города может быть учтено для оптимизации рекомендаций и улучшения работы навигационных сервисов. Такая интеграция позволит перейти от простого отслеживания местоположения к глубокому пониманию мотивов и потребностей пользователей, открывая новые возможности для персонализированных услуг и интеллектуального городского планирования.

Перспективы развития интеллектуального анализа местоположения напрямую связаны с возможностью учитывать сложное и изменчивое поведение пользователей в реальном времени. Расширение текущих моделей за счет включения алгоритмов, способных адаптироваться к непредсказуемым паттернам перемещения, сезонным колебаниям, а также учитывать влияние внешних факторов, таких как массовые мероприятия или изменения в городской инфраструктуре, откроет новые горизонты для повышения точности и релевантности геосервисов. Способность анализировать динамические изменения в окружающей среде и оперативно реагировать на них позволит создавать интеллектуальные системы, предсказывающие потребности пользователей и предлагающие персонализированные решения в области навигации, рекламы и городского планирования, что значительно повысит эффективность и удобство использования этих сервисов.

В ходе оценки полного ранжирования ADS-POI демонстрирует стабильное превосходство над сильными базовыми моделями по показателям HR@10 и NDCG@10 на трех различных наборах данных.

Исследование демонстрирует, как сложно уложить человеческое поведение в чёткие рамки. Авторы предлагают разложить поведение пользователя на несколько параллельных состояний, стремясь уловить изменчивость мобильности. Это напоминает попытку удержать ртуть — чем сильнее сжимаешь, тем быстрее она ускользает. В этом контексте вспоминается высказывание Винтона Серфа: «Интернет — это не просто технология, это способ думать». Подобно тому, как интернет изменил наше мышление, ADS-POI пытается изменить подход к моделированию поведения, признавая его многогранность и необходимость учитывать эволюцию паттернов. Неизбежно, как и в любом проекте, найдётся «техдолг», но стремление к более точному отражению реальности заслуживает внимания.

Что дальше?

Представленная работа, безусловно, добавляет ещё один слой абстракции к проблеме предсказания следующей точки интереса. Разложение поведения пользователя на параллельные латентные состояния — элегантное решение, пока не начнёшь задумываться о стоимости поддержания этого разложения в реальном времени. История показывает, что каждая «параллельность» рано или поздно превращается в монолит, требующий всё больше ресурсов. Улучшение моделирования мобильности — это хорошо, но не стоит забывать, что пользователи всегда найдут способ удивить систему, продемонстрировав поведение, которое не было учтено в обучающей выборке.

Более того, концепция «агентных» систем в контексте рекомендаций выглядит особенно привлекательно — до тех пор, пока не придётся разбираться с проблемами объяснимости и контроля. Как убедиться, что «агент» действительно преследует интересы пользователя, а не просто оптимизирует какие-то внутренние метрики? И не повторится ли ситуация, когда сложные алгоритмы начинают предлагать странные, но статистически оправданные рекомендации?

В конечном итоге, предложенный подход — это ещё один шаг на пути к созданию «умных» систем рекомендаций. Однако, не стоит забывать старую истину: всё, что кажется бесконечно масштабируемым, рано или поздно сталкивается с ограничениями. И если тесты проходят успешно — возможно, они просто ничего не проверяют. В 2012-м обещали нечто подобное, только называли это иначе.

Оригинал статьи: https://arxiv.org/pdf/2604.20846.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-04-25 10:46