Взгляд пешехода: как предсказать поведение в мире беспилотников

Автор: Денис Аветисян


Новое исследование с использованием виртуальной реальности и отслеживания взгляда показывает, как учитывать намерения пешеходов при взаимодействии с автоматизированными транспортными средствами.

Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.

Купить акции "голубых фишек"
Наблюдения за направлением взгляда пешеходов с высоты птичьего полета демонстрируют, что направление их внимания тесно связано с текущей обстановкой и может быть использовано для анализа поведения и прогнозирования действий.
Наблюдения за направлением взгляда пешеходов с высоты птичьего полета демонстрируют, что направление их внимания тесно связано с текущей обстановкой и может быть использовано для анализа поведения и прогнозирования действий.

Исследование влияния данных отслеживания взгляда и контекстной информации на точность прогнозирования траектории пешеходов в общих пространствах с автоматизированными шаттлами.

Несмотря на прогресс в области автономного транспорта, предсказание поведения пешеходов в условиях совместного использования пространства с автоматизированными шаттлами остается сложной задачей. В работе «Eye Gaze-Informed and Context-Aware Pedestrian Trajectory Prediction in Shared Spaces with Automated Shuttles: A Virtual Reality Study» представлено исследование, использующее виртуальную реальность и айтрекинг для анализа взаимодействия пешеходов с автоматизированными транспортными средствами. Полученные результаты демонстрируют, что учет направления взгляда и контекстуальных факторов значительно повышает точность прогнозирования траекторий пешеходов, причем эффект комбинирования этих данных превосходит простую сумму их отдельных вкладов. Какие новые возможности для создания более безопасных и адаптивных систем автономного транспорта открывает учет когнитивных процессов и контекста поведения пешеходов?


Прогнозирование Неопределенности: Поведение Пешеходов в Общих Пространствах

Прогнозирование действий пешеходов является критически важным аспектом для обеспечения безопасной работы автономных транспортных средств, однако человеческое поведение по своей природе непредсказуемо. Сложность заключается в том, что люди не всегда следуют четким правилам или логичным траекториям, проявляя спонтанность и вариативность в своих действиях. Неопределенность возникает из-за множества факторов, включая индивидуальные особенности, эмоциональное состояние и текущий контекст окружающей среды. Попытки создать абсолютно точные модели поведения пешеходов сталкиваются с фундаментальными ограничениями, поскольку человеческая реакция часто зависит от неочевидных или трудно поддающихся формализации факторов. В связи с этим, системы автономного вождения должны быть способны эффективно обрабатывать неопределенность и адаптироваться к непредсказуемым ситуациям, чтобы гарантировать безопасность как пассажиров, так и пешеходов.

Исследования поведения пешеходов демонстрируют, что предсказание их намерений — задача, значительно превосходящая простую экстраполяцию траектории движения. Такие явления, как нерешительность перед началом перехода, оценка размеров безопасного промежутка между транспортными средствами и отклонение от прямолинейной траектории, указывают на сложный процесс принятия решений. Эти факторы, обусловленные как когнитивными особенностями человека, так и особенностями окружающей среды, создают значительные трудности для систем автономного управления, требуя от них не только учета текущего положения пешехода, но и вероятностной оценки его дальнейших действий. Понимание этих нюансов крайне важно для обеспечения безопасности в условиях совместного использования дорожного пространства.

Изучение поведения пешеходов в условиях общих пространств, где правила часто нечетки и допускают различные интерпретации, представляет собой особую сложность. В таких средах, как пешеходные переходы без четкой разметки или зоны совместного использования дорог, предсказать действия пешехода становится значительно труднее. Неопределенность возникает из-за неявных социальных сигналов, индивидуальных особенностей каждого участника движения и способности пешеходов адаптироваться к меняющимся обстоятельствам. Исследования показывают, что пешеходы часто полагаются на невербальные подсказки и взаимное понимание, что делает их поведение менее предсказуемым для автоматизированных систем, которые не способны интерпретировать эти тонкие нюансы. Понимание этих особенностей крайне важно для разработки безопасных и эффективных алгоритмов управления автономным транспортом в городских условиях.

Декодирование Окружающей Среды: Ситуационный Контекст и Проксемика

Действия пешеходов не формируются изолированно, а напрямую зависят от текущего контекста окружающей среды. Плотность транспортного потока и наличие расширенных человеко-машинных интерфейсов (eHMIs), таких как информационные табло или световые указатели, оказывают существенное влияние на поведение пешеходов. Увеличение плотности движения обычно приводит к более осторожным и предсказуемым маневрам пешеходов, в то время как наличие eHMIs может изменять их решения, предоставляя дополнительную информацию о дорожной обстановке или намерениях транспортных средств. Анализ этих факторов критически важен для точного моделирования поведения пешеходов и обеспечения безопасного взаимодействия с автономными системами.

В условиях непрерывного транспортного потока, автономные системы требуют повышенной точности прогнозирования поведения пешеходов. Высокая плотность трафика и динамичное изменение окружающей обстановки создают сложные сценарии, в которых стандартные алгоритмы прогнозирования могут оказаться недостаточными. Для адекватной работы в таких условиях, системы должны учитывать не только текущую позицию и скорость пешеходов, но и прогнозировать их дальнейшие действия, основываясь на анализе траекторий движения, скорости изменения этих траекторий, а также учитывать возможные взаимодействия с другими участниками дорожного движения. Неспособность точно прогнозировать поведение пешеходов в непрерывном трафике может привести к критическим ситуациям и, как следствие, к авариям.

Проксемика, изучающая влияние пространственных отношений на поведение, играет ключевую роль в анализе взаимодействия пешеходов с автономным транспортом. Исследования показывают, что поведение пешеходов существенно меняется в зависимости от расстояния до транспортного средства: с уменьшением дистанции наблюдается увеличение внимательности, замедление скорости движения и стремление к установлению зрительного контакта. Более того, пешеходы демонстрируют различные стратегии пересечения проезжей части в зависимости от скорости приближающегося транспортного средства и предполагаемой траектории его движения, что подтверждает важность учета пространственных параметров для прогнозирования поведения пешеходов и обеспечения безопасности.

Точное моделирование взаимодействия пешеходов с автономными транспортными средствами требует учета не только непосредственного окружения, включая плотность трафика и наличие других участников движения, но и анализа тонких признаков, указывающих на намерения пешехода. Эти признаки включают в себя направление взгляда, положение тела, скорость движения и даже незначительные изменения в позе, которые могут сигнализировать о готовящемся переходе дороги или изменении траектории. Игнорирование этих неявных сигналов может привести к неверной интерпретации поведения пешехода и, как следствие, к потенциально опасным ситуациям. Эффективное моделирование должно включать в себя алгоритмы, способные распознавать и учитывать эти нюансы для повышения безопасности и предсказуемости взаимодействия.

GazeX-LSTM: Многомодальный Подход к Предсказанию Траектории

Модель GazeX-LSTM прогнозирует траектории пешеходов, объединяя информацию о динамике движения (motion status), данные о направлении взгляда (eye gaze data) и ситуационный контекст. Входные данные включают в себя текущую позицию, скорость и ускорение пешехода, а также вектор взгляда, определяемый положением глаз и ориентацией головы. Ситуационный контекст включает в себя информацию об окружающей среде, такую как расположение препятствий, дорожная разметка и наличие других пешеходов. Комбинирование этих трех источников информации позволяет модели учитывать не только текущее положение и скорость пешехода, но и его намерения и внимание, что повышает точность прогнозирования траектории.

В модели GazeX-LSTM для захвата временной динамики движения пешеходов используется LSTM-энкодер. LSTM (Long Short-Term Memory) — это рекуррентная нейронная сеть, способная эффективно обрабатывать последовательные данные и учитывать долгосрочные зависимости. В контексте прогнозирования траекторий, LSTM-энкодер принимает на вход последовательность исторических координат пешехода, а также информацию о его скорости и ускорении. Обрабатывая эти данные, LSTM-энкодер формирует вектор скрытого состояния, который содержит информацию о прошлом движении пешехода и используется для прогнозирования его будущей траектории. Использование LSTM позволяет модели учитывать не только текущее положение и скорость пешехода, но и его предыдущие перемещения, что значительно повышает точность прогнозирования.

Включение данных о направлении взгляда пешехода, дополненных информацией об ориентации головы, позволяет получить непосредственную оценку его внимания. Данный подход основан на том, что взгляд является ключевым индикатором намерений пешехода и направления его следующего движения. В модели GazeX-LSTM, данные о взгляде и ориентации головы используются в качестве дополнительного входного сигнала, что значительно повышает точность прогнозирования траектории по сравнению с моделями, использующими только кинематические данные. Экспериментальные результаты показывают, что учет направления взгляда позволяет модели более эффективно предсказывать изменения в движении пешехода и, следовательно, улучшает общую производительность.

Многомодальный подход, используемый в GazeX-LSTM, демонстрирует превосходство над базовыми моделями, опирающимися исключительно на кинематические данные. В ходе экспериментов установлено, что интеграция данных о взгляде, ориентации головы и ситуационном контексте значительно повышает точность прогнозирования траекторий пешеходов. Данные о взгляде служат дополнительным источником информации о намерении пешехода, позволяя модели более эффективно учитывать его внимание и вероятное направление движения, что приводит к снижению среднеквадратичной ошибки прогнозирования (RMSE) по сравнению с моделями, использующими только координаты и скорость.

Модель представляет направление взгляда и головы как в мировой системе координат, так и относительно направления движения, используя единичную окружность для непрерывного представления углов и комбинируя данные для более точной оценки положения головы и взгляда.
Модель представляет направление взгляда и головы как в мировой системе координат, так и относительно направления движения, используя единичную окружность для непрерывного представления углов и комбинируя данные для более точной оценки положения головы и взгляда.

VR-Валидация и Объяснимый Искусственный Интеллект с SHAP

В рамках исследования была разработана виртуальная реальность, предоставляющая контролируемую среду для точного измерения поведенческих характеристик, таких как нерешительность, выбор оптимального промежутка и отклонение от траектории. Данный подход позволил отследить реакции участников в смоделированных ситуациях взаимодействия с пешеходами, что невозможно в реальных условиях из-за сложности контроля внешних факторов и обеспечения безопасности. Реалистичная среда виртуальной реальности позволила зафиксировать даже незначительные изменения в поведении, такие как задержки в принятии решений или небольшие отклонения от оптимального пути, предоставляя ценные данные для разработки и оценки алгоритмов автономного управления. Полученные данные о поведенческих показателях стали основой для анализа и улучшения предсказательных моделей, направленных на повышение безопасности взаимодействия между автономными системами и пешеходами.

Исследования показали, что модель GazeX-LSTM демонстрирует превосходство над базовыми моделями в прогнозировании поведения пешеходов в сложных сценариях разделяемого пространства. Благодаря учету направления взгляда и последовательной обработке данных, GazeX-LSTM более точно предсказывает намерения пешеходов, что критически важно для безопасной навигации автономных систем. В ходе экспериментов, модель продемонстрировала улучшенные показатели точности и скорости реакции по сравнению с традиционными алгоритмами, что подтверждает её потенциал для повышения безопасности и эффективности взаимодействия автономных транспортных средств с пешеходами в реальных условиях. Эти результаты открывают возможности для разработки более надежных и предсказуемых систем помощи водителю и полностью автономных транспортных средств.

Анализ с использованием значений SHAP позволил выявить относительную значимость различных входных параметров, влияющих на поведение пешеходов. Исследование показало, что угол подхода, количество транспортных средств, поведение уступающих участников движения и наличие расширенного человеко-машинного интерфейса (eHMI) оказывают существенное влияние на принимаемые пешеходами решения. В частности, угол подхода определяет предсказуемость траектории, а количество транспортных средств создает контекст плотности движения. Проявление уступающего поведения другими участниками движения формирует ожидания и влияет на скорость реакции пешеходов, в то время как наличие eHMI, предоставляющего визуальную информацию о намерениях автономных систем, способствует более осознанному и безопасному взаимодействию. Полученные данные подчеркивают важность учета этих факторов при разработке алгоритмов прогнозирования поведения пешеходов и повышения безопасности автономных транспортных средств.

Исследование продемонстрировало высокий уровень погружения участников в виртуальную реальность, подтвержденный результатами анкетирования — средний показатель по шкале присутствия (Presence Questionnaire) составил 151.14 (стандартное отклонение 17.57). При этом, уровень дискомфорта, связанного с использованием симулятора, оказался незначительным, о чем свидетельствует средний балл по шкале укачивания (Simulation Sickness Questionnaire) — 164.54 (стандартное отклонение 175.30). Полученные данные подчеркивают важность создания реалистичных и комфортных виртуальных сред для проведения исследований поведения человека, а также для разработки и внедрения автономных систем, вызывающих доверие у пользователей благодаря предсказуемости и безопасности их функционирования.

В ходе VR-эксперимента уровни каждого параметра задавались числовыми значениями, а количество вопросов в последующих анкетах определялось соответствующими числами.
В ходе VR-эксперимента уровни каждого параметра задавались числовыми значениями, а количество вопросов в последующих анкетах определялось соответствующими числами.

Исследование поведения пешеходов в условиях совместного использования пространства с автоматизированными шаттлами, представленное в данной работе, подчеркивает важность учета не только контекстуальной информации, но и визуального внимания. Внедрение данных отслеживания взгляда позволяет существенно повысить точность прогнозирования траекторий движения пешеходов, что критически важно для обеспечения безопасности взаимодействия. Как однажды заметил Джон фон Нейман: «В науке не бывает «почти» правильных ответов. Любое решение должно быть безупречным, а алгоритм — доказуемым». Данный подход к моделированию поведения, с акцентом на математическую строгость и верификацию, полностью соответствует принципам, сформулированным выдающимся ученым, и позволяет создавать надежные системы прогнозирования в сложных сценариях совместного использования пространства.

Куда двигаться дальше?

Представленная работа, несмотря на кажущуюся практическую направленность, лишь слегка приоткрывает завесу над истинной сложностью предсказания поведения пешеходов. В конечном счете, анализ траектории — это лишь аппроксимация, попытка свести хаотичную свободу воли к детерминированным уравнениям. Использование данных отслеживания взгляда — шаг в правильном направлении, но необходимо признать, что взгляд — лишь один из многих факторов, влияющих на принятие решений. Более того, виртуальная реальность, хоть и удобный инструмент, всегда остается упрощением действительности, лишенным тонкостей реального взаимодействия.

Следующим этапом представляется необходимость разработки формальных моделей, способных учитывать не только визуальные стимулы, но и когнитивные процессы, лежащие в основе поведения пешеходов. Простое увеличение объема данных, без глубокого понимания лежащих в их основе принципов, обречено на повторение ошибок. Важно отделить существенное от несущественного, выявить инвариантные закономерности, а не просто “подгонять” параметры модели под текущие данные. Необходимо искать универсальные алгоритмы, независимые от конкретной реализации и языка программирования.

В конечном счете, задача предсказания траекторий — это не просто инженерная проблема, но и философский вызов. Можно ли вообще полностью предсказать поведение разумного существа? И нужно ли это? Пожалуй, истинная элегантность решения заключается не в достижении абсолютной точности, а в признании фундаментальной неопределенности окружающего мира.


Оригинал статьи: https://arxiv.org/pdf/2603.19812.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-23 19:58