Пространственное мышление без привязки к себе: новый подход к обучению моделей «зрения и языка»

Для преодоления разрыва между системами отсчёта, разработанная структура явно отделяет пространственное рассуждение от эгоцентричных визуальных априорных знаний, функционируя в три этапа: преобразование двухмерных визуальных наблюдений в унифицированное трёхмерное метрическое пространство [latex]\mathcal{W}[/latex], построение согласованной с запросом аллоцентрической системы отсчёта [latex]\mathcal{F}\_{allo}[/latex] посредством явного преобразования координат и, наконец, вывод окончательного ответа посредством логического вывода, основанного на геометрии.

Исследователи предлагают метод, позволяющий моделям лучше понимать пространственные отношения в окружающем мире, отделив объективное описание сцены от субъективной точки зрения.

Голос в Саду: Искусственный Интеллект как Гид в Мире Смешанной Реальности

В ходе демонстрации смешанной реальности в масштабе кампуса посетители исследовали площадку, используя шлемы, в то время как Dream-Butterfly, сохраняя ненавязчивое поведение, следовала поблизости и активировалась по требованию.

Исследование показывает, как разговорный ИИ может стать ключевым элементом интерактивных выставок под открытым небом, улучшая впечатления посетителей и углубляя погружение в контент.