Пространственное мышление без привязки к себе: новый подход к обучению моделей «зрения и языка»
![Для преодоления разрыва между системами отсчёта, разработанная структура явно отделяет пространственное рассуждение от эгоцентричных визуальных априорных знаний, функционируя в три этапа: преобразование двухмерных визуальных наблюдений в унифицированное трёхмерное метрическое пространство [latex]\mathcal{W}[/latex], построение согласованной с запросом аллоцентрической системы отсчёта [latex]\mathcal{F}\_{allo}[/latex] посредством явного преобразования координат и, наконец, вывод окончательного ответа посредством логического вывода, основанного на геометрии.](https://arxiv.org/html/2602.05789v1/x4.png)
Исследователи предлагают метод, позволяющий моделям лучше понимать пространственные отношения в окружающем мире, отделив объективное описание сцены от субъективной точки зрения.

![Разработана комплексная система [latex]PAiD[/latex], позволяющая гуманоидному роботу освоить навыки футбола посредством последовательного обучения: от адаптации движений человека и отслеживания мяча без учета помех, через обобщение навыков удара по неподвижным и катящимся мячам с использованием визуального восприятия, до преодоления разрыва между симуляцией и реальностью за счет согласования динамики контакта и учета физически обоснованного шума, что в конечном итоге позволило успешно развернуть систему на платформе Unitree G1.](https://arxiv.org/html/2602.05310v1/x1.png)


