Робот-визионер: Восстановление сцен и захват объектов без единого примера
![]()
Новая нейрографическая модель позволяет роботам реконструировать трехмерные сцены и планировать захват объектов, используя всего одно изображение RGBD, без предварительного обучения на 3D-данных.


![Для преодоления разрыва между системами отсчёта, разработанная структура явно отделяет пространственное рассуждение от эгоцентричных визуальных априорных знаний, функционируя в три этапа: преобразование двухмерных визуальных наблюдений в унифицированное трёхмерное метрическое пространство [latex]\mathcal{W}[/latex], построение согласованной с запросом аллоцентрической системы отсчёта [latex]\mathcal{F}\_{allo}[/latex] посредством явного преобразования координат и, наконец, вывод окончательного ответа посредством логического вывода, основанного на геометрии.](https://arxiv.org/html/2602.05789v1/x4.png)


