Визуальные модели и понимание перспективы: новый вызов для искусственного интеллекта

Исследователи предлагают новую задачу и набор данных для оценки способности моделей, объединяющих зрение и язык, понимать взаимосвязь между различными точками зрения на один и тот же объект.







