Команды с разными возможностями: как информация преображается для всех

Исследование показывает, как смешанные команды, включающие людей с разными визуальными способностями, адаптируют информацию для совместной работы, выявляя скрытые механизмы координации.
![Модель обрабатывает визуальную информацию, включая изображения и видеопоследовательности, совместно со сложными лингвистическими инструкциями, посредством кодировщика визуальных данных и адаптера, после чего все входные токены объединяются и поступают в декодер [latex]Thinker[/latex], обеспечивая комплексное понимание и генерацию ответа.](https://arxiv.org/html/2601.21199v1/images/workflow.png)