Наука — Страница 173

Живые Пространства: Эксперименты с Интерактивным Окружением

17.11.2025 от Denis

В статье рассматривается практический опыт создания адаптивных пространств для иммерсивных перформансов, основанный на отказе от программирования и акценте на коллективное взаимодействие.

Пространственное мышление машин: новый взгляд на 3D-восприятие

17.11.2025 от Denis

Система SandboxVLM формирует компактное, осознающее трехмерное пространство, обусловленное запросом, используя видеодиффузионный априорный метод для расширения входного изображения в короткую многовидовую последовательность, управляемую абстрактным контролем, предоставляемым моделью

Исследователи предлагают инновационный подход к обучению моделей «зрение-язык» пониманию трехмерного пространства, позволяющий им рассуждать о расположении объектов в мире.

Тактильное зрение роботов: реалистичная симуляция для точного захвата

17.11.2025 от Denis

Разработан симулятор SimTac, позволяющий моделировать биоморфные тактильные сенсоры, вдохновленные биологическими аналогами, и преодолевать сложности, связанные с повышенной геометрической сложностью и расширенным диапазоном ощущений, посредством учета формы сенсора, расположения маркеров, определения оптической системы и материальных свойств для получения оптических и механических откликов.

Новый симулятор SimTac позволяет создавать достоверные данные тактильного восприятия, приближая роботов к пониманию объектов на ощупь.

Совместное восприятие: новый подход к масштабируемости и эффективности

17.11.2025 от Denis

Исследователи предлагают инновационную систему HeatV2X для организации взаимодействия разнородных агентов и повышения точности восприятия окружающей среды.

Ожившие персонажи: Диалоги с ИИ на обычном железе

17.11.2025 от Denis

Фактическая точность ответов неигровых персонажей (NPC) варьируется в зависимости от используемой модели, демонстрируя, что разные варианты обладают различной способностью к достоверному воспроизведению информации.

Новый подход позволяет создавать правдоподобные и связные диалоги для неигровых персонажей (NPC) даже на компьютерах с ограниченными ресурсами.

Понимание поведения приматов: новая модель для анализа видеозаписей дикой природы

16.11.2025 от Denis

Для обработки данных PriVi.YouTube применяется конвейер, включающий фильтрацию с использованием классификатора релевантности, субдискретизацию R&O на основе метаданных подмножеств, обнаружение приматов без обучения и отбраковку пустых кадров, в результате чего формируется набор из 424 часов уникальных видеоматериалов, дополненных ограничивающими рамками и CLIP-вложениями для ключевых кадров.

Исследователи представили PriVi – масштабный набор данных и модель, способную значительно улучшить распознавание поведения приматов в естественной среде обитания.

Зрение для всех: Как компактные нейросети делают видео доступнее для слабовидящих

16.11.2025 от Denis

В исследовании оценивались четыре стратегии подсказок, варьирующиеся от базовых запросов до комплексных, включающих контекст и аудиоописания, для различных версий SmolVLM и базовой модели Qwen, с целью оценки генерируемых описаний как стандартными метриками NLP, так и специализированными метриками доступности, ориентированными на пользователей с нарушениями зрения.

Новое исследование показывает, что небольшие модели, объединяющие зрение и язык, могут превосходить более крупные аналоги в создании эффективных описаний видео для людей с нарушениями зрения.

Расширяя границы неявных представлений: Новый подход к увеличению мощности нейронных сетей

16.11.2025 от Denis

Разделение слоёв в архитектуре SIREN, как продемонстрировано на примере модели с девятью скрытыми нейронами, значительно расширяет пространство признаков и обеспечивает более разнообразную основу для решения задачи подгонки изображения по сравнению с оригинальной моделью, причём увеличение числа разделений до трёх оказывает дополнительное влияние на разнообразие признаков.

В статье представлена инновационная модификация полносвязных слоев, позволяющая значительно повысить выразительность неявных представлений без увеличения вычислительных затрат.

Визуальные Трансформеры: Обнаружение и удаление избыточности для повышения эффективности

16.11.2025 от Denis

Уменьшение объёма информации, извлекаемой из токенов, приводит к снижению сложности и повышению эффективности обработки данных.

Новый подход позволяет значительно ускорить работу Vision Transformers, выявляя и отсеивая ненужные элементы обработки изображений.

Свобода взгляда: Защита приватности в системах управления взглядом

16.11.2025 от Denis

Сравнение методов сохранения конфиденциальности демонстрирует, что понижающая дискретизация уменьшает количество выборок, сохраняя при этом структуру исходного сегмента данных, что и объясняет его более раннее завершение.

Новое исследование демонстрирует, как обеспечить конфиденциальность данных отслеживания взгляда в реальном времени, не жертвуя точностью и удобством взаимодействия.