Наука — Страница 138

Мир как полотно: Управление событиями в видео по запросу

20.12.2025 от Denis

Модель демонстрирует способность генерировать правдоподобные сценарии развития событий, точно соответствующие заданным траекториям, текстовым запросам и эталонным изображениям, в отличие от базовых моделей, которые не способны обеспечить такое соответствие входным данным.

Новый подход позволяет создавать управляемые видеоролики, комбинируя траектории движения, текстовые описания и референсные изображения.

Конструктор и ИИ: Как нейросети собирают LEGO по текстовому описанию

20.12.2025 от Denis

Новая разработка позволяет создавать сложные модели из LEGO, используя простые текстовые запросы и возможности искусственного интеллекта.

3D-объекты из сетки: новый взгляд на обнаружение

20.12.2025 от Denis

Для обнаружения трехмерных объектов с использованием многокамерных систем, предлагаемый подход отказывается от традиционных случайно генерируемых или основанных на детекции якорей, заменяя их сеткой признаков, построенной на основе топового вида (BEV), которая затем уточняется с помощью алгоритма подавления ненужных максимумов (NMS).

Исследователи предложили инновационный подход к 3D-обнаружению объектов, преобразующий данные из сетки Bird’s-Eye-View в точные трехмерные модели.

Искусственный интеллект учится видеть как человек: новый подход к оценке качества изображений

20.12.2025 от Denis

Исследователи разработали систему, способную не только оценивать качество изображений, но и объяснять свои решения, приближаясь к человеческому восприятию и логике.

Крылья для чтения: Мобильное приложение для развития грамотности у детей с нейроотличиями

20.12.2025 от Denis

В статье представлена разработка и оценка ‘Wing’ — платформы, использующей адаптивное обучение и геймификацию для создания персонализированного опыта обучения чтению и письму.

От взгляда к действию: как человеческий опыт обучает роботов

20.12.2025 от Denis

Новое исследование показывает, что обучение моделей компьютерного зрения и языка на видеозаписях человеческой деятельности позволяет значительно улучшить навыки роботов в манипулировании объектами.

Интернет вещей для пожилых: Два десятилетия проблем и решений

20.12.2025 от Denis

На основе анализа сорока четырех рецензируемых исследований, проведенных в период с 2004 по 2024 год, сформирована модель угроз Интернета вещей, специфичная для пожилых людей.

Всесторонний анализ исследований в области безопасности, приватности, доступности и удобства использования IoT-устройств для старшего поколения выявляет ключевые вызовы и предлагает пути их решения.

Взгляд против касания: Как нагрузка влияет на управление мобильными устройствами

20.12.2025 от Denis

Исследование оценивает эффективность выбора целей на мобильных устройствах посредством взгляда и касания, как при ходьбе с ношей (сумками), так и без неё, выявляя, что комбинированное взаимодействие, использующее взгляд для указания и касание для выбора, демонстрирует потенциал в условиях ограниченной мобильности, в то время как касание служит базовым методом сравнения.

Новое исследование показывает, что управление взглядом сохраняет эффективность даже при физической нагрузке, в отличие от традиционного сенсорного ввода.

Городской лабиринт: Как ИИ ориентируется в потребностях человека?

20.12.2025 от Denis

Система CitySeeker представляет собой основу для навигации в городской среде, основанную на выявлении скрытых потребностей и воплощенном взаимодействии, что позволяет ей адаптироваться к динамичной обстановке и предвосхищать запросы пользователей.

Новое исследование CitySeeker демонстрирует, как современные модели компьютерного зрения и обработки языка справляются с навигацией в городской среде, учитывая скрытые потребности человека.

Память времени и пространства: новый подход к обучению «зрячих» ИИ

20.12.2025 от Denis

При недоступности ответа на запрос, основанного исключительно на текущем восприятии, система прибегает к поиску релевантного контекста по семантическим, пространственным и временным ключам, после чего интегрирует полученные данные в модель визуально-языкового рассуждения для формирования ответа.

Исследователи представили R4 — систему, позволяющую моделям компьютерного зрения и языка рассуждать в динамичных средах, опираясь на «память» о прошлых событиях и местоположении.