Искусственный интеллект учится видеть как человек: новый подход к оценке качества изображений

Анализ показывает, что модели Q-Instruct и DepictQA склонны к шаблонным ответам, игнорируя даже очевидные перцептивные ошибки, в то время как Q-Insight демонстрирует процедурный, основанный на шаблонах подход к рассуждениям, отличный от человеческого восприятия, тогда как разработанная модель, в отличие от них, учитывает как детализированные перцептивные признаки, так и общую концептуальную атмосферу, что позволяет генерировать рассуждения и описания, более соответствующие человеческому пониманию и выражению.

Исследователи разработали систему, способную не только оценивать качество изображений, но и объяснять свои решения, приближаясь к человеческому восприятию и логике.

Крылья для чтения: Мобильное приложение для развития грамотности у детей с нейроотличиями

В статье представлена разработка и оценка ‘Wing’ — платформы, использующей адаптивное обучение и геймификацию для создания персонализированного опыта обучения чтению и письму.

От взгляда к действию: как человеческий опыт обучает роботов

Архитектура VLA, построенная на базе PhysBrain, кодирует мультимодальный контекст из последовательности эгоцентрических наблюдений и языковых инструкций для генерации действий, при этом PhysGR00T обуславливает эксперта по диффузии на основе потокового соответствия скрытыми состояниями последнего слоя PhysBrain, а PhysPIm тесно связывает PhysBrain и эксперта по действиям, внедряя несколько слоев VLM посредством кросс-внимания на уровне слоев.

Новое исследование показывает, что обучение моделей компьютерного зрения и языка на видеозаписях человеческой деятельности позволяет значительно улучшить навыки роботов в манипулировании объектами.

Интернет вещей для пожилых: Два десятилетия проблем и решений

На основе анализа сорока четырех рецензируемых исследований, проведенных в период с 2004 по 2024 год, сформирована модель угроз Интернета вещей, специфичная для пожилых людей.

Всесторонний анализ исследований в области безопасности, приватности, доступности и удобства использования IoT-устройств для старшего поколения выявляет ключевые вызовы и предлагает пути их решения.

Городской лабиринт: Как ИИ ориентируется в потребностях человека?

Система CitySeeker представляет собой основу для навигации в городской среде, основанную на выявлении скрытых потребностей и воплощенном взаимодействии, что позволяет ей адаптироваться к динамичной обстановке и предвосхищать запросы пользователей.

Новое исследование CitySeeker демонстрирует, как современные модели компьютерного зрения и обработки языка справляются с навигацией в городской среде, учитывая скрытые потребности человека.

Память времени и пространства: новый подход к обучению «зрячих» ИИ

При недоступности ответа на запрос, основанного исключительно на текущем восприятии, система прибегает к поиску релевантного контекста по семантическим, пространственным и временным ключам, после чего интегрирует полученные данные в модель визуально-языкового рассуждения для формирования ответа.

Исследователи представили R4 — систему, позволяющую моделям компьютерного зрения и языка рассуждать в динамичных средах, опираясь на «память» о прошлых событиях и местоположении.

Семантические двойники для сетей будущего: от космоса до океана

Новая парадигма SAGSIN-твиннинга, использующая знания из графов знаний (KG), позволяет преодолеть неоднородность данных и реализовать принципы, ориентированные на достижение целей, тем самым повышая уровень автономного интеллекта.

В статье представлена концепция семантических двойников нового поколения, способных к интеллектуальному управлению сложными интегрированными сетями связи, объединяющими космическое, воздушное, наземное и морское пространства.

Обмен данными с датчиков: баланс между безопасностью и кооперативным восприятием

Утечка конфиденциальных данных, возникающая при прямой передаче необработанных данных с одного транспортного средства (синего) на другое (зеленое), подчеркивает уязвимость типичных архитектур датчиков, где сырые данные, вместо обработки, напрямую передаются между системами.

Новый подход к обмену необработанными данными с пространственных датчиков между транспортными средствами призван обеспечить повышенную безопасность и надежность, не жертвуя при этом конфиденциальностью.