Наука — Страница 42

Нейронные сети: как связать функцию и представление?

01.02.2026 от Denis

Показано, что высокая репрезентативная схожесть гарантирует функциональное соответствие, подтверждая следствие 4.8, однако обратное не верно: значительная функциональная схожесть часто наблюдается даже при низкой репрезентативной схожести, что указывает на сложность взаимосвязи между этими двумя аспектами систем.

Новое исследование предлагает единый подход к анализу нейронных представлений, объединяя функциональное и репрезентативное сходство через понятие ‘полезной информации’.

Искусство дизайна: как нейросети учатся у профессионалов

01.02.2026 от Denis

Система PRISM, используя существующие данные о дизайне, генерирует разнообразные улучшения, соответствующие запрошенному стилю, в отличие от подходов, полагающихся исключительно на предварительно обученные знания моделей, которые зачастую не соответствуют исходным данным дизайна.

Новая методика позволяет визуальным языковым моделям осваивать принципы дизайна, значительно улучшая качество и стилистическую согласованность графических работ.

Движение и язык: Новый взгляд на точное соответствие

01.02.2026 от Denis

Предлагаемая структура обучения «Пирамидальный Шейпли-Тейлор» (PST) анализирует семантические взаимосвязи между текстовыми и кинематическими токенами, используя взаимодействие Шейпли-Тейлор (STI) и пирамидальную схему моделирования, где интенсивность корреляции между токенами отображается градиентом цвета - от тёмных оттенков, указывающих на сильную связь, до светлых, отражающих слабую.

Исследователи предлагают новый подход к поиску соответствий между видеодвижениями и текстовыми описаниями, повышая точность сопоставления за счет анализа на разных уровнях детализации.

Места оживают: как движение раскрывает суть городских объектов

01.02.2026 от Denis

Предлагается метод расширения статических текстовых представлений точек интереса (POI) за счет включения сигналов мобильности, что позволяет получить векторные представления POI, отражающие их идентичность и функциональное назначение.

Новый подход позволяет понять, что собой представляет то или иное место в городе и как оно используется, анализируя данные о перемещении людей.

Визуальный язык космоснимков: новые горизонты семантической сегментации

31.01.2026 от Denis

Наблюдения показывают, что использование сверхпикселей усиливает границы объектов на изображениях дистанционного зондирования, что, в свою очередь, способствует повышению точности семантической сегментации, осуществляемой алгоритмом CLIPer, по сравнению с исходным изображением и контрольными данными.

Исследователи предлагают инновационный подход к анализу спутниковых изображений, позволяющий автоматически выделять объекты без предварительного обучения.

Тактильное зрение робота: обучение манипуляциям от человека

31.01.2026 от Denis

Разработанная система DexTac позволяет осуществлять манипуляции посредством визуально-тактильного обучения, где многомерные тактильные данные используются для тренировки сети, осознающей контакт, а тактильный контроллер генерирует движения, позволяющие захвату автономно выбирать оптимальную область контакта в задачах, насыщенных контактами.

Новая методика позволяет роботизированной руке осваивать сложные задачи, требующие точного контакта, благодаря обучению «от руки» и интеграции тактильных и визуальных данных.

Адаптация ИИ к Разным Пользователям: Новый Подход к Управлению Мозгом

31.01.2026 от Denis

Исследователи предлагают инновационный метод адаптации алгоритмов к индивидуальным особенностям мозга, значительно повышая точность систем управления на основе ЭЭГ.

Небесная Ловкость: Роботы, Видящие, Слушающие и Действующие

31.01.2026 от Denis

Платформа AIR-VLA представляет собой комплексное решение для систем воздушной манипуляции, объединяющее в себе инструменты сбора данных телеоперации на основе симуляции, онлайн-среду моделирования и разнообразные мультимодальные наборы данных, что позволяет проводить всестороннюю оценку современных моделей Vision-Language-Action и Vision-Language-Model в различных задачах воздушной манипуляции.

Новая платформа AIR-VLA объединяет возможности компьютерного зрения, обработки естественного языка и управления роботами для выполнения сложных задач в воздухе.

Иллюзии и Искусственный Зрение: Где Модели Видят, а Где Запоминают?

31.01.2026 от Denis

Новое исследование показывает, что современные модели, связывающие зрение и язык, часто полагаются на заученные паттерны, а не на истинное визуальное восприятие.

По взгляду о пользователе: предсказание состояния по данным отслеживания глаз

31.01.2026 от Denis

Новое исследование показывает, как глубокое обучение может анализировать движения глаз, чтобы оценить уровень усталости и когнитивную нагрузку пользователя, но межсубъектная обобщаемость остается сложной задачей.