Мир как полотно: Управление событиями в видео по запросу

Новый подход позволяет создавать управляемые видеоролики, комбинируя траектории движения, текстовые описания и референсные изображения.

Новый подход позволяет создавать управляемые видеоролики, комбинируя траектории движения, текстовые описания и референсные изображения.
Новая разработка позволяет создавать сложные модели из LEGO, используя простые текстовые запросы и возможности искусственного интеллекта.

Исследователи предложили инновационный подход к 3D-обнаружению объектов, преобразующий данные из сетки Bird’s-Eye-View в точные трехмерные модели.

Исследователи разработали систему, способную не только оценивать качество изображений, но и объяснять свои решения, приближаясь к человеческому восприятию и логике.
В статье представлена разработка и оценка ‘Wing’ — платформы, использующей адаптивное обучение и геймификацию для создания персонализированного опыта обучения чтению и письму.

Новое исследование показывает, что обучение моделей компьютерного зрения и языка на видеозаписях человеческой деятельности позволяет значительно улучшить навыки роботов в манипулировании объектами.

Всесторонний анализ исследований в области безопасности, приватности, доступности и удобства использования IoT-устройств для старшего поколения выявляет ключевые вызовы и предлагает пути их решения.

Новое исследование показывает, что управление взглядом сохраняет эффективность даже при физической нагрузке, в отличие от традиционного сенсорного ввода.

Новое исследование CitySeeker демонстрирует, как современные модели компьютерного зрения и обработки языка справляются с навигацией в городской среде, учитывая скрытые потребности человека.

Исследователи представили R4 — систему, позволяющую моделям компьютерного зрения и языка рассуждать в динамичных средах, опираясь на «память» о прошлых событиях и местоположении.