Персонализация нейросетей для распознавания действий: преодоление индивидуальных различий

Автор: Денис Аветисян

Новый подход к машинному обучению позволяет создавать более точные системы распознавания человеческой активности, учитывающие уникальные особенности каждого пользователя.

Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.

Купить акции "голубых фишек"

Предлагаемая схема предварительно обучает все веса модулей, а затем использует состязательное обучение для минимизации межсубъектной изменчивости, причём классификация действий осуществляется на основе распределения данных <span class="katex-eq" data-katex-display="false">AA</span>, в то время как состязательная задача опирается на распределение <span class="katex-eq" data-katex-display="false">A^{\prime}</span>, что демонстрирует итеративный процесс адаптации к новым пользователям. — Предлагаемая схема предварительно обучает все веса модулей, а затем использует состязательное обучение для минимизации межсубъектной изменчивости, причём классификация действий осуществляется на основе распределения данных $AA$ , в то время как состязательная задача опирается на распределение $A^{\prime}$ , что демонстрирует итеративный процесс адаптации к новым пользователям.

В статье представлена новая архитектура глубокого обучения с состязательным обучением, направленная на уменьшение разрыва в обобщающей способности при распознавании действий на основе инерционных датчиков, благодаря учету межсубъектной изменчивости.

Распознавание человеческой деятельности на основе данных инерциальных датчиков сталкивается с трудностями обобщения моделей для новых пользователей из-за индивидуальных различинений в манере выполнения одних и тех же действий. В данной работе, посвященной теме ‘Embedded Inter-Subject Variability in Adversarial Learning for Inertial Sensor-Based Human Activity Recognition’, предложен новый метод глубокого состязательного обучения, интегрирующий учет межсубъектной вариативности непосредственно в состязательную задачу. Это позволяет формировать признаки, инвариантные к конкретному пользователю, и повышать точность распознавания деятельности. Сможет ли предложенный подход стать основой для создания более надежных и адаптивных систем мониторинга и анализа поведения человека?

Истинная Сущность Распознавания Активности: Проблема Межсубъектной Изменчивости

Точность распознавания человеческой деятельности, основанная на данных с датчиков, существенно снижается при переходе от одного человека к другому из-за явления, известного как межсубъектная изменчивость. Данная проблема заключается в том, что даже при выполнении одной и той же задачи, например, ходьбы или сидения, различные люди демонстрируют уникальные паттерны движения и физиологические характеристики, отражающиеся в показаниях датчиков. Эти индивидуальные различия в кинематике, динамике и физиологии создают значительные трудности для алгоритмов машинного обучения, обученных на данных ограниченного числа испытуемых. В результате, системы распознавания активности, успешно работающие с одним человеком, часто демонстрируют низкую точность и надежность при использовании с другими, что ограничивает их практическое применение в широком спектре сценариев, особенно в контексте персонализированного здравоохранения и мониторинга физической активности.

Традиционные методы распознавания человеческой деятельности часто сталкиваются с трудностями при обобщении данных, поскольку не учитывают присущие каждому человеку индивидуальные особенности выполнения одних и тех же задач. Например, скорость ходьбы, амплитуда движений при поднятии предмета или даже способ удержания гаджета могут значительно варьироваться от человека к человеку. В результате, модели, обученные на данных одного пользователя, демонстрируют существенное снижение точности при работе с данными других людей. Это связано с тем, что алгоритмы, как правило, настроены на конкретные паттерны, обнаруженные в обучающей выборке, и не способны адаптироваться к вариациям, вызванным различиями в физиологии, стиле жизни и личных привычках. Таким образом, преодоление этой межсубъектной изменчивости является ключевой задачей для создания надежных и универсальных систем распознавания действий.

Недостаточная устойчивость систем распознавания действий представляет собой серьезное препятствие для их широкого внедрения в реальных условиях, особенно среди разнообразных групп населения. Традиционные алгоритмы, обученные на данных ограниченного круга пользователей, демонстрируют значительное снижение точности при работе с новыми, ранее не встречавшимися людьми. Это связано с индивидуальными особенностями выполнения одних и тех же действий — различиями в скорости, манере движения, физической подготовке и даже росте. В результате, системы, эффективно работающие в лабораторных условиях, оказываются ненадёжными в повседневной жизни, где необходимо учитывать широкий спектр пользователей с различным уровнем физической активности и способностей. Преодоление этой проблемы критически важно для создания по-настоящему полезных и персонализированных приложений в области здравоохранения, фитнеса и мониторинга состояния здоровья.

Решение проблемы вариативности в распознавании человеческой деятельности имеет первостепенное значение для создания действительно эффективных и персонализированных приложений в сфере здоровья и хорошего самочувствия. Учитывая, что каждый человек выполняет одни и те же задачи по-своему, адаптируемые системы, способные учитывать индивидуальные особенности, открывают новые возможности для мониторинга состояния здоровья, профилактики заболеваний и поддержки здорового образа жизни. Такие приложения могут, например, корректировать алгоритмы распознавания активности в зависимости от возраста, физической подготовки или даже привычек конкретного пользователя, обеспечивая более точные и полезные данные. Разработка подобных систем требует инновационных подходов к обработке данных и алгоритмов машинного обучения, способных учитывать и моделировать межличностную изменчивость, что позволит в конечном итоге создать действительно индивидуальные решения для поддержания здоровья и благополучия.

Состязательный Фреймворк: Истинное Отделение Сущности от Случайности

Предлагаемый Adversarial Framework предназначен для обучения устойчивых признаковых представлений, не зависящих от индивидуальных характеристик пользователей. Архитектура состоит из двух основных компонентов: Feature Extractor (извлекатель признаков) и Discriminator (дискриминатор). Извлекатель признаков преобразует входные данные в латентное пространство, а дискриминатор пытается определить, какому пользователю принадлежат признаки, полученные из латентного пространства. Обучение происходит в состязательном режиме: извлекатель признаков стремится сгенерировать представления, которые дискриминатор не может отнести к конкретному пользователю, в то время как дискриминатор стремится максимально точно идентифицировать пользователя. Такой подход способствует созданию признаков, которые отражают общие характеристики данных, а не индивидуальные особенности пользователей, повышая обобщающую способность модели.

В предложенной структуре используется дискриминаторная сеть, предназначенная для разграничения векторных представлений признаков, полученных от разных испытуемых. Дискриминатор обучается отличать признаки одного пользователя от признаков другого, что, в свою очередь, заставляет модуль извлечения признаков (Feature Extractor) генерировать представления, не зависящие от индивидуальных характеристик пользователя. Этот процесс, основанный на состязательном обучении, стимулирует Feature Extractor к удалению информации, специфичной для конкретного пользователя, из латентного пространства, обеспечивая создание более обобщенных и устойчивых признаков.

В процессе обучения модель активно минимизирует информацию, специфичную для конкретного пользователя, посредством включения задачи дискриминации пользователей. Данная задача заключается в обучении дискриминатора, который пытается определить, какому пользователю принадлежит вектор признаков. Одновременно с этим, извлекатель признаков оптимизируется для генерации представлений, которые затрудняют работу дискриминатору, эффективно удаляя пользователь-специфичные характеристики из латентного пространства. Это достигается за счет использования градиентов, полученных от дискриминатора, для корректировки весов извлекателя признаков, что приводит к формированию более общих и инвариантных представлений.

Предлагаемый фреймворк использует комбинированную функцию потерь для одновременной оптимизации нескольких целей. Эта функция состоит из трех основных компонентов: потерь при реконструкции данных, потерь при классификации и состязательных потерь (adversarial loss). Потери при реконструкции обеспечивают сохранение информации о входных данных, потери при классификации направлены на достижение высокой точности распознавания, а состязательные потери минимизируют зависимость признаков от индивидуальных характеристик пользователя. Общая функция потерь, выраженная как $L = L_{rec} + \lambda_1 L_{cls} + \lambda_2 L_{adv}$ , где $\lambda_1$ и $\lambda_2$ — весовые коэффициенты, определяющие вклад каждой составляющей, позволяет сбалансировать различные аспекты обучения и добиться оптимальной производительности модели.

Валидация на Разнообразных Данных: Подтверждение Истинности Модели

Для оценки эффективности предложенной системы проводилась кросс-валидация по принципу Leave-One-Subject-Out на трех общедоступных наборах данных: PAMAP2, MHEALTH и REALDISP. Данный метод кросс-валидации предполагает, что модель обучается на данных всех пользователей, кроме одного, который используется для тестирования. Процедура повторяется для каждого пользователя, что позволяет оценить способность модели обобщать данные на новых, ранее не встречавшихся субъектах. Использование трех различных наборов данных обеспечивает разнообразие условий и позволяет проверить устойчивость системы к изменениям в характеристиках данных, собранных от разных пользователей и в различных сценариях использования.

Метод перекрестной проверки Leave-One-Subject-Out (LOOSCV) обеспечивает надежную оценку способности модели обобщать данные на новых, ранее не встречавшихся пользователях. В LOOSCV, модель обучается на данных всех пользователей, кроме одного, который используется в качестве тестового набора. Этот процесс повторяется для каждого пользователя в наборе данных, обеспечивая оценку производительности модели на всех возможных комбинациях обучающих и тестовых данных. Такой подход позволяет оценить устойчивость модели к различиям между пользователями и выявить потенциальные проблемы с обобщением, что особенно важно для приложений, связанных с носимыми устройствами и мониторингом здоровья, где данные сильно варьируются от человека к человеку.

Результаты экспериментов показали значительное улучшение точности распознавания действий и показателя F1-Score Macro по сравнению с существующими передовыми методами. В частности, предложенный подход демонстрирует повышение эффективности благодаря обучению признакам, инвариантным к индивидуальным особенностям пользователей. Это подтверждает, что использование subject-invariant признаков позволяет модели более эффективно обобщать данные и корректно классифицировать действия новых пользователей, не встречавшихся в обучающей выборке. Полученные результаты указывают на практическую ценность предложенного метода для задач распознавания действий в реальных условиях, где данные собираются от различных пользователей.

В рамках предложенной системы, использование метрики Вассерштейна (Wasserstein Distance) позволило добиться измеримого снижения расстояния между распределениями обучающих и тестовых данных на наборах PAMAP2 и REALDISP. Наблюдаемое уменьшение данного расстояния указывает на снижение влияния межсубъектной изменчивости, что способствует повышению обобщающей способности модели и ее способности корректно классифицировать данные новых пользователей. Количественная оценка снижения расстояния Вассерштейна демонстрирует эффективность предложенного подхода к уменьшению различий между индивидуальными особенностями пользователей, представленных в данных.

Анализ <span class="katex-eq" data-katex-display="false">F_1-Score</span> для MHEALTH, PAMAP2 и REALDISP показал снижение расстояния Вассерштейна (синие столбцы) между распределениями обучающей и тестовой выборок после третьего шага, что указывает на улучшение обобщающей способности модели, в то время как увеличение расстояния (красные столбцы) наблюдалось для некоторых активностей, особенно в наборах данных PAMAP2 и REALDISP. — Анализ $F_1-Score$ для MHEALTH, PAMAP2 и REALDISP показал снижение расстояния Вассерштейна (синие столбцы) между распределениями обучающей и тестовой выборок после третьего шага, что указывает на улучшение обобщающей способности модели, в то время как увеличение расстояния (красные столбцы) наблюдалось для некоторых активностей, особенно в наборах данных PAMAP2 и REALDISP.

Влияние и Перспективы: К Истинной Персонализации и Надежности

Предложенная структура демонстрирует значительный прогресс в решении проблемы межсубъектной изменчивости, открывая новые перспективы для персонализированного мониторинга здоровья и оздоровления. Традиционные системы распознавания активности часто испытывают трудности при адаптации к индивидуальным особенностям пользователей, что снижает их эффективность и надежность. Однако, данная разработка позволяет модели эффективно обучаться на обобщенных признаках, минимизируя необходимость в обширной индивидуальной калибровке. Это особенно важно для приложений, требующих долгосрочного и непрерывного мониторинга, таких как отслеживание физической активности, выявление отклонений в поведении или предоставление персонализированных рекомендаций по улучшению самочувствия. Возможность адаптации к различным пользователям без значительных усилий по настройке значительно расширяет область применения и повышает практическую ценность системы.

Разработанная модель демонстрирует способность к адаптации к индивидуальным особенностям пользователей при минимальной предварительной калибровке. Вместо трудоемкой и длительной настройки под каждого конкретного человека, система самостоятельно выявляет общие закономерности в данных, полученных от различных датчиков. Такой подход позволяет значительно сократить время и усилия, необходимые для персонализации, делая технологию распознавания активности доступной и удобной для широкого круга пользователей. Благодаря обучению на обобщенных признаках, модель способна эффективно работать с данными, поступающими от людей с различным уровнем физической активности и индивидуальными особенностями движений, обеспечивая высокую точность и надежность распознавания действий даже при ограниченном объеме индивидуальных данных.

В основе предложенного подхода лежит инновационная архитектура извлечения признаков, объединяющая возможности сверточных (Convolutional Neural Networks) и рекуррентных (Recurrent Neural Networks) нейронных сетей. Сверточные сети эффективно анализируют пространственные закономерности в данных, полученных с датчиков — например, взаимосвязь между показаниями различных акселерометров в определенный момент времени. В то же время, рекуррентные сети способны учитывать временную последовательность этих данных, выявляя динамические изменения и тренды, характеризующие конкретную физическую активность. Такое сочетание позволяет системе не просто фиксировать отдельные сигналы, но и интерпретировать их в контексте времени, значительно повышая точность распознавания действий и делая систему более устойчивой к шумам и вариациям в данных.

Представленная работа открывает новые перспективы в создании более устойчивых и надежных систем распознавания активности, демонстрирующих стабильное превосходство над существующими аналогами в различных группах пользователей. Разработанный подход позволяет преодолеть ограничения, связанные с индивидуальными особенностями, и обеспечивает высокую точность распознавания даже при значительных различиях в манере выполнения действий. Это достигается за счет инновационной архитектуры и методов обучения, которые фокусируются на выделении общих, инвариантных признаков, а не на запоминании специфических паттернов для каждого конкретного человека. В результате, созданные системы способны адаптироваться к новым пользователям без необходимости длительной калибровки и обеспечивают стабильно высокие результаты в реальных условиях, приближая возможность широкого внедрения технологий мониторинга здоровья и улучшения качества жизни.

Расширение Горизонтов: Многозадачность и Будущее Модели

В дальнейшем исследования будут сосредоточены на интеграции многозадачного обучения в существующую структуру. Этот подход предполагает одновременное изучение представлений для нескольких взаимосвязанных задач, таких как распознавание действий и идентификация пользователя. Подобная методика позволяет модели извлекать пользу из общих информационных потоков между задачами, что потенциально повышает ее устойчивость и способность к обобщению. Обучение модели одновременно решать несколько задач способствует формированию более эффективных и универсальных представлений данных, что особенно важно для адаптации к индивидуальным особенностям пользователей и различным условиям эксплуатации системы.

Использование многозадачного обучения открывает перспективы для повышения устойчивости и обобщающей способности модели. Суть подхода заключается в одновременном обучении представлений для нескольких связанных задач, таких как распознавание действий и идентификация пользователя. За счет совместного использования информации между задачами, модель способна выявлять общие закономерности и извлекать более надежные признаки. Это позволяет ей лучше справляться с новыми, ранее не встречавшимися ситуациями и более эффективно адаптироваться к индивидуальным особенностям каждого пользователя, существенно расширяя область ее применимости и повышая точность прогнозов.

Исследования в области обучения с состязательностью продолжают углубляться, стремясь к созданию более эффективных методов извлечения признаков, не зависящих от индивидуальных особенностей пользователя. Альтернативные состязательные техники и оптимизация функций потерь представляют собой ключевое направление для улучшения инвариантности признаков. Посредством тонкой настройки процесса обучения, направленного на устранение специфических характеристик каждого субъекта, можно добиться более обобщенных и надежных представлений данных. В частности, эксперименты с различными архитектурами генеративных состязательных сетей и новыми функциями потерь, учитывающими распределение данных, могут существенно повысить способность модели адаптироваться к новым пользователям и обеспечивать более точный анализ данных, не подверженный влиянию индивидуальных отклонений.

Работа направлена на создание принципиально новых систем анализа данных с датчиков, способных адаптироваться к индивидуальным особенностям каждого пользователя и предоставлять персонализированную информацию о состоянии его здоровья. Предполагается, что такие системы не просто собирают и обрабатывают данные, но и активно помогают человеку лучше понимать собственные физиологические процессы и принимать обоснованные решения для поддержания благополучия. Благодаря возможности непрерывного мониторинга и адаптации к изменениям в поведении и физическом состоянии, данные системы способны стать надежным помощником в управлении здоровьем и повышении качества жизни, предоставляя инструменты для проактивного подхода к здоровью и профилактике заболеваний.

Исследование демонстрирует, что без четкого определения задачи, связанной с уменьшением межсубъектной вариативности, любые попытки построения эффективных систем распознавания человеческой деятельности обречены на шум. Авторы предлагают новаторский подход, основанный на состязательном обучении, для преодоления разрыва в обобщении, что особенно важно при работе с данными от разных пользователей. Как однажды заметил Джон Маккарти: «Всякий интеллект увеличивает возможности, но лишь разумное использование этих возможностей делает его ценным». Эта мысль прекрасно соотносится с представленной работой, поскольку простое увеличение точности распознавания на тренировочном наборе недостаточно; истинная ценность заключается в способности системы эффективно обобщать данные и адаптироваться к новым, неизвестным пользователям, что и достигается благодаря предложенному состязательному фреймворку и комбинированной функции потерь.

Что дальше?

Представленная работа, безусловно, демонстрирует прогресс в смягчении проблемы межсубъектной изменчивости при распознавании человеческой деятельности. Однако, не стоит обольщаться кажущейся элегантностью решения. Успех, достигнутый за счет состязательного обучения, — это, по сути, изощренная форма регуляризации, а не фундаментальное преодоление нерешенных проблем. Вопрос о том, насколько хорошо обобщается модель на действительно новых, непредсказуемых паттернах поведения, остается открытым. Существующие подходы, включая кросс-валидацию LOSO, дают лишь частичную картину.

Будущие исследования должны сосредоточиться на более глубоком понимании природы межсубъектной изменчивости. Простое увеличение объема данных, вероятно, не решит проблему, если не будет сопровождаться разработкой более устойчивых и интерпретируемых признаков. Следует обратить внимание на методы, позволяющие выявлять и учитывать индивидуальные особенности, влияющие на паттерны активности, возможно, используя байесовские подходы или нечеткую логику. Игнорирование физиологических и анатомических ограничений, лежащих в основе движений, — это упущение, которое рано или поздно даст о себе знать.

В конечном счете, истинный прогресс потребует отхода от слепого применения алгоритмов глубокого обучения и возвращения к более фундаментальным принципам моделирования и анализа данных. Задача распознавания человеческой деятельности — это не просто задача классификации, а задача понимания. И пока мы не научимся моделировать процессы, лежащие в основе поведения, любые улучшения будут лишь временными и локальными.

Оригинал статьи: https://arxiv.org/pdf/2603.05371.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-08 19:57