Протез, который учится у вас: адаптивное управление с помощью машинного обучения

Автор: Денис Аветисян


Новый подход позволяет значительно ускорить и упростить настройку активных протезов, делая управление более интуитивным и комфортным для пользователя.

Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.

Купить акции "голубых фишек"
Активная система протезирования коленного сустава, управляемая конечным автоматом с тремя состояниями - опоры (S), сгибания (SF) и разгибания (SE) - использует позиционный регулятор в фазе опоры и импедансные регуляторы в фазах сгибания и разгибания, при этом переходы между состояниями настраиваются посредством параметров, определяющих динамику и стабильность движения.
Активная система протезирования коленного сустава, управляемая конечным автоматом с тремя состояниями — опоры (S), сгибания (SF) и разгибания (SE) — использует позиционный регулятор в фазе опоры и импедансные регуляторы в фазах сгибания и разгибания, при этом переходы между состояниями настраиваются посредством параметров, определяющих динамику и стабильность движения.

В статье представлена методика, использующая байесовское извлечение предпочтений и оптимизацию с участием человека для персонализации параметров управления трансфеморальным протезом.

Настройка активных протезов для людей после ампутации требует значительных временных затрат и часто опирается на метрики, не полностью отражающие потребности пользователя. В статье «Bayesian\ Preference\ Elicitation:\ Human-In-The-Loop\ Optimization\ of\ An\ Active\ Prosthesis» представлен подход, использующий байесовскую элицитацию предпочтений и оптимизацию в цикле с участием человека, для эффективной персонализации стандартного четырехпараметрического контроллера протеза. Разработанный метод демонстрирует быструю сходимость, надежную элицитацию предпочтений и измеримые улучшения биомеханических показателей. Возможно ли, используя подобный подход, значительно расширить возможности адаптации протезов и повысить качество жизни людей с ограниченными возможностями?


Преодоление Ограничений: Индивидуальный Подход к Управлению Протезами

Традиционные методы управления протезами конечностей зачастую опираются на заранее запрограммированные режимы работы, что не позволяет учитывать индивидуальные особенности походки и предпочтения пользователя. Вместо адаптации к уникальному стилю движения, протез функционирует по заданному алгоритму, игнорируя тонкости биомеханики конкретного человека. Это приводит к тому, что пользователю приходится сознательно контролировать каждый шаг, что значительно увеличивает когнитивную нагрузку и препятствует достижению естественной и плавной походки. Такой подход не позволяет протезу полноценно интегрироваться в двигательную систему человека, ограничивая его функциональность и снижая качество жизни.

Несоответствие между запрограммированными режимами управления протезом и индивидуальной манерой ходьбы пользователя приводит к значительному увеличению когнитивной нагрузки. Мозг вынужден постоянно компенсировать разницу между желаемым движением и фактическим выполнением, что требует дополнительных усилий и снижает эффективность передвижения. Эта постоянная необходимость в коррекции приводит к неестественной походке, повышенной утомляемости и, в конечном итоге, к ограничению возможностей человека, использующего протез. Вместо плавного и автоматического движения, пользователь сталкивается с постоянной необходимостью осознанного контроля каждого шага, что существенно ухудшает качество жизни и препятствует полноценному участию в повседневной деятельности.

Современные методы управления протезами испытывают трудности в улавливании тонкой взаимосвязи между намерением пользователя и сложной биомеханикой передвижения. Это связано с тем, что протез часто воспринимает лишь упрощенные сигналы, не отражающие всего спектра мышечных импульсов и нейронной активности, определяющих естественную походку. Например, даже небольшое изменение скорости или направления движения требует координации множества мышц, и существующие алгоритмы управления не всегда способны адекватно интерпретировать эти сложные сигналы. В результате, протез может реагировать запаздывающе или неточно, что приводит к повышенной когнитивной нагрузке на пользователя и снижает эффективность передвижения. Исследователи активно работают над разработкой более совершенных систем, способных учитывать индивидуальные особенности биомеханики каждого человека и обеспечивать более плавное и естественное управление протезом.

Сравнение траекторий угла сгибания колена для оптимальных и конкурирующих решений показывает, что средние значения ± стандартные отклонения угла колена в течение нормализованного цикла ходьбы (0-100%) остаются стабильными на протяжении нескольких шагов.
Сравнение траекторий угла сгибания колена для оптимальных и конкурирующих решений показывает, что средние значения ± стандартные отклонения угла колена в течение нормализованного цикла ходьбы (0-100%) остаются стабильными на протяжении нескольких шагов.

Байесовский Подход: Изучение Предпочтений Пользователя

Байесовское выявление предпочтений предоставляет эффективный подход к изучению ‘скрытой функции полезности’ пользователя — его внутренней модели предпочтительных движений. Данная функция представляет собой математическое описание того, насколько пользователь ценит различные параметры движения протеза, такие как скорость, траектория или сила. Вместо прямого запроса этих параметров, система выводит предпочтения пользователя на основе косвенных наблюдений, формируя вероятностное представление о его индивидуальных потребностях и ожиданиях. Изучение этой функции позволяет адаптировать управление протезом к индивидуальным особенностям пользователя, повышая комфорт и эффективность его использования.

Метод выявления предпочтений пользователя осуществляется посредством попарных сравнений, где пользователю предлагается указать, какое из двух протезных движений он предпочитает. Такой подход позволяет избежать необходимости в сложных оценках или рейтингах, что упрощает процесс взаимодействия и снижает когнитивную нагрузку на пользователя. Пользователь просто выбирает предпочтительное движение из предложенной пары, предоставляя информацию, достаточную для построения модели его индивидуальных предпочтений.

В качестве вероятностной модели для эффективного определения и прогнозирования предпочтений пользователя используется гауссовский процесс. Этот подход позволяет получать надежные результаты, используя ограниченный объем данных, что особенно важно в контексте адаптации протезов. В ходе тестирования было установлено, что для достижения удовлетворительной конфигурации и сходимости модели требуется в среднем 15-20 итераций сравнения пар движений, что свидетельствует о высокой эффективности и скорости обучения системы.

На всех тестовых функциях алгоритм BPE4Prost демонстрирует стабильно более низкое значение среднего логарифмического сожаления <span class="katex-eq" data-katex-display="false">\log_{10} </span> по сравнению с другими методами, что подтверждается результатами 50 итераций и отображено в виде затененных областей, указывающих на стандартную ошибку.
На всех тестовых функциях алгоритм BPE4Prost демонстрирует стабильно более низкое значение среднего логарифмического сожаления \log_{10} по сравнению с другими методами, что подтверждается результатами 50 итераций и отображено в виде затененных областей, указывающих на стандартную ошибку.

Оптимизация Управления: Баланс Между Исследованием и Использованием

Система ‘BPE4Prost’ использует итеративный алгоритм оптимизации для настройки параметров управления протезом на основе обратной связи от пользователя. Этот алгоритм последовательно изменяет параметры, оценивая предпочтения пользователя посредством попарных сравнений. На каждом шаге, на основе полученных данных, система корректирует параметры с целью максимизации субъективной оценки комфорта и эффективности управления протезом. Процесс повторяется до достижения стабильного состояния, когда дальнейшие изменения параметров не приводят к существенному улучшению пользовательского опыта.

В системе ‘BPE4Prost’ поиск оптимальных параметров управления осуществляется посредством функции приобретения (acquisition function), а именно — ‘Ожидаемой полезности наилучшего варианта’ (Expected Utility of the Best Option). Данная функция позволяет эффективно сочетать исследование новых параметров (exploration) с использованием уже известных, демонстрирующих хорошие результаты (exploitation). Алгоритм оценивает потенциальную полезность каждого параметра, учитывая как текущие знания о его эффективности, так и степень неопределенности. Это позволяет системе динамически переключаться между исследованием новых областей параметров и уточнением уже перспективных, обеспечивая быстрое схождение к оптимальным настройкам для конкретного пользователя.

Логистическая функция правдоподобия используется для установления связи между данными, полученными в результате парных сравнений, и оценкой полезности различных параметров управления. Этот подход позволяет реализовать устойчивый и эффективный процесс обучения в системе ‘BPE4Prost’. В ходе тестирования EUBO-LineCoSpar показал в среднем 10.3 ± 2.5 итераций до достижения сходимости у участников эксперимента, что свидетельствует о высокой скорости адаптации и оптимизации параметров управления на основе обратной связи от пользователя.

Сравнение времени работы алгоритмов на функциях Акли (4D) и Бранина (2D) показывает, что BPE4Prost масштабируется почти линейно с количеством запросов, в то время как EUBO-LineCoSpar остается стабильно быстрым благодаря ограничениям на линейные оценки.
Сравнение времени работы алгоритмов на функциях Акли (4D) и Бранина (2D) показывает, что BPE4Prost масштабируется почти линейно с количеством запросов, в то время как EUBO-LineCoSpar остается стабильно быстрым благодаря ограничениям на линейные оценки.

К Бесшовной Интеграции: Достижение Естественной Локомоции

Интеграция управления на основе конечных автоматов с оптимизацией, учитывающей индивидуальные предпочтения пользователя, позволяет добиться плавных переходов между фазами походки — опоры и переноса ноги. Такой подход обеспечивает более естественное и координированное движение, поскольку система способна динамически адаптироваться к изменяющимся условиям и потребностям пользователя. Конечный автомат четко определяет последовательность фаз, а оптимизация, основанная на предпочтениях, настраивает параметры каждой фазы для достижения максимального комфорта и эффективности. Это приводит к более плавному и предсказуемому движению, минимизируя резкие переходы и повышая стабильность при ходьбе.

Управление на основе импеданса значительно повышает естественность движений, позволяя протезу адаптироваться к изменениям рельефа и намерениям пользователя. Вместо жесткого следования заранее заданной траектории, протез, управляемый по принципам импеданса, динамически регулирует свою жесткость и демпфирование. Это достигается путем моделирования взаимодействия между протезом и окружающей средой как упругой системы. В результате, протез не просто «реагирует» на внешние силы, но и предвосхищает их, обеспечивая плавное и координированное движение даже на неровной поверхности или при неожиданных изменениях скорости. Такой подход позволяет пользователю чувствовать себя более уверенно и комфортно, поскольку протез естественным образом компенсирует внешние возмущения и подстраивается под индивидуальный стиль ходьбы.

Подход “Оптимизация с участием человека” открывает новые перспективы в управлении протезами, позволяя пользователям двигаться с большей уверенностью и легкостью. Исследования демонстрируют значительное улучшение показателей асимметрии фаз опоры и переноса веса — на 3,9% и 7,6% соответственно (TF1) по сравнению с использованием индивидуальных протезов. Высокая степень узнавания предпочтительных конфигураций пользователями — 93% по результатам EUBO-LineCoSpar и 67% при проверке против случайных альтернатив (TF2) — подтверждает эффективность данной методики в адаптации протеза к индивидуальным потребностям и особенностям походки, что в конечном итоге способствует более естественному и комфортному передвижению.

В ходе трех экспериментов оптимальная конфигурация <span class="katex-eq" data-katex-display="false"> \hat{x}=\arg\max\_{x}\mu\_{N}(x) </span> быстро сходится в большинстве измерений в экспериментах 1 и 2, тогда как эксперимент 3 демонстрирует повышенную вариативность, вероятно, из-за шума в отзывах пользователя.
В ходе трех экспериментов оптимальная конфигурация \hat{x}=\arg\max\_{x}\mu\_{N}(x) быстро сходится в большинстве измерений в экспериментах 1 и 2, тогда как эксперимент 3 демонстрирует повышенную вариативность, вероятно, из-за шума в отзывах пользователя.

Исследование, представленное в данной работе, демонстрирует стремление к оптимизации протезов конечностей посредством вовлечения пользователя в процесс настройки. Подход, основанный на байесовском извлечении предпочтений, позволяет учитывать индивидуальные особенности каждого пациента, что особенно важно для достижения комфортного и эффективного управления протезом. Как однажды заметил Джон фон Нейман: «В науке нет абсолютно ничего, что не было бы основано на предположениях». В контексте данной работы, предположение о том, что пользователь способен выразить свои предпочтения, является ключевым. Оптимизация функции полезности, описываемой в статье, служит инструментом для уточнения этих предпочтений и, следовательно, повышения качества жизни пациента.

Что дальше?

Представленная работа демонстрирует, как системы могут учиться адаптироваться к индивидуальным потребностям, однако, подобно любому инструменту, она лишь откладывает неизбежное. Время, затраченное на оптимизацию, — это не победа над энтропией, а лишь её временное замедление. Более того, акцент на персонализации неизбежно поднимает вопрос о границах индивидуальности. До какой степени система должна «узнавать» пользователя, чтобы действительно служить ему, а не создавать иллюзию понимания?

Перспективы развития лежат не столько в усовершенствовании алгоритмов, сколько в принятии принципа несовершенства. Вместо стремления к идеальной настройке, стоит обратить внимание на создание систем, способных извлекать пользу из неопределенности. Возможно, мудрый протез — это не тот, который идеально воспроизводит утраченную функцию, а тот, который учится дышать вместе с ограничениями, предлагая пользователю новые способы взаимодействия с миром.

В конечном счете, исследование подобного рода напоминает о том, что любые попытки «оптимизировать» жизнь — это лишь попытки замедлить её течение. И иногда, самое разумное — это не ускорять процесс, а просто наблюдать за тем, как система учится стареть достойно.


Оригинал статьи: https://arxiv.org/pdf/2602.22922.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-02-28 18:09