Когда тексты переплетаются: как вычислить и понять литературные связи

Автор: Денис Аветисян


Как методы количественного анализа и обработки естественного языка позволяют выявлять скрытые взаимосвязи между текстами и открывать новые горизонты в гуманитарных науках.

Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.

Купить акции "голубых фишек"
Количественный анализ интертекстуальности выявляет лежащую в основе структуру связей между текстами, позволяя формализовать и измерить степень их взаимовлияния и перекликающихся тем.
Количественный анализ интертекстуальности выявляет лежащую в основе структуру связей между текстами, позволяя формализовать и измерить степень их взаимовлияния и перекликающихся тем.

Обзор современных подходов к количественному анализу интертекстуальности с использованием методов компьютерной лингвистики и сетевого анализа.

Несмотря на устоявшиеся теоретические рамки интертекстуальности в гуманитарных науках, ее количественное исследование долгое время оставалось сложной задачей. Данная работа, ‘Quantitative Intertextuality from the Digital Humanities Perspective: A Survey’, представляет собой обзор современных методов выявления и анализа интертекстуальных связей на основе достижений в области обработки естественного языка. Обзор охватывает широкий спектр подходов – от статистических методов до моделей глубокого обучения – и демонстрирует их применение в различных областях гуманитарного и социального познания. Какие новые перспективы открывает количественная интертекстуальность для углубленного понимания культурных и социальных процессов, а также для интеграции искусственного интеллекта и гуманитарных наук?


Интертекстуальность: Сеть Смыслов

Концепция интертекстуальности – фундаментальная взаимосвязь текстов – играет ключевую роль в понимании процессов конструирования смысла. Любой текст существует в диалоге с другими, формируя сложную сеть отсылок. Традиционный анализ, несмотря на проницательность, ограничен в масштабе и точности. Современные методы цифровой гуманитарии, включая обработку естественного языка и машинное обучение, открывают новые возможности для исследования интертекстуальности в больших корпусах текстов, выявляя статистически значимые связи, упускаемые при традиционном подходе. Каждая «революционная» технология завтра станет техдолгом.

Количественная Интертекстуальность: Объективное Измерение Влияния

Количественная интертекстуальность – это надежная методология анализа интертекстуальных связей, расширяющая возможности качественных подходов. Она позволяет перейти от субъективных интерпретаций к объективным измерениям влияния и заимствований. В основе метода лежит использование техник обработки естественного языка, таких как сопоставление N-грамм, тематическое моделирование и анализ стилистических особенностей, что позволяет количественно оценить текстовое сходство. К 2024 году исследования Wang и др. выявили более 14 миллионов интертекстуальных пар, демонстрируя масштабируемость и эффективность подхода для анализа больших текстовых корпусов.

Древние Тексты и Глубокий Анализ

Применение количественной интертекстуальности к древним текстам предоставляет уникальные возможности для изучения эволюции идей и литературных традиций, выявляя скрытые связи и влияния. Использование моделей глубокого обучения и поисковых систем на основе векторных представлений позволяет анализировать огромные текстовые корпуса, обнаруживая тонкие взаимосвязи, недоступные для ручного анализа, особенно в отношении фрагментарных текстов. Анализ данных показал наибольшее интертекстуальное покрытие в работе Аристотеля «О душе», что указывает на его значительное влияние на последующую мысль. Данная методология была применена к анализу более 500 конституций для прослеживания эволюции конституционного развития.

За Пределами Языка: Мультимодальная Интертекстуальность

Перекрёстная языковая интертекстуальность расширяет область анализа, охватывая тексты на различных языках, выявляя ранее скрытые связи и влияния. Мультимодальная интертекстуальность включает другие форматы медиа, такие как изображения и аудио, обеспечивая более полное понимание интертекстуальных отношений. Это позволяет перейти от анализа исключительно текстовых данных к изучению взаимодействия различных коммуникативных форм и созданию общего смысла между культурами. Рассмотрение мультимодальных текстов раскрывает новые грани интертекстуальности, показывая, как различные медиа усиливают друг друга в процессе формирования значения. Каждая новая «инновация» в медиа – лишь переосмысление старого приёма, облачённого в современную форму.

Измерение Влияния и Предпочтений

Количественная интертекстуальность предоставляет основу для измерения влияния, позволяя определить воздействие одного текста или автора на другой. Этот подход позволяет перейти от качественных оценок к объективным показателям, расширяя возможности анализа литературных и культурных явлений. Кроме того, данный метод обеспечивает возможность измерения предпочтений, выявляя наиболее востребованные источники посредством анализа интертекстуальных связей. Анализ 14 миллионов обнаруженных интертекстуальных пар демонстрирует далеко идущие последствия для литературной истории, культурологии и атрибуции авторства, переосмысливая устоявшиеся представления о литературном каноне.

Исследование количественной интертекстуальности, представленное в статье, неизбежно напоминает о хрупкости любой теоретической конструкции перед лицом реальных данных. Подобно тому, как элегантная диаграмма ломается под натиском продакшена, методы выявления текстовых связей и анализа их паттернов сталкиваются с неопределенностью и шумом в цифровых текстах. Как однажды заметил Карл Фридрих Гаусс: «Трудно сказать, что точнее: математические вычисления или эмпирические наблюдения.» Истина, вероятно, лежит где-то посередине, ведь любое количественное исследование, стремящееся уловить тонкие нити интертекстуальности, обречено на компромисс между строгостью математической модели и сложностью лингвистической реальности. В конечном итоге, даже самые совершенные алгоритмы анализа текста не способны полностью охватить все нюансы и смысловые оттенки, присущие человеческому языку.

Что дальше?

Представленный обзор количественного анализа интертекстуальности, как и любая попытка свести гуманитарные концепции к цифрам, неизбежно обнажает границы применимости методов. Выявлять текстовые связи – задача, безусловно, интересная, но истинная проблема заключается в интерпретации этих связей. Пока алгоритмы усердно ищут подобие, гуманитарии будут с недоверием поглядывать на результаты, вспоминая, что любое «самовосстанавливающееся» решение просто ещё не столкнулось с достаточным количеством ошибок.

Перспективы, конечно, имеются. Вероятно, нас ждёт ещё больше “инновационных” метрик текстового сходства, каждая из которых будет претендовать на абсолютную точность, пока не встретит первый же случай, когда контекст всё перевернет с ног на голову. А документация к этим метрикам… что ж, документация — это всегда форма коллективного самообмана, давайте будем честны.

И всё же, если баг воспроизводится — значит, у нас стабильная система, верно? Так что, если алгоритм стабильно выдаёт бессмысленные результаты – это, возможно, и есть его истинное предназначение. Следующий шаг, вероятно, – научиться извлекать пользу даже из хаоса.


Оригинал статьи: https://arxiv.org/pdf/2510.27045.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-11-03 20:11