Алгоритм установил, кто писал вместо Шекспира
Сторонники теорий заговора о том, что Уильям Шекспир писал не сам или, по крайней мере, не всегда сам, получили новый метод исследования его пьес - машинное обучение и сравнение словарных паттернов. Подход уже принес первые плоды.
Сторонники теорий заговора (так называемый Шекспировский вопрос) подозревают, что приписываемые великому британскому драматургу произведения писал кто-то другой, например, коллектив авторов во главе с философом Фрэнсисом Бэконом. О первых результатах исследования пьесы "Генрих VIII" с помощью машинного обучения рассказывает MIT Tech Revew.
"Генрих" - поздняя пьеса, официально написанная Шекспиром в соавторстве с Джоном Флетчером. Шекспир умер в 1616 году, Флетчер, в архиве которого она хранилась, - в 1625. И лишь десятилетие спустя драма была впервые опубликована, причем имя Флетчера шло на первом месте в списке авторов.
Среди исследователей творчества Шекспира шли долгие споры о том, насколько велик был вклад Флетчера в текст и сюжет.
Несомненно было, что он существенен - но только алгоритму машинного обучения удалось разобраться буквально с точностью до строчки в том, когда Уильям передавал перо Джону и наоборот.
Как отмечает MIT, для Флетчера были характерны определенные особенности письменной речи, которых избегал Шекспир: например, Флетчер часто употребляет "ye" вместо "you" и "’em" вместо "them". Он любит компенсировать недостающий строке слог с помощью слов "sir", "still" или "next". Литературовед Георг Брандес указывал также на необычные для Шекспира характеры и слабый сюжет драмы.
Разобраться, сколько в этой пьесе Шекспира, с помощью современных методов решил исследователь из Чехии Петр Плешак. Анализ текста и выявление его особенностей - одна из привычных задач для машинного обучения. В этом случае лишь область приложения усилий была очень необычной. Плешак скормил модели поздние пьесы Шекспира, а также произведения Флетчера. А затем строка за строкой проанализировал текст "Генриха VIII".
В интервью MIT он указывает, что анализ в целом оказался близок к разбиению, которое в классической работе 1850 года предложил литературовед Джеймс Спеддинг. Флетчер, подтверждает Плешак, написал сцены, составляющие почти половину пьесы. Однако был и ряд сюрпризов.
Алгоритм показал, что авторство иногда менялось прямо во время развития действия, а не только между сценами. Например во второй сцене третьего акта модель предложила смешанное авторство после строки 2081.
Помимо этого, Плешак проверил и еще одну версию об авторстве этой пьесы - иногда его приписывали также драматургу Филиппу Мессинджеру. "Маловероятно", чтобы он был вовлечен в работу над "Генрихом", счел алгоритм анализа.
В публикации не сказано, планирует ли чешский ученый исследовать аналогичным образом другие тексты Шекспира в поисках следов других авторов.
MIT считает, что следующим логичным шагом для подобных алгоритмов было бы преобразование текста в стилистику Шекспира или хотя бы Флетчера. Однако сделать это значительно сложнее, чем обработать фото в стиле известного художника.