Искусственный интеллект раскроет тайну древних языков
В ходе мировой истории человечество создало тысячи разнообразных языков. Многие из них были утрачены или забыты еще в древности. Поэтому нередко археологам попадаются надписи, которые не удается дешифровать. До сих пор это остается проблемой, к решению которой исследователи начали привлекать искусственный интеллект.
MIT и Google Brain взялись за дешифровку
Со времени изобретения письма, которое произошло, по разным версиям 5-6 тыс. лет назад, люди придумали множество систем, которые позволяют превращать фонетические звуки языков в визуальные символы. Однако большинство древних языков сегодня являются мертвыми, и ученым приходится прикладывать немалые усилия для их дешифровки. Иногда это удается, как в случае с египетскими символами, надписями майя, древнекитайской письменностью. Но, существенная часть древних языков - ольмекский, прото-эламский, кипро-минойский, харрапский (письменность долины Инда) и множество других, все еще хранят свои тайны, к раскрытию которых пока не удалось подойти даже в общих чертах. Поэтому для решения столь сложной задачи, ученые решили привлечь искусственный интеллект. В этом направлении развивается несколько академических проектов, но самый новый из них был инициирован исследователями одной из лабораторий Массачусетского технологического института (MIT) и сотрудниками проекта Google Brain, работающими над созданием искусственного интеллекта.
Результатом совместных усилий стала разработка алгоритма, который способен сопоставлять однокоренные слова неизвестных языков с понятиями, которые уже известны благодаря дешифровке из родственных языков. Алгоритм опубликован на ресурсе arXiv, но еще далек от совершенства и позволяет решить лишь очень ограниченный круг задач. Но, перспективы у данного метода, по мнению ученых, есть. "На данный момент в мире используется до 7 тыс. языков, а количество исчезнувших языков насчитывает десятки тысяч, - говорит Татьяна Бочарникова, глава представительства NetApp в странах СНГ. - Дешифровка такого объема требует значительных мощностей для хранения и управления огромными массивами данных. Однако основную работу по дешифровке все равно придется делать людям, которым предстоит искать взаимосвязи между родственными языками".
Эффект будет от универсальной системы дешифровки
Эффективность алгоритма проверили в частности на примере критского линейного письма Б, частично дешифрованного в 50-е годы прошлого века, и угаритского языка. Результат показал рост эффективности процесса на 5% по сравнению с ранее используемыми методами. В то же время, исследователи подчеркивают, что для эффективной дешифровки неизвестных языков все равно необходимы те или иные опорные системы, например, родственные языки, правила и семантические значения символов, которые уже разгаданы. Без этого с вопросом дешифровки не справится даже искусственный интеллект, поскольку предложенный алгоритм работает по принципу поиска и сравнения однокоренных слов.
Вместе с тем, исследователи воодушевлены полученным результатом и заявили о намерениях продолжать изыскания, а также разрабатывать другие более совершенные алгоритмы дешифровки. Идеальным вариантом, по мнению ученых является создание некой универсальной системы, которая бы позволила применять ее ко многим языкам, а не к строго определенным, как это происходит сейчас.