Израильские ученые создают ИИ для перевода древнего клинописного текста
Эксперты в области ассириологии, специализирующиеся на археологических, исторических, культурных и лингвистических исследованиях Ассирии и остальной части древней Месопотамии (Ирака), тратят много лет на кропотливые попытки понять аккадские тексты, написанные клинописью, одной из древнейших известных форм письма.
Клинопись переводится как “клиновидная”, потому что в древности ее писали с помощью тростникового стилуса, чтобы сделать клиновидную отметку на глиняной табличке.
Но теперь исследователи из Тель-Авивского университета (ТАУ) и Университета Ариэля разработали модель искусственного интеллекта , которая сэкономит все эти усилия. Модель ИИ может автоматически переводить аккадский текст, написанный клинописью, на английский язык.
Доктор Шай Гордин из Ариэльского университета и доктор Гай Гутерц, доктор Джонатан Берант и доктор Омер Леви из TAU и их коллеги только что опубликовали свои выводы в журнале PNAS Nexus под заголовком “Перевод аккадского языка на английский с помощью нейронного машинного перевода”.
Когда они разработали новую модель машинного обучения, они обучили две версии: одну, которая переводит аккадский язык из представлений клинописных знаков в латиницу, и другую, которая переводит из представлений клинописных знаков в кодировке Юникод. Первая версия, использующая латинскую транслитерацию, дала более удовлетворительные результаты в этом исследовании, набрав 37,47 балла в Best Bilingual Evaluation Understudy 4 (BLEU4), который представляет собой проверку уровня соответствия между машинным и человеческим переводом одного и того же текста.
Программа наиболее эффективна при переводе предложений длиной до 118 символов. В некоторых предложениях программа производила “галлюцинации” — выводы, который был синтаксически правильным на английском языке, но не точным.
Гордин отметил, что в большинстве случаев перевод можно использовать в качестве первого прохода по тексту. Авторы предлагают использовать машинный перевод как часть “человеко-машинного сотрудничества “, при котором ученые-люди корректируют и уточняют результаты моделей.
Они писали, что сотни тысяч глиняных табличек, начертанных клинописью, документируют политическую, социальную, экономическую и научную историю древней Месопотамии: “Тем не менее, большинство этих документов остаются непереведенными и недоступными из-за их огромного количества и ограниченного количества экспертов, способных их прочитать”.
Они пришли к выводу, что перевод — это фундаментальная человеческая деятельность, имеющая долгую научную историю с момента появления письменности: “Это может быть сложный процесс, поскольку он обычно требует не только экспертного знания двух разных языков, но и разной культурной среды. Цифровые инструменты, которые могут помочь в переводе, с каждым годом становятся все более распространенными, что связано с достижениями в таких областях, как оптическое распознавание символов (OCR) и машинный перевод. Однако древние языки по-прежнему представляют собой серьезную проблему в этом отношении. Их чтение и понимание требуют знаний о давно умершем языковом сообществе, кроме того, сами тексты тоже могут быть очень фрагментарными”.