Meta обучили ИИ на религиозных текстах распознавать более 4 тысяч языков
Искусственный интеллект Massively Multilingual Speech MMS от компании Meta сможет распознавать более 4 тысяч языков и будет говорить на более 1 100 языках. Об этом пишет Engadget.
Meta предоставила открытый доступ к MMS, чтобы помочь сохранить языковое разнообразие и поощрить исследователей развивать его с помощью своего инструмента. Компания использовала нетрадиционный подход к сбору аудиоданных – прослушивание аудиозаписей переведенных религиозных текстов.
"Мы обратились к религиозным текстам, таким как Библия, которые были переведены на многие языки и чьи переводы были широко изучены для исследования языкового перевода на основе текста", – заявили в компании.
По мнению разработчиков, это важный шаг к сохранению языков, которым грозит исчезновение.
В мире существует около 7 000 языков, но существующие модели распознавания речи полностью охватывают лишь около 100 из них. Это связано с тем, что такие модели обычно нуждаются в огромных объемах обучающих данных, доступных только для небольшого количества языков.