OpenAI разработала инструмент для клонирования голоса
OpenAI разработала инструмент для клонирования голоса, однако его использование пока ограничено. В условиях быстрого распространения фейков, компания стремится ответственно совершенствовать технологию клонирования голосов.
Voice Engine от OpenAI, являясь расширением существующего API для преобразования текста в речь, находится в разработке около двух лет. Этот инструмент позволяет создать синтетическую копию любого голоса всего по 15-секундному образцу. Тем не менее, дата общедоступного релиза пока не определена, что дает компании время на адаптацию к потенциальному использованию и предотвращению злоупотреблением моделью для различных махинаций.
Читайте нас в Telegram: только самые актуальные и проверенные новости
Модель искусственного интеллекта, лежащая в основе Voice Engine, долгое время была доступна публике, применяясь, в том числе, в возможностях голосового и "чтения вслух" в ChatGPT, а также в пресетах голосов в API преобразования текста в речь OpenAI. Spotify использует ее с начала сентября для дублирования подкастов известных ведущих, таких как Лекс Фридман, на различные языки.
Данные для обучения модели взяты из лицензированных и общедоступных источников, однако детали оставляются за кулисами из-за чувствительности и потенциальных юридических рисков.
Voice Engine не обучается и не настраивается на данных пользователей благодаря особенностям работы модели. Инструмент анализирует аудиоданные и текст, предназначенный для озвучивания, создавая подходящий голос без необходимости создания отдельной модели для каждого оратора.
Многие компании и крупные технологические игроки уже предложили продукты для клонирования голоса. Однако в OpenAI утверждают, что их подход обеспечивает более высокое качество речи и будет предлагаться по конкурентоспособной цене. Несмотря на это, Voice Engine пока не предлагает инструменты для регулировки тона, высоты звука или темпа голоса.
Применение технологии клонирования голоса может оказать значительное влияние на рынок труда голосовых актеров, но OpenAI не планирует заключать соглашения с профсоюзами или создавать рынки для своего продукта. Компания требует от пользователей получить "явное согласие" от людей, чьи голоса клонируются, и четко указывать, какие голоса были сгенерированы ИИ.
Использование приложений для клонирования голоса может быть злоупотребительным, что вызывает обеспокоенность относительно этики и возможности создания фейковых материалов. OpenAI предпринимает шаги для предотвращения неправомерного использования Voice Engine, включая ограниченный доступ к инструменту и сосредоточение на социально полезных применениях.
При успешном предварительном тестировании и положительной реакции общественности на Voice Engine, OpenAI может расширить доступ к инструменту для более широкого круга разработчиков. В дальнейшем компания исследует механизмы безопасности, такие как требование читать случайно генерируемый текст для подтверждения осведомленности о том, как используется голос пользователя.