Компания OpenAI представила клонирующую голоса нейросеть Voice Engine

30.03.2024, 16:45, Разное

OpenAI анонсировала новую модель Voice Engine, предназначенную для трансформации текста в речь. Согласно сообщению в блоге компании, для клонирования голоса человека нейросети требуется всего 15-секундный аудио-пример.

Отличительной особенностью разработки OpenAI является возможность использования короткого аудио-сэмпла продолжительностью 15 секунд в качестве примера для нейросети. Пользователям достаточно предоставить такой пример голосового сообщения нужного человека и ввести желаемый текст для озвучивания.

Команда специалистов OpenAI также рекомендует применять эту технологию для восстановления голоса у людей, лишенных его по различным причинам. Они также обсудили потенциальные угрозы, связанные с использованием современных генеративных моделей, и предложили способы их решения. В частности, они советуют банкам и другим организациям постепенно отказываться от биометрической аутентификации по голосу и информировать людей о возможных угрозах, связанных с использованием искусственного интеллекта и методах различения подлинного контента от сгенерированного.

OpenAI также поделилась информацией о том, что разработка Voice Engine началась в конце 2022 года, а для обучения модели использовались как лицензированные, так и открытые данные. Однако дата, когда сервис станет доступным для широкой публики, пока не сообщается.

Смотреть комментарии → Комментариев нет

Добавить комментарий


Имя обязательно	E-mail обязательно

Нажимая на кнопку "Отправить", я соглашаюсь c политикой обработки персональных данных. Комментарий c активными интернет-ссылками (http / www) автоматически помечается как spam