Компания OpenAI представила клонирующую голоса нейросеть Voice Engine
OpenAI анонсировала новую модель Voice Engine, предназначенную для трансформации текста в речь. Согласно сообщению в блоге компании, для клонирования голоса человека нейросети требуется всего 15-секундный аудио-пример.
Отличительной особенностью разработки OpenAI является возможность использования короткого аудио-сэмпла продолжительностью 15 секунд в качестве примера для нейросети. Пользователям достаточно предоставить такой пример голосового сообщения нужного человека и ввести желаемый текст для озвучивания.
Команда специалистов OpenAI также рекомендует применять эту технологию для восстановления голоса у людей, лишенных его по различным причинам. Они также обсудили потенциальные угрозы, связанные с использованием современных генеративных моделей, и предложили способы их решения. В частности, они советуют банкам и другим организациям постепенно отказываться от биометрической аутентификации по голосу и информировать людей о возможных угрозах, связанных с использованием искусственного интеллекта и методах различения подлинного контента от сгенерированного.
OpenAI также поделилась информацией о том, что разработка Voice Engine началась в конце 2022 года, а для обучения модели использовались как лицензированные, так и открытые данные. Однако дата, когда сервис станет доступным для широкой публики, пока не сообщается.
Смотреть комментарии → Комментариев нет