Другие новости

Опубликована 13 ноября, 04:06

Клонирование голоса нейросетью на русском: создать аудио с определенным текстом и голосом

Реалистичный голосовой клон TurboText — функция, позволяющая с точностью повторить голос человека, наложив определенный текст. Например, вы можете создать индивидуальное поздравление для друга или близкого человека голосом знаменитости, устроить розыгрыш или создать развлекательное видео с клоном голоса.

Полезные ссылки

@TurboText_bot — бот с искусственным интеллектом для замены фона и т.п.

Turbotext.ru/photo_ai — сайт с нейросетями для создания картинок и видео

Turbotext.pro — сайт для создания уникального текстового контента

TurboCheck — сервис проверки качества текстов нейросетями

Telegram-канал TurboText

Сообщество нейрохудожников и нейрописателей в Telegram

Как клонировать голос

Переходите в Telegram-бот TurboText, раздел Аудио — Клонирование голоса.

Параметры нейросети

  • Для начала голосового клонирования необходимо загрузить аудио с нужным голосом длинной от 5 секунд и не более 300 секунд
  • Доступные форматы: MP3, WAV, M4A, OGG (голосовое сообщение в Telegram)
  • В аудио должен быть только один голос, без посторонних шумов, мелодий. Чем чище звуковой ряд — тем лучше результат.
  • За за каждые 10 секунд аудио от нейросети снимается 1 токен. 20 секунд — 2 токена и т. п.
  • Полученный клон голоса можно использовать для создания аватара или в дипфейк видео.
  • ❗️Нейросеть распознает голос в формате аудио. Голос из видео файлов и кружочков в Telegram распознать не удастся.

Примеры клонирования голоса нейросетью

Чтобы клонирование голоса сработало в высоком качестве, оригинал аудио должен иметь чистый звук. Так нейросеть лучше распознает голос, тембр и другие нюансы, которые важны для клонирования.

Оригинал Ляйсан Утяшева

Клон

Оригинал Павел Воля

Клон

Неудачные примеры клонирования из-за качества звука:

оригинал

клон

Голоса, созданные нейросетью, также будут плохо распознаваться при клонировании:

оригинал

клон