Клонирование голоса нейросетью на русском: создать аудио с определенным текстом и голосом
Реалистичный голосовой клон TurboText — функция, позволяющая с точностью повторить голос человека, наложив определенный текст. Например, вы можете создать индивидуальное поздравление для друга или близкого человека голосом знаменитости, устроить розыгрыш или создать развлекательное видео с клоном голоса.
Полезные ссылки
@TurboText_bot — бот с искусственным интеллектом для замены фона и т.п.
Turbotext.ru/photo_ai — сайт с нейросетями для создания картинок и видео
Turbotext.pro — сайт для создания уникального текстового контента
Как клонировать голос
Переходите в Telegram-бот TurboText, раздел Аудио — Клонирование голоса.
Параметры нейросети
- Для начала голосового клонирования необходимо загрузить аудио с нужным голосом длинной от 5 секунд и не более 300 секунд
- Доступные форматы: MP3, WAV, M4A, OGG (голосовое сообщение в Telegram)
- В аудио должен быть только один голос, без посторонних шумов, мелодий. Чем чище звуковой ряд — тем лучше результат.
- За за каждые 10 секунд аудио от нейросети снимается 1 токен. 20 секунд — 2 токена и т. п.
- Полученный клон голоса можно использовать для создания аватара или в дипфейк видео.
- ❗️Нейросеть распознает голос в формате аудио. Голос из видео файлов и кружочков в Telegram распознать не удастся.
Примеры клонирования голоса нейросетью
Чтобы клонирование голоса сработало в высоком качестве, оригинал аудио должен иметь чистый звук. Так нейросеть лучше распознает голос, тембр и другие нюансы, которые важны для клонирования.
Оригинал Ляйсан Утяшева
Клон
Оригинал Павел Воля
Клон
Неудачные примеры клонирования из-за качества звука:
оригинал
клон
Голоса, созданные нейросетью, также будут плохо распознаваться при клонировании:
оригинал
клон