Cover Image for Клонирование моего голоса с помощью ИИ – что случилось с Тео Воном?
[ИИ][TTS][OpenVoice]
13 мая 2025 г.

Клонирование моего голоса с помощью ИИ – что случилось с Тео Воном?

Клонирование моего голоса с помощью ИИ (или попытка) Я использовал ИИ-голос, который звучал как Тео Вон, чтобы озвучивать свои видео. Это было весело — добавляло индивидуальности, и, честно говоря, звучало гораздо лучше, чем мое собственное произношение английского.

Но сегодня, когда я сел записывать новое видео, обнаружил, что голос — мой драгоценный Тео Вон — больше недоступен на Play.ht.

Скриншот проекта Play.ht с отсутствующим именем голоса

Я зашел на сайт, открыл один из старых сценариев для видео, и голос, который я использовал раньше, даже не имел имени. Просто… пусто. Я попытался найти его вручную — пролистал список голосов. Ввел "Theo Von" — ничего. Пробовал "Chris", так раньше назывался голос, похожий на Тео. Тоже ничего.

Попытка поиска голоса по "Theo Von" и затем "Chris" без результатов

Вот и всё. Пора удалять канал. Может, сам Тео Вон узнал и разозлился, что я использую его ИИ-двойника.

Что теперь?

Ну, конечно, я обратился к самому мистеру Роботу — ChatGPT.

Открыт ChatGPT с запросом типа "альтернатива голосу Theo Von на Play.ht"

Вот что он предложил:

Первое место: ElevenLabs. Отлично. Но платно. Значит… идём дальше.

Второе место: OpenVoice. Похоже, бесплатно. Это всё, что мне нужно было услышать. Пробуем.

Я давно хотел озвучивать свой контент сам. Но, опять же, мой английский не совсем на уровне носителя, и я не уверен, что люди захотят слушать меня 10 минут подряд. Так что идея клонировать свой голос — но дать ИИ его "почистить" — казалась идеальной.

Я быстро пробежался по описанию OpenVoice и увидел заветные слова: многоязычное клонирование голоса. Вот оно. Именно то, что мне нужно.

Страница OpenVoice на GitHub с упоминанием многоязычности в README

Я клонировал репозиторий и открыл notebooks/demo_part1.ipynb.

Открыт Jupyter notebook с загруженным demo_part1.ipynb

Первая ячейка… бум. Проблема. Нет моделей. Чекпойнты не включены. Классика.

Но ничего страшного — после небольшого гугления я нашёл нужные файлы, закинул их, перезапустил всё и снова запустил.

Вид папки с добавленными файлами моделей / чекпойнтами

На этот раз всё вроде бы сработало.

Я записал короткий голосовой образец, снова запустил ноутбук… и наконец получил свой ИИ-аудиофайл.

Послушаем.

Разочарование. Вместо настоящего клона моего голоса я получил очень обычный TTS-голос, может быть, с намёком на мою интонацию… но абсолютно без индивидуальности.

Следующий шаг — обучать свою собственную модель. Это гораздо сложнее, чем просто скормить короткий сэмпл.

Нет уж… спасибо.

Так что я просто выбрал другой готовый голос. Если вам было интересно — или у вас есть лучшее решение — оставьте комментарий. Спасибо за чтение.

Читать далее

Присоединяйтесь к нашему сообществу