Клонирование моего голоса с помощью ИИ – что случилось с Тео Воном?
Клонирование моего голоса с помощью ИИ (или попытка) Я использовал ИИ-голос, который звучал как Тео Вон, чтобы озвучивать свои видео. Это было весело — добавляло индивидуальности, и, честно говоря, звучало гораздо лучше, чем мое собственное произношение английского.
Но сегодня, когда я сел записывать новое видео, обнаружил, что голос — мой драгоценный Тео Вон — больше недоступен на Play.ht.
Я зашел на сайт, открыл один из старых сценариев для видео, и голос, который я использовал раньше, даже не имел имени. Просто… пусто. Я попытался найти его вручную — пролистал список голосов. Ввел "Theo Von" — ничего. Пробовал "Chris", так раньше назывался голос, похожий на Тео. Тоже ничего.
Вот и всё. Пора удалять канал. Может, сам Тео Вон узнал и разозлился, что я использую его ИИ-двойника.
Что теперь?
Ну, конечно, я обратился к самому мистеру Роботу — ChatGPT.
Вот что он предложил:
Первое место: ElevenLabs. Отлично. Но платно. Значит… идём дальше.
Второе место: OpenVoice. Похоже, бесплатно. Это всё, что мне нужно было услышать. Пробуем.
Я давно хотел озвучивать свой контент сам. Но, опять же, мой английский не совсем на уровне носителя, и я не уверен, что люди захотят слушать меня 10 минут подряд. Так что идея клонировать свой голос — но дать ИИ его "почистить" — казалась идеальной.
Я быстро пробежался по описанию OpenVoice и увидел заветные слова: многоязычное клонирование голоса. Вот оно. Именно то, что мне нужно.
Я клонировал репозиторий и открыл notebooks/demo_part1.ipynb.
Первая ячейка… бум. Проблема. Нет моделей. Чекпойнты не включены. Классика.
Но ничего страшного — после небольшого гугления я нашёл нужные файлы, закинул их, перезапустил всё и снова запустил.
На этот раз всё вроде бы сработало.
Я записал короткий голосовой образец, снова запустил ноутбук… и наконец получил свой ИИ-аудиофайл.
Послушаем.
Разочарование. Вместо настоящего клона моего голоса я получил очень обычный TTS-голос, может быть, с намёком на мою интонацию… но абсолютно без индивидуальности.
Следующий шаг — обучать свою собственную модель. Это гораздо сложнее, чем просто скормить короткий сэмпл.
Нет уж… спасибо.
Так что я просто выбрал другой готовый голос. Если вам было интересно — или у вас есть лучшее решение — оставьте комментарий. Спасибо за чтение.
Читать далее
- 11 мая 2025 г.
Отчёт о трафике: Апрель–Май 2025
Трафик сайта за последние 30 дней — краткий отчёт и наблюдения.
- 12 апреля 2025 г.
Как я улучшаю SEO блога: анализ и планы на будущее
Разбираюсь, откуда идёт трафик на блог, как использовать длинные ключевые запросы и улучшить заголовки, метаописания и внутреннюю структуру.