katkat74, lip файлы не делает как и сказал Кальян. Думаю для их создания можно найти подходящий генератор который сможет из этих же датасетов создавать их.

Синтезатор речи Андроида не сможет сделать тебе озвучку похожую на речь другого человека, в этом и смысл обучения модели озвучки на семплах речи определённого человека.

Ъжслое, п-ф-ф-ф... Нынче самый топовый аргумент, это - "ятакщитаю".

Hangman, соглашусь, только вот к демагогии прибегают как правило те, кто остаивает сомнительную и слабоаргументированную точку зрения

Ъжслое, не. Это приём из арсенала среднестатистического демагога любой ориентации.

Dannato (Dammit), любимая тактика либераста из палаты мер и весов: додумать за оппонента его точку зрения и затем разбить/обвинить в двуличности и лицемерии

Drazgar, на фоне того, что многие игры теперь ограничиваются переводами без озвучки, это могло быть дать им шанс... Права правами, но... если на эту работу всё равно никогда и никого не наймут - за что бодаться?..
Хороший джинн, в общем, пусть подрастает и ифритится.

Я автора и сам спрашивал по поводу обучения новых моделей. Это всё можно сделать, но достаточно геморройно. Нужно сделать датасет для каждого звукового файла с таймингами текста используя Tacotron2 и потом скормить это FastPitch и уже оттуда в xVASynth. У автора сделаны датасеты для английского языка.

gkalian
администратор
14.01.2021 — 07:28

katkat74, он лип-файлы не делает, программа создает только звук в формате wav.

Кербер, ага, я тоже пробовал русский текст. Там надо модель натренировать именно на русскую речь. Но судя по комментариям на нексусе, автор в целом и не против, просто у него немного другие приоритеты сейчас.

katkat74
модмейкер
14.01.2021 — 04:41

Кербер, А зачем головы загружать? он лип файлы делает? Отличается вобще от синтезатора речи на андроид например?

Drazgar
модератор
14.01.2021 — 02:42

А не будет ли правовых проблем, если начнут таким образом пользоваться образцами голосов актёров озвучки? Просто вопросы уже поднимались подобного плана.
wsj.com/articles/BL-LB-55168
theverge.com/2020/4/28/21240488/jay-z-deepfakes-roc-nation-youtube-removed-ai-copyright-impersonation

А то ведь джинн из этой бутылки может оказаться настоящим ифритом.

Не многовато ли глобальных проектов для Скайрима в последнее время?
Хотя о чем это я чем больше тем лучше. Главное чтобы все это вышло конечно же.

Проверил. Если программе скормить русский текст, то она сгенерирует озвучку, но звучать она будет с невероятно жутким акцентом, как будто текст читает человек, который очень приблизительно знает как звучат слова на русском.
Впрочем, может на какой-то из множества представленных моделей, и выйдет что-нибудь приличное. Но лучше всё же сгенерировать модель из семплов на русском для нормальной озвучки.

Roden, интересно сколько мне водки надо, чтоб осилить этот сериал))) сопьюсь нафиг