SynthVoiceRu

SynthVoiceRu 

Русская озвучка игр нейросетью

17 077subscribers

133posts

Showcase

23
goals1
$983.36 of $703 raised
Озвучить Oblivion (zaza)

Обновление нашей модели озвучивания SVR_TTS

Продолжаю искать способы улучшить свою модель синтеза речи.
На этот раз наткнулся на статью на arXiv, где авторы добились заметного улучшения качества синтеза на доступных open-source моделях. Их ключевая идея, обучать не на большом, а на чистом датасете.
Меня заинтересовала эта гипотеза, и я решил проверить её на практике. Применил те же алгоритмы очистки данных, что и в стать, в результате “в помойку” ушло около 80% исходных аудиофайлов. В финале осталось около 100 часов чистого аудио, именно на этом объёме я и начал обучение модели с нуля.
Почему не дообучение? Потому что текущая модель при долгом дообучении начинала "галлюцинировать" терять смысл речи.
Для первого этапа обучения арендовал сервер с 8 видеокартами NVIDIA H200 80GB. Однако на втором этапе возникло узкое место, CPU стал не справляться с потоками данных, из-за чего 8 GPU не удавалось загрузить на полную.
После небольших экспериментов оказалось, что с финансовой точки зрения разумнее перейти на одну карту H200 140GB и увеличить размер батча.
Пока что результат сырой, синтез остаётся неразборчивым, модель "говорит что попало", но уже не шумит, что само по себе хороший признак. Есть опасения, что объёма данных окажется недостаточно, и модель просто всё запомнит, не обобщив. Но, как говорится, кто не рискует.
Продолжение следует...
А сколько примерно нужно времени, при условии что все пойдет идеально, чтобы можно было начинать озвучивать игры новой моделью? Это дни, недели, месяцы?
Kirill, Он в последнее время всё в ютуб шортс выкладывает. 
oeLLoReSIK [:, там только игры которые озвучили полгода назад, актуального ничего нет, это скорее на привлечение тех кто не знает об озвучке, а актуальные новости только на бусти. Так что Ждем новостей)
Эх Скайрим онлайн бы кто озвучилthinking_face
Riki Scoundrel, Онлайн игры любителям сложнее озвучить, чем сюжетки.
Здравствуйте. Планируете обновлять озвучку на The Outer Worlds: Spacer's Choice Edition?
Эх, кто бы озвучил мало кому нужную игру и DLC. https://store.steampowered.com/app/746850/Cloudpunk/
Sleeping Dogs бы, уважаемый...там, как и в GTA, не возможно с кайфом рулить и одновременно читать) Спасибо за ваши труды!  pizza
Привет! Я на текущий момент пытаюсь написать софт который автоматизирует озвучку видео, примерно так, как делал Yandex для Youtube в своем браузере. Мне очень нравится как звучит ваша модель в Baldurs Gate 3. Я считаю, это на порядок лучше чем, то, что сделал Яндекс для Youtube. И я хотел бы, чтобы видео можно было бы озвучивать хотябы на таком уровне как Baldurs Gate 3. Я хотел бы понять, как ваша модель сделана с технологической точки зрения, например интересует, когда модель уже обучена, может ли она генерировать речь просто по небольшому референсу Audio, например как это реализовано в coqui/XTTS-v2? И какой объем памяти она занимает? Можете поделиться технологическими инсайтами или отправить куда-нибудь конкретно почитать?
Dmitry, вы можете использовать и изучить нашу модель
https://github.com/Selectorrr/svr_tts
SynthVoiceRu, пример того как ее использовать можно найти в нашем софте по озвучке
https://github.com/Selectorrr/svr_voiceover
Озвучьте новой моделью Kingdom Come: Deliverance 1 и все DLC
Озвучьте новой моделью основной сюжет Kingdom Come: Deliverance II
Озвучьте Assassin’s Creed Shadows
Озвучьте Assassin's Creed Mirage
Озвучьте Avatar: Frontiers of Pandora™
Озвучьте Dragon Age 2
Озвучьте Dragon Age™ Inquisition
Озвучьте Dragon Age: The Veilguard
Озвучьте новой моделью Baldur's Gate 3
Озвучьте новой моделью Divinity: Original Sin 2
Озвучьте новой моделью Tainted Grail: The Fall of Avalon
Озвучьте новой моделью Starfield
Было-бы круто переозвучить Starfield
было бы круто переозвучить Tainted Grail: The Fall of Avalon последнюю версию
Creator has disabled comments for this post.
Subscription levels3

Фанат

$2.81 per month
Доступ ко всем постам и комментариям, актуальным ссылкам без майнеров и вирусов.
(кроме новых, они будут доступны для фанатов, спустя 3 дня после релиза)
Поддержка команды
За бессонные ночи, решение многочисленных проблем при создании модов, выразить благодарность за все наши озвучки.
Оплата с пк без комиссии. 

Преданный

$6.4 per month
Предыдущие преимущества
+ Доступ к  постам и комментариям в день релиза
+ Доступ в закрытый телеграм канал SynthVoiceClub, где мы делимся многим за кулисным контентом, фрагменты аудио предстоящих озвучек, голосования за выбор игры на озвучку, процессом работы, чем занимаемся, какой статус озвучки, планы на будущее и тд
Поддержка команды
оплата с пк без комиссии. 
+ chat

Покровитель

$10.6 per month
Поддержка команды
Все предыдущие преимущества
+Помощь на развитие нашей модели озвучивания , регулярные доработки качества. (На улучшение подбора голосов, максимально похожих на оригинал, эмоциональность, тембры, интонации)
оплата с пк без комиссии. 
+ chat
Go up