MegaXa

MegaXa 

Быдлокодинг...

137subscribers

1post

goals2
12 of 25 paid subscribers
Может хотя бы посты какие то будут Kappa.
$238.63 of $344 raised
Завершение обновления 0.12.

Плагин для синтеза речи с и использованием RVC моделей в MiniChat.

UPD: 26.02.2026
Плагин обновлен для 0.14 и выше. Обновлена инструкция и ссылки.

Итак, первый пост.
На коленке написанный плагин для MiniChat, вариация стандартного плагина "Синтез речи", но подключается к API RVC Text-to-Speech WebUI.
Добавляет возможность озвучивания сообщений и событий кастомными RVC моделями, которые можно взять, например тут: weights.gg.
1) Установить Python (На момент написания поста, необходима версия 3.10), Git for Windows, а также может понадобиться Microsoft C++ Build Tools (MSVC версии 143).
2) Поэтапно выполнить шаги установки указанные тут RVC Text-to-Speech WebUI.
3) После установки, необходимо поместить свои модели в папку weights как в примере на Github.
4) Запустить RVC Text-to-Speech WebUI, для первого и последующих запусков можно использовать прикрепленный bat-файл.
bat
start.bat103 Byte
5) Установить плагин в MiniChat (Путь рядом с исполняемым файлом: MiniChat\Plugin\RVCSpeech):
zip
RVCSpeech.zip6.21 Kb
6) Запустить MiniChat, перейти в настройки плагинов, выбрать плагин "Синтез речи (RVC)", активировать плагин, в поле "Голос" указать название папки одной из моделей (Например: "model1"), в поле "Speaker" указать или "ru-RU-DmitryNeural-Male" (Для мужского) или "ru-RU-SvetlanaNeural-Female" для женского.
7) Изменить другие интересующие вас параметры.
Пример:
Еще примеры:
MegaXa
bandit
0:00
bandit.wav
femalev.wav
jesusAVGN.wav
papich.wav
zelensky.wav
putin.wav
Если есть ошибка при запуске (Обычно она связана с gradio или edge_tts), то выполните соответствующую команду:
pip install -U gradio
pip install -U edge_tts
Пушка
целый час ковырялся так и ничего не понял,сделайте видео инструкцию! Syntax error и прочее не понять ничего!
Retroman, По установке я особо не подскажу, все таки не я отвечаю за сам инструмент. Видео можно найти на YouTube, но если что то идет не так, вряд ли они сильно помогут, учитывая что вся установка это просто поочередный ввод команд. Могу предположить что проблема в установке PyTorch, попробуй вместо установки версии с CUDA выполнить без параметров: pip install torch torchvision torchaudio
Retroman, Например тут есть процесс установки: https://youtu.be/IfwTzD-VaEs?si=IvTf_g3XWrqZRFGK
нажимаю на start.bat ничего не происходит,черное окно мелькает и все,все установлено,и ничего нет)
(venv) E:\rvc-tts-webui>python app.py
Traceback (most recent call last):
File "E:\rvc-tts-webui\app.py", line 8, in
import edge_tts
ModuleNotFoundError: No module named 'edge_tts'
Retroman, В общем попробовал под виртулкой на чистой ОС, видимо тебе надо
поставить (Microsoft C++ Build Tools): https://visualstudio.microsoft.com/ru/visual-cpp-build-tools/ И после установки выбрать (MSVC версии 143) как на скрине. Еще проверь, что у тебя Python версии 3.10, как указано в инструкции на Github, иначе при запуске тогда тоже будет ошибка.
MegaXa, получилось!) благодарю!) 2 часа мудрил)))
и вот еще что ошибки которые не могу понять LINK : fatal error LNK1158: не удается запустить "rc.exe"
error: command 'C:\\Program Files (x86)\\Microsoft Visual Studio 14.0\\VC\\BIN\\x86_amd64\\link.exe' failed with exit code 1158
[end of output]
note: This error originates from a subprocess, and is likely not a problem with pip.
ERROR: Failed building wheel for fairseq
Failed to build fairseq
ERROR: Could not build wheels for fairseq, which is required to install pyproject.toml-based projects
Еще такая проблема,работает,но постоянно закрывается командная строка,с чем это связано? именно когда озвучка работает.
ипать танцы с бубном)) ну нахер...
А будет обновление плагина?
Хотелось бы чтобы Чат подхватывал разные модели голосов. Либо рандомно чат читать, либо выбор голоса на события
и правда танцы с бубном, 2 часа конопатился, всё бестолку
а где можно саму прогу скачать?
На 5070 не заработало, к сожалению. Сам RVC написан под CUDA более старых версий. Познаний в кодировании у меня нет, а Гигакод не справился с апгрейдом
Никита Павук, Мм, к сожалению я сам на 2070, так что не смогу проверить. Попозже я напишу вариант использования через f5-tts, хоть он и потяжелее, но в целом качество поинтереснее, и можно создавать свои голоса обычным аудиотрывком в несколько секунд
Subscription levels2

Доллар 2025.

$1.38 per month
В общем это просто способ сказать спасибо.

Доллар 2030.

$4.2 per month
Для тех. кто хочет еще больше поддержать.
Более приоритетный заказ по функционалу.
Go up