НОВОСТИ ПО ПЕРЕВОДЧИКУ
Честно говорю — работы ещё много, до хорошей реализации примерно год. Я выгорел, потому что долго делать одно и то же тяжело морально, но я буду его переписывать как минимум все лето.
Да, сейчас вес проекта составляет ~300 GB — из-за моделей и модулей, которых довольно много. Одних только переводчиков — на 100 GB, и это более 20 разных моделей / видов.
Качество перевода часто лучше, чем у Яндекса (+ клонирование голоса). Многие модели на уровне DeepL, и даже есть поддержка LLM — то есть, если система позволяет, можно загрузить, например, DeepSeek для перевода.
Сейчас всё ещё далеко от идеала, и интерфейса (GUI / WEBUI) пока нет — доступна только CLI-версия.
Он будет поддерживать: Youtube (даже с скачкой субтитров), Spotify (даже с скачкой lyrics), сайты которые поддерживает yt-dlp и локальные аудио / видео файлы.
Из хороших новостей — самая минимальная версия может весить ~40 GB.
Но: на минимальных характеристиках перевод 2-минутного фрагмента занимает около 3 часов. Также из хорошего — значительный прирост качества (хотя и за счёт времени обработки): в 2–3 раза лучше, чем в текущих примерах. Ошибки от неверного ввода также исключены (я называю это системой "Защита от дебилов").
Код пока переписан примерно на 7%. Планирую внедрить систему лицензирования. И чтобы быть честным — код будет зашифрован, но без каких-либо вирусов, исключительно для целей лицензирования.
По характеристикам:
Минимальные:
CPU: i5 (10-го поколения)
GPU: GTX 1660
RAM: 16 GB
Space: ~50–60 GB