Faster Whisper | Portable by Neurogen | Wav2Txt
Программа работает на базе ускоренной версии Whsiper от OpenAI.
Возможности:
- Транскрибирование аудио и видео файлов
Возможности:
- Транскрибирование аудио и видео файлов
- Транскрибирование по YouTube ссылке
- Транскрибирование с записи микрофона
- Транскрибирование и перевод на английский (пока только на английский)
- Автоматическое формирование по результатам файлов в форматах txt, json, srt, vtt.
- Автоматическое формирование по результатам файлов в форматах txt, json, srt, vtt.
- Интеграция Silero VAD: Детектора речи, позволяющего пропустить при обработке фрагменты, без речи: тишину, музыку и т.д.
- Возможность тонкой настройки
Предустановлена модель medium. Есть поддержка whisper-large-v3, но, так как, не на каждой видеокарте она сможет работать, был выбран компромиссный вариант. Вы же можете докачать любую модель самостоятельно.
Скачать архивом:
Скачайте все файлы, затем распакуйте архив который заканчивается на 001. Остальные файлы трогать не надо, они распакуются автоматически.
faster-whisper-webui portable by Neurogen.7z.001980 MbDownload
faster-whisper-webui portable by Neurogen.7z.002980 MbDownload
faster-whisper-webui portable by Neurogen.7z.003980 MbDownload
faster-whisper-webui portable by Neurogen.7z.00451.16 MbDownload
wav2txt
whisper
Anton Blinov
Сборка огонь, но было бы неплохо подкастик записать с основным функционалом и описанием ползунков и настроек. Так и не разобрался как перевести видео сразу на русский.
Max Orewill
правильно ли я понимаю, что портативные сборки работают полностью автономно на ПК даже без подключения к интернету? К слову, где-то тут видел нейронку для клонирования голоса. Но потерял из виду и не могу найти опять. Как она называется?
Anton Blinov
Max Orewill, да, но автономно они начинают работать когда вы скачаете себе все модели, они не входят в базовые архивы
Илья Звягин
подскажите, пожалуйста, почему нейронка Whisper почти в каждом аудиофайле тормозит и некоторые моменты "съедает", не распознавая? порой, из двух часов распознаёт только час или полчаса, а всё остальное превращает в одну размноженную фразу? версия, если что, отсюда https://pikabu.ru/story/neyroset_dlya_rasshifrovki_video_i_audio_v_tekst_ili_subtitryi_10321125#comments
так-то буду скоро тестировать эту вот, новую.
так-то буду скоро тестировать эту вот, новую.
Neurogen
Илья Звягин, а какая модель выбрана? Такое может быть когда происходит какая-то ошибка, к примеру, нехватка памяти или что-то еще.
Рекомендую все таки вот новую версию скачать, та все таки устарела на данный момент
Рекомендую все таки вот новую версию скачать, та все таки устарела на данный момент
Илья Звягин
а как эту версию использовать? скачал все архивы, распаковал - но что запускать?
использую start_portable_nvidia
использую start_portable_nvidia
Илья ЗвягинReplying to Neurogen
Neurogen, заработало, спасибо!
а что такое "VAD"? и как там всё расшифровывается? гугл-переводчик не помог.
а что такое "VAD"? и как там всё расшифровывается? гугл-переводчик не помог.
Илья ЗвягинReplying to Neurogen
Neurogen, спасибо, всё работает, круто! всё отлично транскрибировано, без багов и торможений! СПАСИБО!
единственный вопрос: по VAD`а. можете расшифровать те 4 строчки? пожалуйста.
единственный вопрос: по VAD`а. можете расшифровать те 4 строчки? пожалуйста.
Сергей Дубровский
Выдает ошибку, когда пытаюсь скачать whisper large v3, консоль жалуется на то, что нет прав. Запускаю от имени админа, говорит что не найден python
Попытался запустить медиум, не нагружает видеокарту а работает на проце
Помогите)
Попытался запустить медиум, не нагружает видеокарту а работает на проце
Помогите)
Neurogen
Сергей Дубровский, от админа запускать не нужно. Можно скрин ошибки?
Какая видеокарта?
Какая видеокарта?
Сергей ДубровскийReplying to Neurogen
Neurogen, RTX 3080 Ti, скрин кину чуть чуть попозже
Creator has disabled comments for this post.