Турбо-транскрибация справилась даже с Брежневым! #2495
Я уже рассказывал про самый лучший, на мой взгляд сервис Whisper Large V2. для транскрибации аудио в текст.
Отличительной особенностью этого сервиса является то, что она не только транскрибирует, но и правильно делит текст на предложения, а также расставляет знаки препинания.
Лично я с помощью данного сервиса обработал множество часов материала, который мне нужно было превратить в текст, а затем скормить в GPTs.
Сегодня у меня шикарная новость для Вас – вышла третья версия данного сервиса, которая называется Whisper Large V3 TURBO.
Чтобы сравнить старую и новую версии я провел эксперимент на двухминутном айдио-фрагменте, где Леонид Ильич Брежнев выступает на 26-м съезде КПСС – получилось очень занятно и впечатляюще, убедитесь сами...
Отличительной особенностью этого сервиса является то, что она не только транскрибирует, но и правильно делит текст на предложения, а также расставляет знаки препинания.
Лично я с помощью данного сервиса обработал множество часов материала, который мне нужно было превратить в текст, а затем скормить в GPTs.
Сегодня у меня шикарная новость для Вас – вышла третья версия данного сервиса, которая называется Whisper Large V3 TURBO.
Чтобы сравнить старую и новую версии я провел эксперимент на двухминутном айдио-фрагменте, где Леонид Ильич Брежнев выступает на 26-м съезде КПСС – получилось очень занятно и впечатляюще, убедитесь сами...
👉 Ссылка на прошлый выпуск про транскрибацию (если еще не видели прошлый выпуск, обязательно посмотрите и зарегистрируйтесь в этом сервисе).
Исходный mp3 файл с речью Леонида Ильича Брежнева, который был использован в данном видео:
⭐️ Василий Медведев
BreznevLI.mp3
0:00
1:59
Ваш друг, Василий Медведев 🧡
===============================
❗Отказ от ответственности: Содержание данного поста представляет собой мнение и опыт автора и не является рекламой программ и сервисов упомянутых в этой публикации и видеороликах, а также не является рекомендацией или гарантией. Автор не призывает к сокрытию незаконной информации, не несет ответственности за результаты использования программ и любых упомянутых сервисов. Просьба самостоятельно проверять и выбирать подходящие сервисы, программное обеспечение и операционные системы.
===============================
❗Отказ от ответственности: Содержание данного поста представляет собой мнение и опыт автора и не является рекламой программ и сервисов упомянутых в этой публикации и видеороликах, а также не является рекомендацией или гарантией. Автор не призывает к сокрытию незаконной информации, не несет ответственности за результаты использования программ и любых упомянутых сервисов. Просьба самостоятельно проверять и выбирать подходящие сервисы, программное обеспечение и операционные системы.
===============================
нейросети
графика видео аудио
Ivan Bellew
Если он бесплатный , то это здорово! Основное его отличие от старой версии, как я понял, в том, что исчезли куски повторов текста. Старая версия нередко этим грешила. Хотя тоже вполне удовлетворительна в работе. А так они хороши обе. Забавно, что новая версия исправила одну ошибку, сделанную старой версией, зато внесла новую ошибку, которой не было у старой версии!
Oct 10 2024 08:54
Юрий Щербаков
На самом деле, версия 3 в разы быстрее работает! Брежнева у вас круто обработала, а слабо Григория Лепса в оригинале? Усложнил задачу для ИИ - запустил песню "Вьюга" в mp3. Работает, но ошибок, конечно больше, хотя понять можно. Припев а вообще без ошибок.
Oct 10 2024 09:22
Ivan Bellew
Ой! Я кажется поторопился с восторгами. Да, версия 3 несколько побыстрее будет. Но. Сейчас транскрибировал главы романа Коллинз "Лунный камень" в аудиоисполнении. Сразу заметил вот что. ВО-первых, новая версия потребовала регистрации аккаунта после использования скольки-то там секунд тестовой работы. Но это так, ерунда. Но вот на каком-то этапе работы она просто отказалась дальше работать, выдала ошибку. Попробовал еще раз - там же опять ошибка. Попробовал этот же файл в версии 2 - все прошло нормально. ВПН у меня нет. После этого я повнимательней присмотрелся к качеству транскрибации версией 3. И обнаружил, что оно похуже будет. Фразы кое-где выходили какие-то корявенькие по сравнению с версией 2 на том же тексте. Я не претендую на объективность, поскольку нейросети - это такая штука, что сбои тут возможны всякие. Но поделиться своим опытом счел нужным.
Oct 10 2024 10:46
Ali Ismailov
Выдали ошибку обе версии! Вставил ссылку на короткие видео с Юьтьюба!
Oct 11 2024 10:00 (changed)
Ali IsmailovReplying to ⭐️ Василий Медведев
Василий Медведев, При таком интернете у нас, скачивать надо сутками:) Поэтому и хотел сразу с Юьтьюба по ссылке транскрибировать! Придется всё таки скачивать и отделять аудиофайл!
Oct 12 2024 20:35
⭐️ Василий МедведевReplying to Ali Ismailov
К сожалению да
Oct 12 2024 22:27 
1
Евгений Лукин
В связи с выпуском вашего поста о возможности транскрибации аудио-видео в текст с помощью сервиса Whinsper Ladge V3 Turbo, я пытался произвести эти действия через YouTube и Audio, но, ничего не вышло не через VPN, не без него. При нажатие на кнопку Транскрибация появляется такая надпись% "ERROR: [youtube] 2pS8O_TMh6M: Sign in to confirm you’re not a bot. This helps protect our community. Learn more "(" ОШИБКА: [youtube] 2pS8O_TMh6M: Войдите, чтобы подтвердить, что вы не бот. Это помогает защитить наше сообщество. Узнать больше"). Перед началом действия, я официально зарегистрировался на сервисе и подтвердил свой аккаунт через почту. Не пойму, в чем ошибка и как все исправить. Помогите,пожалуйста.
Oct 13 2024 11:46
⭐️ Василий Медведев
Евгений, Здравствуйте! Да, я выше писал тоже об этом в комментах: попробовал несколько раз со ссылкой на Yotube/ Действительно пишет ошибку и просит в ней залогиниться, как я понял. Но я зарегистрирован на сайте и залогинен. Сам не понял чего он хочет тогда. Но аудиофайлы транскрибирует, это мне от него и нужно.
Oct 13 2024 22:31
Александр Резунов
При транскрибации видео с ютуба всегда выдает ошибку
Oct 14 2024 01:11
⭐️ Василий Медведев
Александр Резунов, да, уже многие заметили. Я потому транскрибирую там только аудиофайлы.
Oct 14 2024 18:16
A SERGEY
Протестировал оба варианта нейросети, а также как с VPN, так и без:
1.Траyскрибация Whisper Large V3 TURBO работает на порядок быстрее но ...
2. Whisper Large V2 переводит в текст гораздо правильнее с точки зрения орфографии, по-этому переходить на Turbo я бы не торопился.
3. Транскрибация как с VPN так и без полностью идентична, в моем случае.
4. Нейросеть быстро учится у человека, обогащая себя "лучшими" чертами, в частности "ленью". Дело в том, что когда я дважды транскрибировал один и тот же аудио файл в Whisper Large V2, то во втором случае его обработка прошла на порядок быстрее., т.е. нейросеть запомнила в кэше аудио файл и его перевод в текст, а при повторном обращении быстренько выдала все "на гора".
5. Рекомендую сначала извлечь из видео звуковую дорожку с помощью, например, программы "Аудиомастер", улучшить его качество звучания, а уже потом транскрибировать. Результат гораздо лучше.
Oct 15 2024 14:13
Ivan Bellew
Согласен с A SERGEY. Реально третья версия хуже второй по качеству транскрибации (не только в пунктуации). Нередко вообще опускает целые куски фраз, выдает какую-то белиберду без смысла.
Nov 15 2024 11:15
Сергей Т
Здравствуйте! Возможно ли транскрибировать видео с телеграм-каналов, если на нем стоит запрет на скачивание видеофайлов?
Feb 23 2025 19:33
⭐️ Василий Медведев
Сергей Т, конечно. Вы просто включаете видео на одном устройстве, а на втором записываете его и затем транскрибируете.
Feb 23 2025 19:41
Сергей Т
я пробовал открыть веб-приложение телеграм и скачать с помощью расширения- не получилось)
Feb 23 2025 19:44 (changed)