Eleven 3 вышла из альфа-тестирования
Теперь озвучка будет на совершенно новом уровне. На сайте пока модель не обновлена, но как будет - сразу запишу результаты и покажу.
От разработчиков:
Eleven v3, наша самая продвинутая модель преобразования текста в речь, вышла из стадии альфа-тестирования и стала общедоступной.
После выхода альфа-версии мы продолжили совершенствовать модель. Два ключевых улучшения:
- Более стабильная работа. В ходе тестирования пользователи в 72 % случаев отдавали предпочтение новой версии по сравнению с предыдущей альфа-версией.
- Более точная работа. Мы значительно улучшили обработку моделью чисел, символов и специальных обозначений на разных языках.
Повышение точности
Модели преобразования текста в речь должны интерпретировать то, что вы пишете, и решать, как это произнести. Одни и те же символы могут означать разные вещи в разных контекстах.
Рассмотрим телефонный номер: «+49 170 9876543»
В некоторых случаях наши модели считывают это как «плюс сорок девять, сто семьдесят, девять миллионов восемьсот семьдесят шесть тысяч пятьсот сорок три», интерпретируя цифры как большие числа, а не как последовательность цифр. Правильное прочтение: «плюс четыре девять, один семь ноль, девять восемь семь шесть пять четыре три».
Подобные ошибки возникали в разных категориях: спортивные результаты, химические формулы, валюты, координаты — везде, где моделям приходилось интерпретировать символы и решать, как их озвучить.
Мы провели тестирование на основе внутреннего бенчмарка, охватывающего 27 категорий на 8 языках.
В целом: количество ошибок сократилось на 68 %. Частота ошибок снизилась с 15,3 % до 4,9 %.
BadWolf
С нетерпением жду примеров :-)
Feb 03 21:21