Путешествие в Эсперантиду

Путешествие в Эсперантиду 

Изучаем эсперанто через тексты и музыку

0subscribers

15posts

goals1
$0 of $142 raised
На более продвинутые нейросети, для создания выпусков лучшего качества.

Музыка и алгоритмы. Превращаем любимый плейлист в базу знаний для бота

Как автор этого дневника, я быстро осознал свою главную ошибку: собираясь выкладывать собственные наработки в виде текстов песен.
Для тех кто здесь впервые и не в курсе. Ранее я анонсировал идею разбирать переведенные на эсперанто тексты русских песен при помощи ИИ. Но я не учел ключевой момент — уровень владения языком у всех разный. Новичкам с небольшим словарным запасом будет мучительно сложно распознавать текст. Тем же, у кого в активе больше 700 слов (как сейчас у меня), этот формат покажется откровенно скучным. Добавьте к этому абсолютно разные музыкальные вкусы и отвлекающий элемент моей игры "угадай мелодию" — становится понятно, что универсального рецепта просто не существует.
Технический тупик обычного чата
Когда я попытался автоматизировать этот процесс через обычный чат с нейросетью, я столкнулся с серьезной проблемой — ограничением контекстного окна. Если постоянно загружать в бота новые песни и новые слова, его "краткосрочная память" моментально переполняется. Начинается хаос: нейросеть путает лексику, забывает правила и начинает откровенно сходить с ума. Обычный чат для такой объемной задачи не годится.
Мое решение: персональный Gem-бот
Чтобы обойти лимиты памяти и адаптировать обучение строго под себя, я решил создать собственного Gem-бота. Алгоритм оказался следующим:
Вначале я создал тренировочный чат, куда загрузил свой плейлист и личный словарь. Несколько вечеров я буквально натаскивал нейросеть, как тренера: исправлял недочеты и корректировал поведение. Идеальный баланс, к которому я стремился — чтобы бот выдавал мне песни, в которых содержится строго 15-20% неизвестных мне слов.
Генерация инструкции
Когда бот наконец-то начал выдавать сносный результат, я сделал, как мне кажется, самую правильную вещь: попросил эту же нейросеть написать идеальную инструкцию для будущего бота на основе нашего диалога. Внимательно изучив полученный промпт и внеся пару правок, я без сожалений удалил наш тренировочный чат.
В нового, чистового бота я загрузил всего один файл в качестве базы знаний со списком моих любимых песен и мой личный словарь. Финальным штрихом стало строгое правило: бот должен своевременно учитывать прогресс и не повторять те песни, которые мы уже прошли.
  • Универсальность не работает: В изучении языка эффективен только тот инструмент, который опирается строго на ваш личный словарный запас и ваши вкусы.
  • Обход контекстного окна: Обычные чаты ломаются от объемов данных. Используйте кастомных ботов с загруженной базой знаний (файлами).
  • Автоматизация рутины: Заставляйте нейросеть саму писать для себя рабочие инструкции на основе удачно выстроенных диалогов.
Вот и всё на сегодня. Есть много ещё чего рассказать, однако не буду больше, тебя утомлять дорогой читатель. Встретимся в следующих выпусках. Дальше будет только интереснее.
PS. Внизу под данной статьёй я оставил небольшой, но крайне полезный комментарий. Загляни, раз уж зашёл:)
Делюсь своим гем-ботом
Он заточен под меня и может не подойти другим из-за разницы в словарном запасе. Скопируйте инструкцию и адаптируйте её под себя: создайте файл со своим списком песен и словарём.
Я учу слова через Anki: в настройках есть выгрузка текущей колоды. Получите свой словарь и добавьте его в бота.
Инструкцию получите от самого бота командой MANUAL (верхний регистр). Бот выдаст описание и формат файла базы данных. Отредактируйте файл под свои музыкальные предпочтения и словарь. При необходимости измените и саму инструкцию.
Если возникнут сложности, обращайтесь.
Go up