Могут ли LLM-агенты помочь в моддинге? | Часть 2

В позапрошлом посте я разбирал несколько ИИ-моделей в качестве ассистентов в чате, где ты пишешь им задачу, а они тебе там же и отвечают. После этого поста я задумался, а насколько лучше использовать для этих задач готовые CLI-приложения или плагины для IDE (поскольку до этого я только пробовал разве что GitHub Copilot пару лет назад, который на то время не мог сделать даже простых вещей)

И знаете, это полностью перевернуло ситуацию. Я разберу 3 важных блока, которые полностью перевернули моё представление о ИИ-агентах.

Консоль

Первое, и пожалуй самое важное - это доступ модели к консоли. Грубо говоря, когда вы пишете запрос к модели, она может ответить специальным сообщением, которое даст CLI/плагину понять, что модель хочет выполнить консольную команду. Это может быть стандартные ls, pwd, grep, gradlew и т.п. То есть агент сам может найти нужные ему классы, прочитать их не полностью, а лишь взять фрагмент около ключевых слов, или до определённой строки. Произвести компиляцию, увидеть ошибки и исправить их. То есть не нужно собирать большую часть файлов проекта и скидывать их в чат, как это обычно делал я :D
Но это лишь начало, будь на этом всё, толку от этого было бы не много

Контекст

В отличии от стандартных моделей в чате, агенты умеют сжимать свой контекст, когда он заканчивается, условно изучив большую часть работ - он структурирует самое важное и выкидывает не нужную ему информацию. То есть не получится такого, что "У вас закончился лимит в этом чате, создайте новый" или модель, забывшая то, о чём вы говорили в начале диалога. Да, эта система не идеальна, но как и люди, порой скажешь один раз, человек забыл, скажешь второй раз - он тебя прослушал. Третий раз дашь пинка - так всё запомнил, с нейронками также)

Инструменты

Ещё один важный момент - инструменты. В то время, как разработчики имеют IDE, которые могут сильно упрощать жизнь людям, давая всякие подсказки, для нейронок тоже есть похожие штуки, например Qdrant база данных. Работает это так: агент (буквально) задаёт вопрос к базе данных "Какой код в проекте написан хуже всего" и модель ему выдаёт конкретные ссылки на фрагменты кода из файлов. Именно по описанию функционала, а не ключевым словам, в общем жесть какая-то...

Сильно ли это меняет дело?

Пожалуй да, это переворачивает всё с ног на голову, подобные цикличные проверки задач, оркестрация нескольких моделей в кластер или даже возможность агенту самому запустить приложение, сделать скриншот и разобраться, выполнил ли он задачу... Это пожалуй поднимает качество с джуна до мидла, а то и сеньора.

Но не всё так гладко и классно, как может показаться на первый взгляд. Написать движок моего уровня подобным агентам по силам, но есть нюанс - цена. Моделей, которые действительно могут решать сложные задачи не так много: Gemini 3 Pro, ChatGPT 5.3, Claude Opus 4.5. Всякие DeepSeek, Kimi, Kwen всё ещё не дотягивают до их уровня и некоторые задачи выполнить не в силах или же организовать свою работу. А сильные модели за выполненную работу съедят денег столько же, сколько хороший разработчик на фриланс бирже и имеют жёсткие дневные ограничения, куда большие, чем просто запросы в чате. В особенности, потому что их монетизировать сложно, если ваши данные хотя бы продать можно или уговорить купить ненужную вещь, когда вы заикнётесь, что думаете взять себе условные новые наушники, то ваш говнокод написанный 5 нейронками никому не сдался :)

В общем, запасается 60 аккаунтами гитхаба и абузим пробные периоды каждый месяц))

Дмитрий Устинов

А для оркестрации требуется запускать их локально? Тогда компик нужен ого-го каких характеристик. Суммарно расходы кратно превзойдут доходы и вся эта история с агентами войдёт в копеечку.
Понятно, что такое могут себе позволить крупные компании, а что до средних кодеров — по твоим же заветам, «ручками».

Feb 20 15:19 (changed)

Hollow Horizon

Дмитрий Устинов, не обязательно, можно или взять нужные модели с того же OpenRouter или других сервисов или просто стащить у соседа датацентр и развернуть там сотню таких агентов))
Но понятное дело, если один хороший агент Claude стоит ~$20 в месяц (и то не круглосуточно), то сотня таких будет стоить дороже нормальных разработчиков на фрилансе и позволить себе такое могут разве что создатели сервисов вроде Cursor, Windsurf, Antigravity и т.п.))

Feb 20 17:39

Hollow Horizon

Могут ли LLM-агенты помочь в моддинге? | Часть 2

Консоль

Контекст

Инструменты

Сильно ли это меняет дело?

Передовой Хеллоу-Вордер

Продвинутый Скриптописец

Магистр Kotlin

Верховный Спонсор