creator cover Pavel Zloi
Pavel Zloi

Pavel Zloi 

Директор ИИ-завода

19subscribers

10posts

About

20 лет в IT
 ∈ 10 лет в разработке
  ∈ 3 года в ML/AI
   ∈ 1 год - вайбмастер
Книга: Ричард Кох - Принцип 80/20
Решил попробовать записать экспромтом небольшой подкаст на одну любопытную книжу, которую прочёл недавно и поделиться своим мнениием.
Level required:
Observer
Чем программист с агентом отличается от программиста без него?
Вы оформили себе агента, он пишет за вас код, вы делаете в три раза больше и кому от этого хорошо? Фишка в том, что далеко не всегда вам.
Level required:
Observer

Презентация Coddy Agent

Небольшая презентация проекта Coddy Agent, коротенько рассказал как данный harness собрать, настроить и запустить. Запись одним дублем, экспромт.

Миф про Mythos?

Всё нижеизложенное суть исключительно моё личное мнение, которое сложилось из чтения новостей, технических отчётов и общения в чатиках. Я, к сожалению не работаю в Anthropic и посему не имею доступа к внутренней кухне, короче могу ошибаться, но если я прав, то получается занятная история.

Издалёкое начало

Начнём, как грица, с начала, 7 апреля 2026 года Anthropic анонсировала Project Glasswing и модель Claude Mythos Preview, которую компания описала как: by far the most powerful AI model we've ever developed (сильное заявление.jpg).
Со слов авторов Mythos способен находить zero-day уязвимости во всех ОС и браузерах, писать эксплойты, применять их, выходить из чрута и так далее. Полный отчёт прям красивенький, так как во время тестов было выявлено десятки тысяч багов, среди которых 27-летняя уязвимость в OpenBSD.
Но я калач тёртый, зацепился за название, странное оно какое-то, само по себе Mythos (читается как Мифос) это же Миф, то есть слово, которое буквально означает вымысел, легенду, сказку. Оно вызывало воспоминания о книгах про маркетинговый мифодизайн из чертогов моего разума, которые мне довелось прочесть два десятилетия назад.

Немного про мифодизайн

Есть отличная книга Александра Ульяновского "Мифдизайн: коммерческие и социальные мифы", где подробно разбирается, как реклама превращает обычный товар в смысловой "миф", который потребитель покупает охотнее. Классический пример - порошок "Миф", полагаю все кому немного за тридцать её видели по телеку и не раз, и помните Мойдодыра этого крипового.
Само слово эксплуатирует понятие легенды, чуда или сказки, перенося это ощущение на продукт. Реклама создаёт ритуал - не просто "стирает", а "легендарная морозная свежесть", магическое действие, борьба добра (чистоты) со злом (грязью).
Когда я увидел название Mythos, мысль пришла мгновенно - а что, если Anthropic сделала ровно то же самое? Взяли существующий продукт, обернули его в смысловой миф о "самой мощной модели", и теперь продают не технологию, а легенду?

Подготовка к AiConf 2026

Последнюю неделю в телеге от меня не очень много публикаций, дело в том, что я готовлюсь к мастер-классу, который проведу на конференции AiConf 2026, что будет 20го апреля на ВДНХ, там буду рассказывать о проекте SGR Agent Core одним из разработчиков которого я являюсь.
Планирую рассказать о проекте в целом, о том как развернуть Deep Research агента из примеров, а так же о создании файлового агента с нуля в интерактивном режиме.
Всем кому интересно заранее ознакомиться с программой и презентацией, то вот ссылочка на репозиторий.

Zloibit, pimp my LLM

Эксперименты с ruGPT3XL напомнили мне о "боли" которую я испытывал работая и обучая модельки семейства ruGPT в 23м и 24м годах.
У всех у них был общие проблемы, модели ruGPT3 и 3.5 имели смехотворное контекстное окно в 2048 токенов, такой размер совсем никуда не годился и приходилось изобретать костыли в виде sliding window у чатов, надо было фильтровать обучающие датасеты придумывая стратегии умной очистки и так далее.
И вот после, не побоюсь этого слова, успешной конвертации ruGPT3XL в формат современных чекпоинтов пришла в голову мысля, а что если попробовать прокачать, ну для начала скажем, крошку ruGPT-3 XL 1.3B.
Про методолгию и результаты расскажу в отдельной публикации на Хабр, а всем кому интересно попробовать ruGPT3XL с увеличинным до 8k токенов контекстовм вот ссылочка: https://huggingface.co/evilfreelancer/ruGPT3XL-8k

Реставрация ruGPT3XL 1.3B

Пару дней занимаюсь попытками заставить работать модельку ai-forever/rugpt3xl, это такая классическая моделька от SberDevices на 1.3B параметров (крошка по современным меркам), на которой сберовцы обкатывали свои научные наработки.
Подробнее в научной статье "A family of pretrained transformer language models for Russian" на Google Scholar.
Да, она хоть и foundation (то есть умеет только текст продолжать, но не может выполнять инструкции или работать в режиме чата), но обучена она на корпусе русского языка и этот самый русский язык генерит очень бодро. Одной из примечательных её особенностей является тот факт, что её обучали с нуля, вторая важная особенность в том, что это архитектура представляет из себя глубокую модификацию GPT-2.
Давно я мечтал её отреставрировать, до этого трижды пытался, но все предыдущие разы нехватало знаний и опыта работы с моделями, но вот вчера собрал волю в кулак, поднял старые заметки, склонировал всё, что может понадобиться для работы и написал подробные спецификации для кодового агента.
Задача агента была в том, чтобы изучить исходники

Пару слов о Бусти

Всем привет!
Решил завести страничку на Бусти, подумал чем Гейтс не шутит, для меня возможность получать копеечку будет лишним стимулом уделять больше внимание творчеству. К тому же железки стоят денег, софт стоит денег, всё чего-то да стоит.
В общем посмотрим к чему создание данной страницы приведёт :)
Subscription levels3

Observer

$1.42 per month
Для тех кому интересно просто наблюдать за проектами.

Explorer

$2.84 per month
Глубже погружается в контент и возможности.

Architect

$7.1 per month
Для тех, кто хочет оказать заметное влияние.
Go up