Новая система расхода токенов

🔔А вот и обновление!

Мы его уже установили и сейчас расскажем вам, что же поменялось.

❓Как теперь происходит расход токенов?

❗️Теперь у каждой модели есть два собственных мультипликатора - для запроса и для ответа. Мультипликатор для запроса всегда меньше, чем для ответа

❓Что это нам дает?

❗️С этим нововведением расход токенов сильно уменьшится, т.к запрос - это ваше текущее сообщение + весь сохраненный контекст. Вот простой пример:

Раньше у моделей был фиксированный мультипликатор, например - х2.

💬Когда вы отправляете боту сообщение с длиной в 100 токенов и, по мимо этого, бот помнит контекст вашего диалога в размере 1000 токенов, а так же отвечает вам сообщением, длиною в 50 токенов, то на выходе вы расходуете

(100 + 1000 + 50) * 2 токенов, то есть 2300 токенов! 💩

То же самое, но с новой системой и мультипликаторами x1.3 для запроса и x2 для ответа

(100 + 1000) * 1.3 + 50 * 2 = 1 530 токенов!💥🤯🤯🤯💥

Как было раньше:

Как стало теперь:

GPT Assistant Chat Bot

Новая система расхода токенов

Поддержать

Безлимит