Мои новости Alibaba выпускает модель искусственного интеллекта, которая, по ее словам, превосходит DeepSeek
ПЕКИН, 29 января (Рейтер) - Китайская технологическая компания Alibaba в среду компания выпустила новую версию своей модели искусственного интеллекта Qwen 2.5, которая, по ее словам, превзошла высоко оцененную модель DeepSeek-V3.
Необычное время выпуска Qwen 2.5-Max — в первый день Лунного Нового года, когда большинство китайцев отдыхают на работе и проводят время со своими семьями, — указывает на то, какое давление стремительный взлет китайского стартапа DeepSeek в области искусственного интеллекта за последние три недели оказал не только на зарубежных, но и на внутренних конкурентов.
«Qwen 2.5-Max превосходит... почти по всем показателям GPT-4o, DeepSeek-V3 и Llama-3.1-405B», — говорится в объявлении облачного подразделения Alibaba, опубликованном в официальном аккаунте WeChat, со ссылкой на самые передовые модели искусственного интеллекта с открытым исходным кодом OpenAI и Meta.Выпуск 10 января искусственного интеллекта DeepSeek на базе модели DeepSeek-V3, а также выпуск 20 января его модели R1 потрясли Кремниевую долину и привели к падению акций технологических компаний, поскольку якобы низкие затраты китайского стартапа на разработку и эксплуатацию побудили инвесторов усомниться в крупных планах расходов ведущих компаний в области искусственного интеллекта в США.
Однако успех DeepSeek также привел к тому, что ее внутренние конкуренты начали активно совершенствовать свои собственные модели искусственного интеллекта.Через два дня после выпуска DeepSeek-R1 владелец TikTok ByteDance выпустил обновление своей флагманской модели ИИ, которая, по его словам, превзошла поддерживаемую Microsoft модель OpenAI o1 в AIME — эталонном тесте, который измеряет, насколько хорошо модели ИИ понимают и реагируют на сложные инструкции.
Это перекликается с заявлением DeepSeek о том, что ее модель R1 конкурирует с o1 от OpenAI по нескольким показателям производительности.
DEEPSEEK ПРОТИВ ОТЕЧЕСТВЕННЫХ КОНКУРЕНТОВ
Предшественник модели DeepSeek V3, DeepSeek-V2, спровоцировал ценовую войну моделей ИИ в Китае после своего выпуска в мае прошлого года.
Тот факт, что DeepSeek-V2 имел открытый исходный код и был беспрецедентно дешевым — всего 1 юань (0,14 долл. США) за 1 миллион токенов (или единиц данных, обрабатываемых моделью ИИ), — привел к тому, что облачное подразделение Alibaba объявило о снижении цен до 97% на ряд моделей.
Другие китайские технологические компании последовали примеру, включая Baidu, выпустившая первый в Китае аналог ChatGPT в марте 2023 года, и самая дорогая интернет-компания страны Tencent.
Лян Вэньфэн, загадочный основатель DeepSeek, заявил в редком интервью китайскому СМИ Waves в июле, что стартап «не заботят» ценовые войны и что его главной целью является достижение AGI (искусственного интеллекта общего назначения).
OpenAI определяет AGI как автономные системы, превосходящие людей в большинстве экономически значимых задач.
В то время как в крупных китайских технологических компаниях, таких как Alibaba, работают сотни тысяч сотрудников, DeepSeek работает как исследовательская лаборатория, в которой работают в основном молодые выпускники и докторанты ведущих китайских университетов.
В своем июльском интервью Лян заявил, что, по его мнению, крупнейшие технологические компании Китая могут не соответствовать будущему индустрии искусственного интеллекта, сравнив их высокие издержки и вертикальную структуру с бережливым ведением дел и свободным стилем управления DeepSeek.
«Крупные фундаментальные модели требуют постоянных инноваций, возможности технологических гигантов имеют свои пределы», — сказал он.