На првиот ден од прославата на Кинеската нова година технолошкиот гигант Alibaba ја лансираше Qwen 2.5-Max, нова верзија на моделот за вештачка интелигенција. Компанијата тврди дека моделот е подобар од DeepSeek-V3, кој прекуноќ стана AI „суперѕвезда“.
Објавата доаѓа во период во кој повеќето Кинези се на одмор. Ова само дополнително покажува дека растот на DeepSeek не е предизвик единствено за американските компании, туку и за кинеските. Веројатно поради притисокот Alibaba не можеше да чека да поминат празниците пред да го презентира својот модел. Можеби ова најдобро покажува колкава е конкуренцијата во секторот, кога една од најголемите кинески компании не може да земе еден ден одмор за празниците.
Според објавата на Alibaba Cloud на WeChat, Qwen 2.5-Max е подобар од GPT-4o, DeepSeek-V3 и Llama-3.1-405B на Meta. Компанијата вели дека нивниот модел ги надминува конкурентите „речиси на сите полиња“.
„Qwen 2.5-Max има подобри перформанси…од GPT-4o, DeepSeek-V3 и Llama-3.1-405B во речиси сите полиња“, пишува Alibaba од својот официјален WeChat профил.

Во моментов се чини дека американските компании се во шок. OpenAI го обвини DeepSeek дека ја злоупотребил нивната платформа за да го тренира својот модел. За разлика од ова кинеските конкуренти реагираа брзо. Два дена по лансирањето на DeepSeek-R1, ByteDance, објави надградба на својот AI модел. Сега и Alibaba го претстави својот модел.
Ова не е прв пат DeepSeek да ја „помести“ конкуренцијата. Со DeepSeek-V2, компанијата речиси го урна кинескиот пазар на вештачка интелигенција. Неговиот отворен код и екстремно ниската цена — само 1 јуан ($0.14) за 1 милион токени — ја принудија Alibaba Cloud да ги намали своите цени за 97%, пишува Reuters.
Eкспанзија на AI модели
Qwen 2.5-Max е Mixture-of-Experts (MoE) модел со повеќе од 20 трилиони токени во претходната обука. Ова го прави еден од најголемите модели за вештачка интелигенција досега. Alibaba дополнително го надгради моделот со Supervised Fine-Tuning (SFT) и Reinforcement Learning from Human Feedback (RLHF).
Компанијата тврди дека новиот модел има подобри резултати од конкуренцијата на следните клучни тестови:
- Arena-Hard – симулација на човечки преференции
- LiveBench – тест за општи интелигентни способности
- LiveCodeBench – проценка на вештини за кодирање
- GPQA-Diamond – напредни прашања за знаење
Во овие тестови, Qwen 2.5-Max ги надминал DeepSeek-V3, GPT-4o и Claude-3.5-Sonnet.

Qwen 2.5-Max e достапен преку Qwen Chat API и на Qwen Chat. Корисниците можат да експериментираат со моделот, да тестираат кодирање или да го користат за пребарување. API-то е компатибилно со OpenAI, што значи дека компаниите можат лесно да го интегрираат во своите постоечки апликации.







