Редакција Вештачка интелигенција

0 коментари 4 мин. читање 30 јануари, 2025

Alibaba тврди дека новиот Qwen 2.5 Max модел го надминува DeepSeek

На првиот ден од прославата на Кинеската нова година технолошкиот гигант Alibaba ја лансираше Qwen 2.5-Max, нова верзија на моделот за вештачка интелигенција. Компанијата тврди дека моделот е подобар од DeepSeek-V3, кој прекуноќ стана AI „суперѕвезда“.

Објавата доаѓа во период во кој повеќето Кинези се на одмор. Ова само дополнително покажува дека растот на DeepSeek не е предизвик единствено за американските компании, туку и за кинеските. Веројатно поради притисокот Alibaba не можеше да чека да поминат празниците пред да го презентира својот модел. Можеби ова најдобро покажува колкава е конкуренцијата во секторот, кога една од најголемите кинески компании не може да земе еден ден одмор за празниците.

Според објавата на Alibaba Cloud на WeChat, Qwen 2.5-Max е подобар од GPT-4o, DeepSeek-V3 и Llama-3.1-405B на Meta. Компанијата вели дека нивниот модел ги надминува конкурентите „речиси на сите полиња“.

„Qwen 2.5-Max има подобри перформанси…од GPT-4o, DeepSeek-V3 и Llama-3.1-405B во речиси сите полиња“, пишува Alibaba од својот официјален WeChat профил.

Во моментов се чини дека американските компании се во шок. OpenAI го обвини DeepSeek дека ја злоупотребил нивната платформа за да го тренира својот модел. За разлика од ова кинеските конкуренти реагираа брзо. Два дена по лансирањето на DeepSeek-R1, ByteDance, објави надградба на својот AI модел. Сега и Alibaba го претстави својот модел.

Ова не е прв пат DeepSeek да ја „помести“ конкуренцијата. Со DeepSeek-V2, компанијата речиси го урна кинескиот пазар на вештачка интелигенција. Неговиот отворен код и екстремно ниската цена — само 1 јуан ($0.14) за 1 милион токени — ја принудија Alibaba Cloud да ги намали своите цени за 97%, пишува Reuters.

Eкспанзија на AI модели

Qwen 2.5-Max е Mixture-of-Experts (MoE) модел со повеќе од 20 трилиони токени во претходната обука. Ова го прави еден од најголемите модели за вештачка интелигенција досега. Alibaba дополнително го надгради моделот со Supervised Fine-Tuning (SFT) и Reinforcement Learning from Human Feedback (RLHF).

Компанијата тврди дека новиот модел има подобри резултати од конкуренцијата на следните клучни тестови:

Arena-Hard – симулација на човечки преференции
LiveBench – тест за општи интелигентни способности
LiveCodeBench – проценка на вештини за кодирање
GPQA-Diamond – напредни прашања за знаење

Во овие тестови, Qwen 2.5-Max ги надминал DeepSeek-V3, GPT-4o и Claude-3.5-Sonnet.

Qwen 2.5-Max e достапен преку Qwen Chat API и на Qwen Chat. Корисниците можат да експериментираат со моделот, да тестираат кодирање или да го користат за пребарување. API-то е компатибилно со OpenAI, што значи дека компаниите можат лесно да го интегрираат во своите постоечки апликации.

Напишано од

Дејан Соколоски

Дејан Соколоски е автор на IT.mk. Долгогодишен гејмер кого го интересираат обновливите извори на енергија, автоматизација, хардвер, фан е на стрипови, алтернативна уметност и Ливерпул.

Сите написи од овој автор

Добивај известувања

0 Коментари

Најнови

Најстари Со највеќе гласови

Изглед

Cookie	Duration	Description
itmkhascookiez-checkbox-analytics	11 months	Ова колаче е поставено од плагинот за контрола на прифаќање/одбивање на политиката за приватност. Колачето се користи за да се зачува изборот на корисникот за колачиња во категорија "Аналитика".
itmkhazcookies-checkbox-others	11 months	Ова колаче е поставено од плагинот за контрола на прифаќање/одбивање на политиката за приватност. Колачето се користи за да се зачува изборот на корисникот за колачиња во категорија "Други".
itmkhazcookiez-checkbox-functional	11 months	Ова колаче е поставено од плагинот за контрола на прифаќање/одбивање на политиката за приватност. Колачето се користи за да се зачува изборот на корисникот за колачиња во категорија "Функционални".
itmkhazcookiez-checkbox-necessary	11 months	Ова колаче е поставено од плагинот за контрола на прифаќање/одбивање на политиката за приватност. Колачето се користи за да се зачува изборот на корисникот за колачиња во категорија "Потребни".
itmkhazcookiez-checkbox-performance	11 months	Ова колаче е поставено од плагинот за контрола на прифаќање/одбивање на политиката за приватност. Колачето се користи за да се зачува изборот на корисникот за колачиња во категорија "Перформанси".
viewed_itmk_cookiez_policy	11 months	Ова колаче е поставено од плагинот за контрола на прифаќање/одбивање на политиката за приватност и не чува лични податоци.

Кошничка

Кошничката е празна

Alibaba тврди дека новиот Qwen 2.5 Max модел го надминува DeepSeek

Eкспанзија на AI модели

Дејан Соколоски

Eкспанзија на AI модели

Дејан Соколоски

Поврзани статии

w00t w00t