Битка на модели: Hunyuan T1, DeepSeek и OpenAI

во Вести

Во последниве неколку месеци светот на вештачката интелигенција е исклучително динамичен. Моделите кои се на врвот постојано се менуваат, од o1 на OpenAI, па DeepSeek R1, па Qwen 2.5. Најнов модел за кој се тврди дека е на врвот според перформансите, но и цената, е Hunyuan T1 од Tencent.

Кинескиот технолошки гигант Tencent Holdings неодамна го претстави својот нов модел за вештачка интелигенција, Hunyuan T1. Според компанијата новиот модел директно се натпреварува со моделот DeepSeek R1 во однос на перформансите и цените. Ова претставува значаен развој во конкурентската борба на кинескиот, но и глобалниот пазар за вештачка интелигенција.

Hunyuan T1 е изграден на иновативна архитектура која претставува спој на Hybrid-Mamba-Transformer модел со Mixture of Experts (MoE) рамка . Овој хибриден пристап ги комбинира предностите на различни архитектури. За разлика од „Transformer“ архитектурата, овој комбиниран модел значително ги намалува трошоците за обука и носење заклучоци, пишува South China Morning Post.  Ова е направено со цел да се постигне оптимална рамнотежа помеѓу брзината и точноста, особено за сложени задачи за расудување . Моделот има капацитет да активира 52 милијарди параметри.  

Hunyuan T1 за тренирање на моделот користи техника на „large-scale reinforcement learning“. Истата техника е употребена во моделот DeepSeek R1. Во бенчмарк тестовите, T1 постигна резултат од 87,2 поени на MMLU Pro. Ова е подобар резултат од 84-те поени на DeepSeek-R1, но сепак заостанува зад 89,3-те поени на OpenAI o1. Покрај тоа, T1 покажа солидни резултати и во други тестови како AIME 2024 и C-Eval.

Во однос на цените, T1 нуди 1 јуан (0,14 американски долари) за милион токени на влез и 4 јуани за излез, што е директна конкуренција на ниските цени на DeepSeek. Компанијата тврди дека е прва во индустријата што користи хибридна архитектура, комбинација од Google Transformer и Mamba, која значително ги намалува трошоците за тренирање и заклучување.

Независни блогери како NCJRYDS и GoPlayAI исто така ги тестирале моделите T1 и R1. Нивните тестови покажале дека T1 има предност во некои области, како што е толкување на кинески зборови, но заостанува во други, како што е компонирање на античка кинеска поезија.

Пони Ма Хуатенг кој е извршен директор на Tencent, изјави дека е воодушевен од DeepSeek за нивниот отворен и бесплатен производ, но Tencent има стратегија за „двојно јадро“, користејќи ги и DeepSeek и нивните Yuanbao модели.

Исто така, ByteDance, сопствениците на TikTok, претставија нов алгоритам за reinforcement learning, DAPO, кој тврдат дека е подобар од оној на DeepSeek. DAPO постигна 50 поени на AIME 2024, додека DeepSeek постигна 47 поени, и тоа со 50% помалку чекори за тренирање.

Овие случувања укажуваат на интензивна конкуренција во кинескиот сектор за вештачка интелигенција, каде што Tencent и ByteDance се обидуваат да се етаблираат како лидери покрај DeepSeek. Оваа конкуренција веројатно ќе продолжи да го движи развојот на вештачката интелигенција и да доведе до иновации во индустријата.

Споредба на тестови

Бенчмарк тестРезултат на Hunyuan T1Резултат на DeepSeek R1Резултат на OpenAI o1Забелешки
MMLU Pro87,284,089,3За Hunyuan T1 понекогаш се известува дека ги надминува GPT-4.5
AIME (2024)78,279,879,2
MATH-500922/96,297,394,8Резултатите малку се разликуваат во извештаите
C-Eval91,2/91,891,882,2/87,8Резултатите малку се разликуваат во извештаите
LiveCodeBench64,965,846,0
C-SimpleQA87,087,487,2

Споредба на цени

МоделЦена на влезни токени (за 1 милион токени)Цена на излезни токени (за 1 милион токени)
Hunyuan T1~$0.14 (USD)~$0.28 (USD)
DeepSeek R1$0.14 / $0.55$2.19
OpenAI o1$15.00$60.00

Стани премиум член и доби пристап до сите содржини, специјален попуст на над 2.200 производи во ИТ маркет, верификуван профил и можност за огласување на ИТ Огласник. Плус ќе го поддржиш медиумот кој го градиме цели 16 години!

basic

членство

42 ден./мес

зачлени се

1337

членство

125 ден./мес

зачлени се
* плаќањето е на годишно ниво

Доколку веќе имаш премиум членство, најави се тука.

Добивај известувања
Извести ме за
guest
0 Коментари
Најнови
Најстари Со највеќе гласови
Inline Feedbacks
View all comments
види ги сите огласи на kariera.it.mk