Во последниве неколку месеци светот на вештачката интелигенција е исклучително динамичен. Моделите кои се на врвот постојано се менуваат, од o1 на OpenAI, па DeepSeek R1, па Qwen 2.5. Најнов модел за кој се тврди дека е на врвот според перформансите, но и цената, е Hunyuan T1 од Tencent.
Кинескиот технолошки гигант Tencent Holdings неодамна го претстави својот нов модел за вештачка интелигенција, Hunyuan T1. Според компанијата новиот модел директно се натпреварува со моделот DeepSeek R1 во однос на перформансите и цените. Ова претставува значаен развој во конкурентската борба на кинескиот, но и глобалниот пазар за вештачка интелигенција.
🚀 Introducing Hunyuan-T1! 🌟
— Hunyuan (@TXhunyuan) March 21, 2025
Meet Hunyuan-T1, the latest breakthrough in AI reasoning! Powered by Hunyuan TurboS, it's built for speed, accuracy, and efficiency. 🔥
✅ Hybrid-Mamba-Transformer MoE Architecture – The first of its kind for ultra-large-scale reasoning
✅ Strong… pic.twitter.com/83mRrcgvN6
Hunyuan T1 е изграден на иновативна архитектура која претставува спој на Hybrid-Mamba-Transformer модел со Mixture of Experts (MoE) рамка . Овој хибриден пристап ги комбинира предностите на различни архитектури. За разлика од „Transformer“ архитектурата, овој комбиниран модел значително ги намалува трошоците за обука и носење заклучоци, пишува South China Morning Post. Ова е направено со цел да се постигне оптимална рамнотежа помеѓу брзината и точноста, особено за сложени задачи за расудување . Моделот има капацитет да активира 52 милијарди параметри.
Hunyuan T1 за тренирање на моделот користи техника на „large-scale reinforcement learning“. Истата техника е употребена во моделот DeepSeek R1. Во бенчмарк тестовите, T1 постигна резултат од 87,2 поени на MMLU Pro. Ова е подобар резултат од 84-те поени на DeepSeek-R1, но сепак заостанува зад 89,3-те поени на OpenAI o1. Покрај тоа, T1 покажа солидни резултати и во други тестови како AIME 2024 и C-Eval.
Во однос на цените, T1 нуди 1 јуан (0,14 американски долари) за милион токени на влез и 4 јуани за излез, што е директна конкуренција на ниските цени на DeepSeek. Компанијата тврди дека е прва во индустријата што користи хибридна архитектура, комбинација од Google Transformer и Mamba, која значително ги намалува трошоците за тренирање и заклучување.
Независни блогери како NCJRYDS и GoPlayAI исто така ги тестирале моделите T1 и R1. Нивните тестови покажале дека T1 има предност во некои области, како што е толкување на кинески зборови, но заостанува во други, како што е компонирање на античка кинеска поезија.
Пони Ма Хуатенг кој е извршен директор на Tencent, изјави дека е воодушевен од DeepSeek за нивниот отворен и бесплатен производ, но Tencent има стратегија за „двојно јадро“, користејќи ги и DeepSeek и нивните Yuanbao модели.
Исто така, ByteDance, сопствениците на TikTok, претставија нов алгоритам за reinforcement learning, DAPO, кој тврдат дека е подобар од оној на DeepSeek. DAPO постигна 50 поени на AIME 2024, додека DeepSeek постигна 47 поени, и тоа со 50% помалку чекори за тренирање.
Овие случувања укажуваат на интензивна конкуренција во кинескиот сектор за вештачка интелигенција, каде што Tencent и ByteDance се обидуваат да се етаблираат како лидери покрај DeepSeek. Оваа конкуренција веројатно ќе продолжи да го движи развојот на вештачката интелигенција и да доведе до иновации во индустријата.
Споредба на тестови
| Бенчмарк тест | Резултат на Hunyuan T1 | Резултат на DeepSeek R1 | Резултат на OpenAI o1 | Забелешки |
| MMLU Pro | 87,2 | 84,0 | 89,3 | За Hunyuan T1 понекогаш се известува дека ги надминува GPT-4.5 |
| AIME (2024) | 78,2 | 79,8 | 79,2 | |
| MATH-500 | 922/96,2 | 97,3 | 94,8 | Резултатите малку се разликуваат во извештаите |
| C-Eval | 91,2/91,8 | 91,8 | 82,2/87,8 | Резултатите малку се разликуваат во извештаите |
| LiveCodeBench | 64,9 | 65,8 | 46,0 | |
| C-SimpleQA | 87,0 | 87,4 | 87,2 |
Споредба на цени
| Модел | Цена на влезни токени (за 1 милион токени) | Цена на излезни токени (за 1 милион токени) |
| Hunyuan T1 | ~$0.14 (USD) | ~$0.28 (USD) |
| DeepSeek R1 | $0.14 / $0.55 | $2.19 |
| OpenAI o1 | $15.00 | $60.00 |







