國(guó)產(chǎn)人工智能(AI)大模型DeepSeek近日震驚環(huán)球市場(chǎng),阿里巴巴(9988)旗下阿里雲(yún)於新春期間發(fā)布全新通義千問(wèn)Qwen 2.5-Max超大規(guī)模MoE(Mixture of Experts, 混合專(zhuān)家)模型,聲稱(chēng)其表現(xiàn)超越DeepSeek V3。
阿里雲(yún)稱(chēng),通義千問(wèn) Qwen 2.5-Max採(cǎi)用逾20萬(wàn)億token的預(yù)訓(xùn)練數(shù)據(jù),並搭配定制化後訓(xùn)練方案。在Arena-Hard、LiveBench、LiveCodeBench及GPQA-Diamond等國(guó)際通用基準(zhǔn)測(cè)試中,Qwen2.5-Ma的表現(xiàn)均超越DeepSeek V3,同時(shí)在MMLU-Pro等專(zhuān)業(yè)領(lǐng)域評(píng)估體系中展現(xiàn)出極具競(jìng)爭(zhēng)力的成績(jī)。
阿里雲(yún)稱(chēng),相信Qwen2.5-Max隨著訓(xùn)練技術(shù)不斷進(jìn)步,下一個(gè)版本將達(dá)到更高水平。用戶(hù)可以在 Qwen Chat中直接調(diào)用Qwen2.5-Max,或者使用 artifacts、搜索等功能。Qwen2.5-Max 的 API(模型名稱(chēng):qwen-max-2025-01-25)已開(kāi)放使用。用戶(hù)可先註冊(cè)阿里雲(yún)賬號(hào)並開(kāi)通阿里雲(yún)大模型服務(wù)平臺(tái),即可於控制臺(tái)創(chuàng)建API密鑰。由於其接口採(cǎi)用OpenAI兼容協(xié)議,用戶(hù)可以直接沿用OpenAI API的常規(guī)方式進(jìn)行調(diào)用。
港股美國(guó)預(yù)託證券(ADR)方面,阿里巴巴ADR在美東時(shí)間1月28日收市比本港同日收市價(jià)升5.89%,港元計(jì)折合收?qǐng)?bào)93.5元。(記者 黃兆琦 / 阿里雲(yún)圖片)