當(dāng)全球AI領(lǐng)域正陷入“堆參數(shù)、拼規(guī)模”的激烈競爭時(shí),微博AI卻以一種截然不同的姿態(tài)闖入大眾視野——其自主研發(fā)的開源大模型VibeThinker,憑借僅15億的參數(shù)量,在國際頂級數(shù)學(xué)競賽基準(zhǔn)測試中力壓參數(shù)量超其數(shù)百倍的DeepSeek R1(6710億參數(shù)),以顛覆性的表現(xiàn)引發(fā)行業(yè)震動(dòng)。更令人驚訝的是,這一成果的達(dá)成僅需7800美元的后訓(xùn)練成本,相比同類模型動(dòng)輒數(shù)十萬美元的投入,成本效率提升了數(shù)十倍,為AI產(chǎn)業(yè)從“規(guī)模至上”轉(zhuǎn)向“效率優(yōu)先”提供了全新范式。
長期以來,AI行業(yè)普遍認(rèn)為,模型的復(fù)雜推理能力必須依賴千億級參數(shù)支撐,小模型因算力限制難以突破高難度任務(wù)。然而,微博AI團(tuán)隊(duì)通過優(yōu)化模型架構(gòu)與訓(xùn)練范式,創(chuàng)新提出“頻譜到信號(hào)原理”(SSP)方法,成功挖掘出小模型的隱藏潛力。在AIME24、AIME25及HMMT25等高難度數(shù)學(xué)測試中,VibeThinker的表現(xiàn)不僅超越了參數(shù)量超400倍的DeepSeek-R1-0120版本,還與4560億參數(shù)的MiniMax-M1效果相當(dāng),甚至可媲美Gemini 2.5 flash和Claude Opus 4等頭部模型。在編程算法測試集LiveCodeBench v6中,其成績也追平了歐洲領(lǐng)先AI企業(yè)Minstral.AI的Magistral-Medium-2506版本,徹底打破了“參數(shù)決定能力”的行業(yè)認(rèn)知。
成本優(yōu)勢是VibeThinker的另一大亮點(diǎn)。據(jù)公開數(shù)據(jù),2025年主流大模型單次后訓(xùn)練成本普遍在數(shù)十萬美元級別。例如,MiniMax的M1模型使用512塊H800 GPU訓(xùn)練三周,租賃成本約53.5萬美元;DeepSeek的R1模型訓(xùn)練成本為29.4萬美元(不含基礎(chǔ)模型開發(fā)費(fèi)用)。相比之下,VibeThinker的后訓(xùn)練過程(包括監(jiān)督微調(diào)與強(qiáng)化學(xué)習(xí)階段)僅消耗3900個(gè)GPU小時(shí),按市場租賃價(jià)格計(jì)算,總成本僅7800美元。這意味著,其用不到8000美元的成本實(shí)現(xiàn)了需30萬至50萬美元才能達(dá)到的性能,成本效益比高達(dá)30至60倍。這一突破使得高階AI推理能力不再局限于科技巨頭,中小型機(jī)構(gòu)也能以極低門檻參與前沿創(chuàng)新,推動(dòng)行業(yè)向更開放、多元的方向發(fā)展。
盡管VibeThinker目前仍處于實(shí)驗(yàn)性版本階段,其研發(fā)重點(diǎn)聚焦于強(qiáng)化小模型在數(shù)學(xué)與編程領(lǐng)域的能力,尚未針對日常聊天等場景進(jìn)行優(yōu)化,但其技術(shù)價(jià)值已引發(fā)全球關(guān)注。HuggingFace官方甚至主動(dòng)發(fā)文宣傳其論文,凸顯行業(yè)對其創(chuàng)新性的認(rèn)可。更值得關(guān)注的是,這一成果為AI產(chǎn)業(yè)提供了新的技術(shù)路徑:通過算法優(yōu)化而非單純擴(kuò)大規(guī)模,同樣能實(shí)現(xiàn)性能躍升,這或?qū)⒅厮苄袠I(yè)的技術(shù)評價(jià)標(biāo)準(zhǔn)與資本布局邏輯。
技術(shù)突破的最終目標(biāo)在于落地應(yīng)用。微博早已在AI領(lǐng)域布局多年,其自研的“知微”大語言模型已通過備案,并衍生出微博智搜、內(nèi)容總結(jié)、AI互動(dòng)號(hào)等功能。其中,微博智搜通過分析平臺(tái)海量內(nèi)容構(gòu)建可信知識(shí)圖譜,實(shí)現(xiàn)精準(zhǔn)需求捕捉與情感理解,月活躍用戶突破5000萬;評論羅伯特作為AI互動(dòng)賬號(hào),以獨(dú)特的毒舌風(fēng)格與溫情進(jìn)化路線吸引近200萬粉絲,成為用戶熱議的“社交伙伴”。隨著VibeThinker的加入,微博計(jì)劃將其與心理等垂直領(lǐng)域的數(shù)據(jù)資產(chǎn)深度融合,打造更懂用戶情緒、更貼合社會(huì)需求的專屬模型,進(jìn)一步解鎖數(shù)據(jù)生態(tài)的深層價(jià)值。
未來,VibeThinker有望成為微博AI應(yīng)用的核心引擎。其技術(shù)能力不僅可優(yōu)化智搜等產(chǎn)品的用戶體驗(yàn),還能突破場景邊界,催生兼具社交屬性與智能服務(wù)的新生態(tài)。例如,在智能搜索中降低算力損耗,在實(shí)時(shí)互動(dòng)中提升響應(yīng)效率,使平臺(tái)在規(guī)模化部署AI時(shí)無需承擔(dān)過高資源壓力。這一變化將釋放微博的生態(tài)創(chuàng)新能力,為用戶帶來更豐富、便捷的智能體驗(yàn),同時(shí)也為AI技術(shù)的普惠化提供可復(fù)制的實(shí)踐樣本。