每日經(jīng)濟(jì)新聞 2025-04-30 23:05:26
每經(jīng)編輯 金冥羽
4月30日,小米宣布開源首個為推理而生的大模型Xiaomi MiMo。據(jù)稱,其在數(shù)學(xué)推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,MiMo僅用7B的參數(shù)規(guī)模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開源推理模型QwQ-32B-Preview。
圖片來源:Xiaomi MiMo微信公眾號
受此消息影響,今日小米股價漲5.27%,金山云和金山軟件更是分別大漲14.20%和7.07%。業(yè)內(nèi)人士認(rèn)為,小米作為國產(chǎn)頭部的手機(jī)品牌廠商,此次開源的小參數(shù)規(guī)模模型展現(xiàn)了較強(qiáng)的性能,為AI在手機(jī)端側(cè)的應(yīng)用和運行提供了更堅實的模型基礎(chǔ)。
圖片來源:Wind
隨著MiMo模型的開源,小米剛剛成立不久的小米大模型Core團(tuán)隊也終于浮出水面。小米創(chuàng)始人雷軍曾在2023年表示,自2016年組建AI團(tuán)隊以來,到2023年4月第一時間成立專職大模型團(tuán)隊,經(jīng)過多次擴(kuò)展,小米AI團(tuán)隊相關(guān)人員規(guī)模已達(dá)3000多人,逐步建立了視覺、語音、聲學(xué)、知識圖譜、NLP、機(jī)器學(xué)習(xí)、多模態(tài)等AI技術(shù)能力。
小米大力“押寶”大模型早在去年底便已有消息傳出。DeepSeek-V3爆火之后,背后的AI“天才少女”羅福莉引發(fā)了大眾的關(guān)注,彼時就有媒體報道稱,雷軍以千萬年薪招攬DeepSeek開源大模型DeepSeek-V2的關(guān)鍵開發(fā)者之一羅福莉,領(lǐng)導(dǎo)小米AI大模型團(tuán)隊。
值得一提的是,DeepSeek同日于AI開源社區(qū)Hugging Face上發(fā)布了一個名為DeepSeek-Prover-V2-671B的新模型。據(jù)悉,DeepSeek-Prover-V2-671B使用了更高效的safetensors文件格式,并支持多種計算精度,方便模型更快、更省資源地訓(xùn)練和部署,參數(shù)達(dá)6710億,或為去年發(fā)布的Prover-V1.5數(shù)學(xué)模型升級版本。在模型架構(gòu)上,該模型使用了DeepSeek-V3架構(gòu),采用MoE(混合專家)模式,具有61層Transformer層,7168維隱藏層。同時支持超長上下文,最大位置嵌入達(dá)16.38萬,使其能處理復(fù)雜的數(shù)學(xué)證明,并且采用了FP8量化,可通過量化技術(shù)減小模型大小,提高推理效率。
中信建投研報表示,大模型能力不斷迭代增長,但模型之間差異在縮小。這些技術(shù)需要在終端設(shè)備上應(yīng)用落地,最終通過這些應(yīng)用/終端實現(xiàn)商業(yè)價值的轉(zhuǎn)化,從而形成一個從投資到變現(xiàn)的完整閉環(huán)。目前,Meta、字節(jié)、小米等巨頭已經(jīng)開始大力布局端側(cè)AI,搶奪AI Agent入口。除了手機(jī)、PC、眼鏡、耳機(jī)外,潛在的端側(cè)AI基數(shù)巨大,家電、機(jī)器人、智能車、教育辦公設(shè)備、玩具等都受益于端側(cè)AI的趨勢,AI嵌入將帶來廣泛的硬件升級。重點關(guān)注算力、存儲、連接、電力等硬件環(huán)節(jié)。
(聲明:文章內(nèi)容和數(shù)據(jù)僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。)
編輯|||金冥羽?杜波
校對|陳柯名
封面圖片來源:視覺中國
每日經(jīng)濟(jì)新聞綜合證券時報、財聯(lián)社、Wind等
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP