WAIC 2025|階躍發(fā)布新一代基模 Step 3:原生多模態(tài),推理效率行業(yè)領先
在2025世界人工智能大會(簡稱“WAIC 2025”)開幕前夕,階躍星辰今天在上海正式發(fā)布了新一代基礎大模型——Step 3。
作為階躍的主力基座模型,Step 3兼顧智能與效率,旨在面向推理時代打造最適合應用的模型。Step 3將于7月31日面向全球企業(yè)和開發(fā)者開源,為開源世界貢獻最強多模態(tài)推理模型。
同時,階躍星辰還宣布聯合多家國內領先的芯片、平臺廠商發(fā)起成立“模芯生態(tài)創(chuàng)新聯盟”,將通過推動模型和芯片產業(yè)鏈聯合創(chuàng)新,加速大模型應用的落地。
此外,階躍星辰與上海國有資本投資有限公司達成深度戰(zhàn)略合作,將圍繞加強資本鏈接、生態(tài)業(yè)務合作等方面進行全面的深度合作。
作為一家以實現通用人工智能(AGI)為目標的基礎大模型公司,階躍星辰始終專注于基礎大模型的研發(fā),持續(xù)推進模型的技術迭代。階躍星辰創(chuàng)始人、CEO姜大昕表示:
“從Step 1到Step 2兩代基模的快速迭代,促使我們深入思考什么才是最適合應用的模型。隨著大模型進入到強化學習發(fā)展階段,新一代推理模型成為主流,模型性能的提升固然顯著,但這是否完全等同于模型價值?面對這一產業(yè)之問,我們必須回歸客戶需求,立足真實應用場景,探索模型創(chuàng)新落地的可行路徑。這是我們研發(fā)新一代Step 3基礎模型的出發(fā)點。”
?
新一代基模 Step 3:推理時代最適合應用的模型
隨著大模型技術邁向推理時代,階躍星辰提出,最適合實際應用的大模型需要滿足強智能、低成本、可開源和多模態(tài)四個特征。這四個維度缺一不可,因為單點能力強,無法滿足用戶對于模型的綜合需求。唯有模型全面發(fā)展,才能讓模型真正用起來。基于這樣的研發(fā)理念,階躍星辰打造了新一代基模Step 3,專為追求性能與成本極致均衡的企業(yè)和開發(fā)者設計:
-
不妥協的性能:原生多模態(tài),性能達到開源SOTA
Step 3是階躍星辰首個全尺寸、原生多模態(tài)推理模型,兼顧模型效果與推理成本,是在模型架構創(chuàng)新、算法工程協同設計上的一次大膽嘗試與Scale Up。Step 3采用 MoE 架構,總參數量 321B,激活參數量 38B。
Step 3擁有強大的視覺感知和復雜推理能力,可準確完成跨領域的復雜知識理解、數學與視覺信息的交叉分析,以及日常生活中的各類視覺分析問題。Step 3在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜單上取得了開源多模態(tài)推理模型的SOTA成績。
-
?極致成本效益:系統(tǒng)架構創(chuàng)新,推理效率行業(yè)領先
在確保性能的前提下,階躍星辰持續(xù)推進模型成本優(yōu)化。在推理時代,模型性能隨思維鏈的增長而提升,解碼效率因此成為降低成本的關鍵。目前,主流開源模型雖然針對解碼進行了大量優(yōu)化,但其優(yōu)化方案主要適配國際高端芯片,在中端及國產芯片上的解碼效率仍有提升空間。
Step 3旨在通過系統(tǒng)性的技術創(chuàng)新,實現模型降本增效的目標。在架構設計階段,Step 3便充分考量系統(tǒng)與硬件的特性,實現廣泛硬件平臺上的高效推理。憑借系統(tǒng)和架構創(chuàng)新,Step 3實現了行業(yè)領先的推理解碼效率。
根據原理分析,Step 3在國產芯片上的推理效率最高可達DeepSeek-R1的300%,且對所有芯片友好。在基于 NVIDIA Hopper 架構的芯片進行分布式推理時,實測Step 3相較于 DeepSeek-R1的吞吐量提升超70%。這些都是在不犧牲激活參數量、不降低注意力容量的條件下實現的。
這些結果充分驗證了 Step 3具備廣泛的普適性,在多種硬件環(huán)境下部署,均能顯著地降低推理成本。
?
目前,Step 3已授權國內多家芯片公司,并完成了芯片適配。同時,Step 3將于7月31日正式面向全球企業(yè)和開發(fā)者開源,為開源世界貢獻最強的多模態(tài)推理模型。Step 3已經通過開源技術報告,與全球開發(fā)者分享了大幅降低推理成本背后的系統(tǒng)架構創(chuàng)新。(Step 3 Tech report地址:https://github.com/stepfun-ai/Step3)
-
“1+N” 模型矩陣:全方位滿足用戶需求
成立兩年多以來,階躍星辰構建起“1+N”的Step系列大模型矩陣。“1”是指Step 3基礎大模型;“N”則為Step系列的多模態(tài)大模型矩陣,廣泛覆蓋語音、視覺理解、圖像編輯、圖像和視頻生成、音樂等領域。
本次WAIC期間,階躍亦升級了多模態(tài)模型,包括階躍首個多模理解生成一體化模型Step 3o Vision,第二代端到端語音大模型Step-Audio 2。目前,所有這些模型都可以在“階躍AI”官網(stepfun.com)和 “階躍AI” App(應用商店搜索下載)進行體驗。
全產業(yè)鏈聯合創(chuàng)新,讓大模型真正用起來
要讓大模型真正能用起來,需要從模型、芯片、平臺到應用的全產業(yè)鏈協同創(chuàng)新。?
階躍星辰宣布聯合近10家芯片及基礎設施廠商,共同發(fā)起“模芯生態(tài)創(chuàng)新聯盟”,致力于打通芯片、模型和平臺全鏈路技術。通過底層聯合創(chuàng)新提升大模型適配性和算力效率,該聯盟將為企業(yè)和開發(fā)者提供高效易用的大模型解決方案,加速應用落地。 雷峰網 (公眾號:雷峰網)
該聯盟的首批成員包括華為昇騰、沐曦、壁仞科技、燧原科技、天數智芯、無問芯穹、寒武紀、摩爾線程、硅基流動等。目前,華為昇騰芯片已首先實現Step 3的搭載和運行。沐曦、天數智芯和燧原科技等也已初步實現運行Step 3。其它聯盟廠商的適配工作正在開展。
發(fā)布會還宣布了上海國有資本投資有限公司與上海階躍星辰智能科技有限公司的深度戰(zhàn)略合作,雙方將圍繞加強資本鏈接、生態(tài)建設、業(yè)務協同、應用賦能等方面進行全面的深度合作。上海國投生態(tài)體系將在近期參與投資階躍星辰的最新一輪融資。
階躍星辰戰(zhàn)略性聚焦智能終端Agent的方向,重點布局汽車、手機、IoT設備等關鍵應用場景,目前頭部客戶效應顯著:已覆蓋國內超過一半頭部國產手機廠商,深度合作打造手機 Agent體驗;聯合吉利推出AI智能座艙,成功實現行業(yè)內端到端語音大模型首次量產上車。
另一方面,階躍星辰積極拓展垂直行業(yè)的應用,與金融財經、內容創(chuàng)作、零售等領域的行業(yè)頭部公司深度合作,共同打造面向 C 端的場景化應用體驗。 雷峰網
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見 轉載須知 。