文心大模型4.5系列正式開源后,百度找到了AI應(yīng)用爆發(fā)的助推器 | 速途網(wǎng)
速途網(wǎng)訊
近期大火的羅永浩數(shù)字人受到行業(yè)熱議,其神形音容與真人無異,直播首秀創(chuàng)1300萬人次觀看、GMV5500萬元的行業(yè)紀錄。這背后的技術(shù)支持,與百度文心大模型密不可分。今年文心大模型動作不斷,昨日正式開源了文心大模型4.5系列。但此次開源其實并不突然,早在今年2月,百度就已預告了文心大模型4.5系列的推出計劃,并明確將于6月30日起正式開源。
據(jù)介紹,此次文心大模型4.5開源系列,涵蓋47B、3B激活參數(shù)的混合專家(MoE)模型,與0.3B參數(shù)的稠密型模型等10款模型,預訓練權(quán)重和推理代碼完全開源。開發(fā)者可在飛槳星河社區(qū)、HuggingFace等平臺下載部署使用,也可在百度智能云千帆大模型平臺使用開源模型API服務(wù)。
評測顯示,文心大模型4.5開源系列在多個文本和多模態(tài)基準評測中實現(xiàn)SOTA。文心大模型4.5開源系列在視覺常識、多模態(tài)推理、視覺感知等多個多模態(tài)大模型評測中優(yōu)于閉源的OpenAI o1;輕量級模型也能以小搏大,文心4.5-VL-28B-A3B多模態(tài)模型是目前同量級最好的多模態(tài)開源模型,甚至與更大參數(shù)模型Qwen2.5-VL-32B不相上下。
AI數(shù)字人在今年成為爆發(fā)式增長的AI應(yīng)用,離不開多模態(tài)大模型的快速發(fā)展。以百度為例,上半年連發(fā)4款文心大模型,包括首個多模態(tài)基礎(chǔ)大模型文心4.5和效果更好、成本更低的多模態(tài)大模型文心4.5T。基于多模態(tài)大模型,百度發(fā)布了高說服力數(shù)字人,其形神音超擬真、內(nèi)容更專業(yè),效果媲美真人。IDC報告顯示,目前百度居中國AI數(shù)字人市場份額第一。
百度多個AI應(yīng)用產(chǎn)品基于今年持續(xù)迭代的文心大模型大幅提升功能與使用量。近期,百度智能代碼助手文心快碼發(fā)布獨立IDE,為行業(yè)首個多模態(tài)交互、多智能體協(xié)同AI IDE;文小言升級多模型調(diào)度、圖片問答等能力;百度文庫、網(wǎng)盤今年已連續(xù)推出具備全模態(tài)內(nèi)容輸入輸出的內(nèi)容領(lǐng)域操作系統(tǒng)、AI相機等應(yīng)用產(chǎn)品。最新財報顯示,百度文庫AI MAU已達9700萬,為國內(nèi)月活用戶規(guī)模最大的AI應(yīng)用產(chǎn)品之一;一季度,智能體為客戶創(chuàng)造的收入同比增長30倍。
而伴隨著文心大模型開源,百度AI應(yīng)用規(guī)模化落地和大模型生態(tài)構(gòu)建無疑將獲得更大助推。近期李彥宏表示,開源有助于擴大新技術(shù)的采用率,他強調(diào)無論開源、閉源,基礎(chǔ)模型只有解決現(xiàn)實問題,才具備真實價值。他今年提出的多個預判“數(shù)字人將成2025突破性應(yīng)用”、“2025會是智能體爆發(fā)元年”也將因開源加速變成現(xiàn)實。