面壁智能開源8B參數(shù)的多模態(tài)模型MiniCPM
8月26日,面壁智能正式開源8B參數(shù)的MiniCPM-V 4.5多模態(tài)模型,具備“高刷”視頻理解能力。據(jù)介紹,該模型高刷視頻理解同級SOTA且性能超過Qwen2.5-VL 72B;同等視覺token開銷下,MiniCPM-V 4.5可接收6倍視頻幀數(shù)量,達(dá)到96倍視覺壓縮率,是同類模型的12-24倍。
文章評價(jià)

發(fā)布
發(fā)布