彰顯AI科技能力!汽車之家倉頡大模型獲SuperCLUE汽車知識測評最高分

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

近日,專業中文大模型測評機構SuperCLUE發布最新一期《SuperCLUE-AutoQA 中文大模型 汽車 知識測評基準總榜》。在此次測評中,汽車之家自研“倉頡大模型”以72.96分的總成績位居6個參評大模型榜首,較第二名領先13.63 分,優勢尤為突出。這一佳績不僅充分印證了倉頡大模型在汽車垂直領域的卓越性能,為其在更多終端場景的應用落地筑牢基礎,更直觀展現了汽車之家“ALL in AI”戰略轉型的堅定決心與階段性突破成果。

彰顯AI科技能力!汽車之家倉頡大模型獲SuperCLUE汽車知識測評最高分

據了解,本次測評內容涵蓋汽車咨詢、汽車對比、汽車推薦、汽車資訊、用車問題5個一級維度及11個二級子維度,旨在為中文大模型汽車知識領域的評估提供全面且多維的參考。測試題目由SuperCLUE機構獨立開發,分為客觀題與主觀題兩類,通過兩輪測試綜合考量大模型在信息時效性、事實準確性、答案一致性和理解用戶意圖等方面的能力。測評結果顯示,在5個一級維度中,汽車之家倉頡大模型在汽車咨詢、汽車對比、汽車推薦、汽車資訊4個維度均位居第一;用車問題維度雖位列第二,但差距不足一分。

彰顯AI科技能力!汽車之家倉頡大模型獲SuperCLUE汽車知識測評最高分

優異成績的背后,是汽車之家倉頡大模型在模型能力、知識架構和數據資源層面構筑的三重壁壘。

著眼真實場景 打造三大優勢能力

深耕汽車行業20年,汽車之家對行業發展和用戶行為已有深刻理解,并以此為基礎重點優化倉頡大模型的三項核心能力,使其更適應當下真實交互場景,為用戶提供更具價值的回應。

首先,“懂用戶,善理解”。隨著汽車消費市場逐漸成熟,用戶向大模型咨詢選購建議時,通常會提出包含多個條件的明確需求,例如“家里有兩個小孩,預算20萬左右,想要空間大的SUV,最好是今年新款,有什么推薦嗎?”。這要求大模型具備在多條件中提取、整合并推理正確答案的能力。測評結果顯示,面對這類問題時,倉頡大模型的答案準確性顯著更高。

其次,“不順從,懂澄清”。新車型更新速度快,消費者難以及時掌握全部準確信息,提問中可能夾帶過時或錯誤內容。測評記錄顯示,與通用大模型往往順應用戶表述不同,倉頡大模型會先依據自身知識庫核實信息,識別其中不準確之處并向用戶澄清,確保回答基于真實有效的數據。

最后,“不編造,給解法”。實際交流中,部分提問本身不存在有效答案,例如用戶詢問“一款已停產車型的最新優惠政策”。面對這種情況,倉頡大模型不會隨意編造答案,而是明確告知車型已停售,補充相關二手車行情信息,同時推薦具有類似特點的在售車型,幫助用戶獲得更具參考價值的選擇。

提升信息質量 構建專業知識圖譜

對于大模型而言,調用信息的質量直接影響輸出結果。為提升回答準確度、最大程度降低AI幻覺出現概率,汽車之家發揮垂直領域優勢,為倉頡大模型構建了全新的信息檢索鏈路。

目前,通用大模型較多采用對用戶提問即時檢索、擴散搜索的方式,即全網搜索包含相關信息的網頁,再從網頁中提煉、分析和推理后給出回復。在 自媒體 盛行的當下, 互聯網 信息質量良莠不齊,采用這一方式的大模型難免接觸大量噪音信息,這也是通用大模型幻覺率較高的主要原因。

而汽車之家依托完備的車型庫體系、海量專業測評結果、真實口碑信息和全面汽車百科,為倉頡大模型搭建了完整的結構化汽車領域知識庫和知識圖譜。因此,倉頡大模型在回答用戶提問時,僅需在這些高質量信息中篩選總結,排除了絕大部分干擾信息,既提升了信息處理效率,又有效保障了回答準確率。

挖掘數據資產 筑起專有信息壁壘

數據量是影響大模型推理結果的另一重要因素。QuestMobile發布的《2025中國移動互聯網半年大報告》顯示,2025年6月,汽車之家全景生態總用戶量達5.02億,日均用戶量達8151.91萬。龐大的用戶體量疊加20年積累,為倉頡大模型提供了豐厚的數據資產,其中大量私有化數據更是價值顯著。

不可否認,汽車之家網站發布的公開信息,通用大模型也可獲取。因此,正是私有化數據的加持,讓倉頡大模型在汽車知識領域實現“遙遙領先”——用戶瀏覽行為、最新成交底價、真實續航里程等未經加工的、通用大模型無法獲得的數據筑起牢固的信息壁壘,使倉頡大模型相比通用大模型能更深刻理解業務場景、更準確識別用戶意圖、更全面進行推理思考,最終給出更具價值的回答。

通過本次測評,也能發現倉頡大模型在部分方面仍有提升空間。對此,汽車之家CTO項碧波表示:“成立20年以來,汽車之家一直堅持‘用戶第一’的價值觀,不斷在內容、產品、技術、服務上投入,優化用戶看車、買車、用車、換車的體驗。在AI時代,汽車之家敏銳意識到AI技術有機會幫助我們跨越式提升用戶體驗,因此在2025年將‘ALL in AI’作為公司核心戰略。倉頡大模型正是為更好解決汽車領域問題而專門研發的行業大模型,我們始終認為‘行業問題需要用行業大模型來解決’。感謝SuperCLUE的測評和反饋,其全面、務實的評價體系讓我們對自研的倉頡大模型有了更客觀的認識。倉頡大模型在汽車知識領域取得的領先優勢,堅定了我們持續投入的信心;同時評測反饋的問題也讓我們更清晰地認識到需要提升的方向。汽車之家將繼續依托20年行業深耕和全景生態數據優勢,不斷迭代模型的理解力、推理力與執行力,讓AI真正懂車、懂用戶、懂場景,并將倉頡大模型的能力應用到各個業務場景中,為所有買車用戶提供選車省心、買車省錢的智能服務。”

據了解,SuperCLUE是大模型時代CLUE基準的發展與延續。后者發起于2019年,是一項致力于科學、客觀、中立的語言模型測評基準。SuperCLUE基于多年測評經驗,結合通用大模型在學術、產業與用戶側的廣泛應用,構建了多層次、多維度的綜合性測評基準,其測評結果在業內廣受認可并被廣泛引用。

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
久久亚洲中文字幕精品一区四| 亚洲精品理论电影在线观看| 国产亚洲精品影视在线| 国产精品午夜无码av体验区| 久久精品国产亚洲一区二区三区| 久久精品国产精品国产精品污| 亚洲精品在线免费观看视频| 国产精品视频无圣光一区| 国产中文在线亚洲精品官网| 91亚洲国产成人精品下载 | 精品国产高清久久久久久小说| 亚洲国产精品一区二区九九| 久久国产精品61947| 亚洲中文字幕精品久久| 国产精品丝袜久久久久久不卡| 久久久久女人精品毛片九一| 久久精品网站免费观看| 精品亚洲视频在线观看 | 国产精品爽爽影院在线| 亚洲线精品一区二区三区影音先锋 | 国产精品美女午夜爽爽爽免费| 精品国产黑色丝袜高跟鞋| 日韩人妻精品无码一区二区三区| 精品久久久久久无码人妻中文字幕 | 国产成人无码精品久久久免费 | 亚洲精品无码永久在线观看男男| 国产精品成人国产乱一区| 精品无码国产一区二区三区AV | 青青青国产精品一区二区| 天堂一区二区三区精品| 亚洲码国产精品高潮在线| 亚洲中文字幕久久精品无码A | 国产精品一区二区三区高清在线| 久久精品国产福利国产秒| 亚洲国产成人精品无码区二本| 99精品久久精品一区二区| 亚洲精品国产日韩| 自拍偷在线精品自拍偷| 久久精品麻豆日日躁夜夜躁| 精品九九人人做人人爱| 国产精品日韩专区|