富士康開發(fā)出臺灣首個推理大模型 性能落后于DeepSeek
北京時間3月10日,據(jù)《華爾街日報》報道,富士康母公司鴻海已研發(fā)出中國臺灣地區(qū)首個具備先進推理能力的大模型,性能上落后于DeepSeek的部分大模型。
鴻海周一表示,已自主研發(fā)了具備推理能力的人工智能(AI)大語言模型FoxBrain,并在四周內(nèi)完成訓(xùn)練。FoxBrain最初為公司內(nèi)部使用而設(shè)計,具備數(shù)據(jù)分析、數(shù)學(xué)運算、推理以及代碼生成的能力。
鴻海稱,英偉達通過其臺灣超級計算機和技術(shù)咨詢?yōu)轼櫤L峁┝酥С郑沟么竽P陀?xùn)練得以成功完成。該公司表示,計劃將該模型開源,以便與行業(yè)合作伙伴開展合作,并希望FoxBrain推動制造和供應(yīng)鏈管理方面的進步。
鴻海研究院AI研究所所長栗永徽表示,該模型在解決問題時“優(yōu)先考慮優(yōu)化訓(xùn)練策略,而不是單純依賴算力”。鴻海表示,栗永徽的團隊使用了120個英偉達H100圖形處理單元(GPU),在大約四周時間內(nèi)完成了FoxBrain的訓(xùn)練。
鴻海已公布了FoxBrain的一些參數(shù),表示它是基于Meta公開可用的大語言模型Llama 3.1的架構(gòu)構(gòu)建而成,是臺灣地區(qū)首個具備先進推理能力的大語言模型,專為臺灣地區(qū)使用的繁體中文而設(shè)計和優(yōu)化。鴻海稱,F(xiàn)oxBrain的性能略遜于DeepSeek的部分模型,但已接近世界一流水平。該公司表示,更多相關(guān)信息將在今年3月中旬的英偉達年度技術(shù)大會上公布。
富士康是鴻海的產(chǎn)品代工子公司,因組裝 蘋果 公司的iPhone而被外界熟知。鴻海在核心電子制造業(yè)務(wù)方面正面臨產(chǎn)業(yè)轉(zhuǎn)型以及盈利能力下降所帶來的挑戰(zhàn),已開始向AI、電動 汽車 等領(lǐng)域拓展業(yè)務(wù)。
【來源: 鳳凰網(wǎng) 科技 】