AI真正的天花板不是芯片
這期對(duì)話把火力對(duì)準(zhǔn)了一個(gè)不體面的真相: 更聰明的“路由”和更苛刻的“成本”正重寫 AI 商業(yè)化的腳本。 嘉賓陣容極具沖突感——半導(dǎo)體觀察者 Dylan Patel,前谷歌云/企業(yè)家 Guido Appenzeller,風(fēng)投人 Erin Price-Wright,與主持人 Erik Torenberg 一起,從 GPT-5 的“沒加大算力卻更會(huì)分配算力”談起,直指 OpenAI 把免費(fèi)用戶與重度用戶放在同一條計(jì)價(jià)膠帶上滾動(dòng)切割的現(xiàn)實(shí)邏輯。
Dylan 的核心判斷很刺耳:GPT-5 的“突破”不在參數(shù),而在自動(dòng)路由與思考時(shí)長管理——把高價(jià)值查詢導(dǎo)向最貴的推理鏈,把低價(jià)值查詢甩給輕模型;更激進(jìn)的是,把路由直接對(duì)接交易與傭金,讓“免費(fèi)”第一次真正具備現(xiàn)金流。這個(gè)觀點(diǎn)等于宣告模型競賽從“智力比拼”轉(zhuǎn)向“單位 token 的經(jīng)濟(jì)學(xué)”,從此誰能在不犧牲體驗(yàn)的前提下把每一秒思考削到恰好夠用,誰就贏。
Guido 順勢把矛頭指向行業(yè)定價(jià)與開源生態(tài):當(dāng)重度編程用戶把訂閱“薅到負(fù)毛利”,當(dāng) Claude、Cursor 等在開發(fā)者側(cè)跑贏傳統(tǒng)巨頭,固定費(fèi)率與按量計(jì)費(fèi)的拉扯會(huì)成為新戰(zhàn)場。Erin 則潑下一盆冷水:企業(yè)真正要的是成本可預(yù)測性而非“靈活計(jì)量”,這意味著產(chǎn)品與路由必須圍繞“可控賬單”設(shè)計(jì),而不是把風(fēng)險(xiǎn)轉(zhuǎn)嫁給客戶。
鏡頭拉遠(yuǎn)到供給端,討論更具火藥味。Dylan 斷言?NVIDIA 的護(hù)城河不僅是 CUDA,而是“軟硬件—供應(yīng)鏈—數(shù)據(jù)中心周轉(zhuǎn)”三位一體;定制芯片想擊穿壁壘,必須在特定負(fù)載上拿出 5 倍效率且賭對(duì)未來模型形態(tài)。與此同時(shí),美國電力與上架周期成了真正瓶頸,中國則以“電力相對(duì)充裕但單位資本效率偏低”形成對(duì)照——算力地緣政治正在把 AI 基建推向國家級(jí)資本博弈。
這場對(duì)話最后落回一個(gè)不舒服的結(jié)論:價(jià)值創(chuàng)造遠(yuǎn)超價(jià)值捕獲。從購物代理到法律、出行預(yù)訂,誰把“高價(jià)值意圖”路由到可抽傭的閉環(huán),誰就能把模型紅利變成現(xiàn)金流;反之,再聰明的模型也只是在燒錢發(fā)光。若把這次發(fā)布視為行業(yè)分水嶺,它更像一次“會(huì)計(jì)學(xué)的勝利”—— AI 不再只比智商,而是比單次回答背后的資本開銷與變現(xiàn)半徑。
以下是全文翻譯:
一、智能路由與成本革命:AI商業(yè)化的新分水嶺
Erik Torenberg:? 或許我們可以從GPT-5開始討論。您曾表示對(duì)該研究感到失望,能否具體說明您的評(píng)價(jià)?您原本期待看到哪些能力突破?或者談?wù)務(wù)w看法。
Dylan Patel:? 這實(shí)際上取決于用戶層級(jí)差異。對(duì)于此前每月支付20美元或200美元訂閱費(fèi)用的用戶,升級(jí)至GPT-5后將無法繼續(xù)使用4.5版本——就某些特定任務(wù)而言,4.5仍然是更優(yōu)秀的預(yù)訓(xùn)練模型。同時(shí)也會(huì)失去o3模型的訪問權(quán)限,該模型平均思考時(shí)長約為30秒,而GPT-5即使在啟用思考模式下,平均思考時(shí)間也僅5至10秒。這種現(xiàn)象值得關(guān)注。
本質(zhì)上,GPT-5并未顯著增加單次計(jì)算消耗。從基礎(chǔ)性能來看,模型確實(shí)有所提升,4.0到5.0的進(jìn)步幅度相當(dāng)明顯。 但當(dāng)我們審視智能增長曲線時(shí),核心規(guī)律在于:計(jì)算資源投入量與模型性能呈正相關(guān)。這體現(xiàn)為兩種途徑:要么擴(kuò)大模型規(guī)模 (GPT-5顯然未采用此方案,其參數(shù)量基本保持穩(wěn)定) ,要么增加思考時(shí)長。
需要指出的是,OpenAI早期思考模型 (如初代o1、o3版本) 存在過度思考問題,會(huì)消耗大量token卻收效甚微。相比之下,Anthropic的思考模型即使在啟用思考模式下,所需時(shí)長也顯著縮短,卻能獲得相當(dāng)或更優(yōu)的結(jié)果。因此OpenAI本次進(jìn)行了大量優(yōu)化——例如我曾向o3提問“豬肉屬于紅肉還是白肉”,模型竟思考48秒,這種本應(yīng)直接回答的問題顯然不需要深度推理。
GPT-5的改進(jìn)體現(xiàn)在兩方面:即使用戶手動(dòng)選擇思考模式,計(jì)算時(shí)長也已大幅壓縮;更重要的是引入了自動(dòng)路由機(jī)制,系統(tǒng)能智能判斷應(yīng)調(diào)用標(biāo)準(zhǔn)模型、高頻用戶專屬模型 (若觸及速率限制) 還是思考模型,并動(dòng)態(tài)分配計(jì)算資源。總體而言,當(dāng)前高端用戶查詢所需的平均計(jì)算消耗較之前有所降低。
Guido Appenzeller:但更值得關(guān)注的是 ,OpenAI現(xiàn)在可以自主控制分配給用戶的計(jì)算資源量 。如果處于高負(fù)載情況,他們或許會(huì)通過調(diào)整路由參數(shù)來降低計(jì)算分配——雖然我們無從得知其幕后具體實(shí)現(xiàn)。當(dāng)前存在一種流行觀點(diǎn) (注:該觀點(diǎn)并不符合事實(shí)) 認(rèn)為,OpenAI只是將三個(gè)主要模型與若干小模型組合,前置路由系統(tǒng)后以混合定價(jià)模式提供更低廉的服務(wù)。這種說法確實(shí)反映了部分現(xiàn)實(shí):成本控制已成為重要考量,而他們找到了精準(zhǔn)調(diào)控的計(jì)算分配方案。
Dylan Patel:OpenAI確實(shí)透露其基礎(chǔ)設(shè)施容量已實(shí)現(xiàn)大幅擴(kuò)容。 就個(gè)人使用習(xí)慣而言,我原本持續(xù)使用o3或4.5模型,現(xiàn)在則必須使用自動(dòng)模式——該系統(tǒng)有時(shí)會(huì)分配相當(dāng)于o3級(jí)別的思考模型,有時(shí)卻僅提供基礎(chǔ)模型,后者體驗(yàn)明顯欠佳。
但對(duì)免費(fèi)用戶而言,這種機(jī)制具有重要價(jià)值。此前免費(fèi)用戶幾乎從未獲得思考模型的使用權(quán)限,他們通常直接打開網(wǎng)站進(jìn)行查詢。現(xiàn)在通過路由系統(tǒng),其查詢有時(shí)會(huì)被導(dǎo)向高性能模型,從而獲得更優(yōu)質(zhì)的服務(wù)。同時(shí)OpenAI也獲得了彈性降級(jí)能力,可根據(jù)需要合理調(diào)整免費(fèi)用戶的資源分配。
路由機(jī)制實(shí)際上展現(xiàn)了OpenAI的商業(yè)化戰(zhàn)略路徑。對(duì)比行業(yè)現(xiàn)狀,Anthropic完全專注于B2B領(lǐng)域 (API、編程工具等) ;而OpenAI雖擁有Codex和API業(yè)務(wù),但其主要收入來源仍是消費(fèi)者訂閱服務(wù)。 然而免費(fèi)用戶的變現(xiàn)始終是核心挑戰(zhàn):傳統(tǒng)消費(fèi)應(yīng)用通過廣告實(shí)現(xiàn)免費(fèi)用戶變現(xiàn),但這種方式與AI助手的本質(zhì)存在根本沖突——既不能通過植入廣告損害用戶體驗(yàn),橫幅廣告在AI界面中也效果欠佳。
通過路由系統(tǒng),OpenAI正在突破免費(fèi)用戶變現(xiàn)的困局。 以新推出的購物代理應(yīng)用 (疑似與Shopify合作) 為例:當(dāng)用戶提出低價(jià)值查詢 (如“天空為什么是藍(lán)色的”) ,系統(tǒng)可將其路由至輕量級(jí)模型;而當(dāng)用戶提出高價(jià)值需求 (如“尋找本地最佳醉駕辯護(hù)律師”) ,未來系統(tǒng)將能聯(lián)系區(qū)域內(nèi)律師,分析勝訴率與法庭記錄等數(shù)據(jù),最終為用戶預(yù)訂最佳法律服務(wù)。這種基于查詢價(jià)值的智能路由,正是實(shí)現(xiàn)免費(fèi)用戶變現(xiàn)的關(guān)鍵路徑。
Guido Appenzeller: 或許可以通過抽取傭金的方式實(shí)現(xiàn)。
Dylan Patel:確實(shí)如此,平臺(tái)必然需要抽取分成。 但這種變現(xiàn)方式遠(yuǎn)比傳統(tǒng)模式更優(yōu)越。以Etsy為例,目前其10%的流量來自聊天界面,而OpenAI卻未能從中獲利。這種狀況即將改變——盡管亞馬遜封鎖了聊天入口,但通過購物決策 (無論是機(jī)票預(yù)訂還是商品搜索) 實(shí)現(xiàn)盈利的路徑已經(jīng)清晰。
現(xiàn)在面對(duì)免費(fèi)用戶時(shí),系統(tǒng)可以根據(jù)查詢價(jià)值進(jìn)行智能分配:對(duì)于高價(jià)值場景 (如購物咨詢) ,會(huì)啟用最佳模型甚至代理系統(tǒng),不惜投入巨額計(jì)算資源,因?yàn)檫@類查詢能帶來收益;而對(duì)于低價(jià)值查詢 (如作業(yè)輔導(dǎo)) ,則分配適當(dāng)級(jí)別的模型以控制成本。 這正是路由系統(tǒng)最關(guān)鍵的價(jià)值——OpenAI終于找到了免費(fèi)用戶的有效變現(xiàn)路徑。
Guido Appenzeller: 這個(gè)視角非常具有啟發(fā)性。 我認(rèn)為這是首次出現(xiàn)以成本控制為核心亮點(diǎn)的模型發(fā)布。 以往行業(yè)關(guān)注點(diǎn)始終集中在“誰的模型最智能”或“誰的MLOU分?jǐn)?shù)最高”上。而現(xiàn)在,那些每天使用模型進(jìn)行八小時(shí)編程的用戶突然發(fā)現(xiàn),若采用大上下文窗口搭配最高配置的模型,每月會(huì)產(chǎn)生數(shù)千美元的成本。成本因素變得至關(guān)重要。這意味著如果我們正處于成本與性能的帕累托前沿上,衡量模型競爭力的新標(biāo)準(zhǔn)是否不再局限于單一成本指標(biāo)?這是我們正在見證的轉(zhuǎn)變嗎?
Dylan Patel: 確實(shí)如此。OpenAI明確表示為大用量用戶提升了兩倍的速率限制,并顯著增加了本次發(fā)布的服務(wù)token數(shù)量——這實(shí)質(zhì)上宣告了這是一次以經(jīng)濟(jì)性為核心的版本發(fā)布。
Guido Appenzeller: 這是否也意味著token成本已經(jīng)降低?
Dylan Patel: 確實(shí)如此。最具啟示性的案例發(fā)生在編程領(lǐng)域:Cursor不得不取消無限制使用Claude代碼的權(quán)益。最初他們推出包含無限制額度的高價(jià)方案,隨后改為周度速率限制,現(xiàn)在甚至實(shí)施基于小時(shí)的頻率管控。我在Twitter上看到最令人震驚的案例是:有用戶為適應(yīng)這種限制改變了睡眠周期——模仿海灣水手的作息模式,就像單人航海時(shí)選擇在安全區(qū)域進(jìn)行能量小睡以保持警覺那樣調(diào)整使用節(jié)奏。
但由于Anthropic實(shí)施了基于小時(shí)而非周度的速率限制,用戶無法進(jìn)行連續(xù)不間斷的使用。該用戶因此采取分段睡眠模式——每天多次短時(shí)休息,以最大化利用限額。Reddit上甚至出現(xiàn)了使用量排行榜,用戶們競相展示訂閱范圍內(nèi)的token消耗量,目前最高記錄保持者每月消耗金額達(dá)三萬美元。
Guido Appenzeller :那么我是否可以與印度開發(fā)者結(jié)對(duì)編程:我使用白天的額度,他使用夜間額度,共同最大化賬戶配額的使用效率?這就是未來的發(fā)展趨勢嗎?
Dylan Patel: 顯然用戶正在利用負(fù)毛利率的訂閱方案獲利。雖然Anthropic可能從我的訂閱中實(shí)現(xiàn)正毛利率 (因?yàn)槲业木幋a使用量不高) ,但確實(shí)存在大量用戶讓企業(yè)承受虧損的情況。
Guido Appenzeller: 這越來越指向按使用量計(jì)價(jià)的模式。當(dāng)某種基礎(chǔ)資源 (在某種程度上被轉(zhuǎn)售) 占據(jù)商品成本如此大的比重時(shí),就必須轉(zhuǎn)向基于實(shí)際用量的定價(jià)體系。
Dylan Patel: 您認(rèn)為這些編程產(chǎn)品的客戶捕獲能力和用戶粘性如何?我很好奇您的觀點(diǎn)——當(dāng)開發(fā)者集成某個(gè)CLI產(chǎn)品或適應(yīng)特定IDE后,這種粘性究竟有多強(qiáng)?用戶會(huì)輕易切換平臺(tái)嗎?
Guido Appenzeller: 這是一個(gè)價(jià)值十億美元的問題——甚至可說是保守估計(jì)。Andrew McCarthy曾展示過一張極具啟發(fā)性的幻燈片: 當(dāng)今構(gòu)建智能體系統(tǒng)的本質(zhì)在于閉環(huán)設(shè)計(jì)。該循環(huán)的一半是模型思考過程,另一半則是用戶驗(yàn)證代理行為——檢查執(zhí)行結(jié)果是否正確、提供反饋并引導(dǎo)其朝向正確方向。 因?yàn)橄到y(tǒng)不可能無限運(yùn)行,最終仍需人工干預(yù)校正。
這個(gè)閉環(huán)中,模型提供商負(fù)責(zé)構(gòu)建最佳模型,而另一半核心競爭力在于設(shè)計(jì)最優(yōu)用戶界面以獲取有效反饋。我認(rèn)為這方面存在顯著價(jià)值,因此必然產(chǎn)生相當(dāng)程度的用戶粘性。以代碼編輯為例:如何最直觀展示代碼變更?如何清晰呈現(xiàn)修改影響范圍及涉及文件?如何針對(duì)簡單修改提供快速反饋,對(duì)復(fù)雜變更提供詳細(xì)分析?有些工具甚至能自動(dòng)生成操作流程圖。這將成為未來的競爭焦點(diǎn),也必然帶來用戶粘性。至于具體粘性強(qiáng)度——這確實(shí)是個(gè)值得深入探討的卓越問題。
Dylan Patel: 按照這個(gè)邏輯,企業(yè)應(yīng)該通過訂閱制來鎖定用戶,而非轉(zhuǎn)向按量計(jì)費(fèi)模式?
Erin Price-Wright: 我認(rèn)為恰恰是客戶不愿意接受按量計(jì)費(fèi)——因?yàn)檫@種模式存在成本失控風(fēng)險(xiǎn)。客戶真正需要的是可預(yù)測的成本保障,他們寧愿承諾較高額度的預(yù)付支出以避免按量計(jì)費(fèi)的不確定性。真正推崇按量計(jì)費(fèi)模式的,其實(shí)是模型提供商自身。
Guido Appenzeller:對(duì)消費(fèi)者市 場而言,完全規(guī)避按量計(jì)價(jià)模式確實(shí)非常困難,因?yàn)槭褂昧康牟町悩O其巨大。 以我們偶爾編程的用戶與全職開發(fā)者相比,使用量可能相差二十倍以上,這種差異會(huì)帶來巨大的成本波動(dòng)。對(duì)企業(yè)客戶則不同,我們可以預(yù)見更多固定費(fèi)率方案,因?yàn)槠髽I(yè)內(nèi)部的用量更容易實(shí)現(xiàn)均衡化。
Erin Price-Wright: 當(dāng)企業(yè)擁有全天候使用系統(tǒng)的開發(fā)團(tuán)隊(duì)時(shí),基本上可以預(yù)估其日常編程時(shí)長和使用模式。這種可預(yù)測性為固定費(fèi)率定價(jià)提供了基礎(chǔ)。
Guido Appenzeller: 用量配額確實(shí)更難掌控。在結(jié)束OpenAI話題前,我想提出一個(gè)宏觀問題:如果Sam Altman此刻坐在這里說“Dylan,只要能讓OpenAI更具價(jià)值,我愿意采納你的任何建議”,你會(huì)給出什么方案?
Dylan Patel:我會(huì)建議立即推出信用卡綁定功能——允許用戶向ChatGPT輸入信用卡信息,并同意對(duì)其所有代理行為抽取固定比例傭金。隨后推出智能購物產(chǎn)品 :眾所周知Anthropic、OpenAI及其他實(shí)驗(yàn)室正在構(gòu)建基于亞馬遜、Shopify、Etsy等電商平臺(tái)以及航空公司網(wǎng)站的強(qiáng)化學(xué)習(xí)環(huán)境。下一步應(yīng)該實(shí)現(xiàn)日歷集成:當(dāng)用戶提出“周四飛往某地”的需求時(shí),系統(tǒng)能自動(dòng)協(xié)調(diào)會(huì)議時(shí)間避免沖突。
掌握用戶對(duì)靠窗或過道座位的偏好等個(gè)性化數(shù)據(jù),在此基礎(chǔ)上收取交易傭金。該功能一經(jīng)推出必將帶來巨大收益——雖然他們可能已在開發(fā)此類功能,但我更想了解他的戰(zhàn)略思考。過去六個(gè)月里他對(duì)廣告的態(tài)度發(fā)生顯著轉(zhuǎn)變:從最初堅(jiān)決反對(duì)到現(xiàn)在表示可能存在不影響用戶體驗(yàn)的變現(xiàn)方式。我認(rèn)為這正是免費(fèi)用戶的理想?monetization?路徑。這大概就是我會(huì)提出的建議——同時(shí)圍繞該方向展開系列深度探討。
二、NVIDIA的增長曲線與AI算力的未來圖景
Erik Torenberg: 現(xiàn)在我想將話題轉(zhuǎn)向NVIDIA。該公司今年表現(xiàn)極為強(qiáng)勁,股價(jià)漲幅接近70%。您認(rèn)為其未來可能的發(fā)展路徑有哪些?對(duì)此您如何展望?
Dylan Patel: 這取決于對(duì)持續(xù)增長前景的判斷深度。不過我們確實(shí)擁有獨(dú)特的觀察視角——能夠清晰看到眾多企業(yè) (特別是編程領(lǐng)域公司,還包括其他應(yīng)用領(lǐng)域) 的收入增速。需求端顯然正在加速增長。再看訓(xùn)練側(cè):競賽已經(jīng)白熱化。Meta和谷歌都在大幅增加投入。
僅以O(shè)penAI和Anthropic為例,這兩家公司今年從谷歌、Amazon for Anthropic以及微軟、CoreWeave、Oracle for OpenAI獲取的計(jì)算資源,就占到芯片總量的30%。但剩下的70%流向何方?其中三分之一用于廣告業(yè)務(wù) (包括字節(jié)跳動(dòng)、Meta等廣告廠商) 。那么剩余三分之一的芯片去向? 主要被經(jīng)濟(jì)模式尚不明確的供應(yīng)商消耗——這些企業(yè)能否持續(xù)增長仍存疑問,他們需要不斷進(jìn)行更大規(guī)模的融資。這種情況下的發(fā)展軌跡值得深思。
以編程領(lǐng)域?yàn)槔篞wen Coder 3模型若通過本地部署或云端推理庫運(yùn)行,成本其實(shí)極低。因此核心問題在于:增長動(dòng)能還能持續(xù)多久?第一梯隊(duì)的OpenAI和Anthropic實(shí)驗(yàn)室支出確實(shí)在飆升;第二梯隊(duì)的廣告業(yè)務(wù)也會(huì)增長 (雖然不會(huì)爆發(fā)式增長) ,但生成式AI廣告可能迎來拐點(diǎn)——Meta已進(jìn)行大量實(shí)驗(yàn),個(gè)性化廣告展示確實(shí)存在巨大潛力:當(dāng)廣告人物與用戶高度相似且略趨完美時(shí),更容易激發(fā)購買欲望。
Guido Appenzeller: 這個(gè)擴(kuò)展路徑非常有趣。關(guān)鍵在于其規(guī)模化的潛力:我們究竟能創(chuàng)造多少價(jià)值?這些價(jià)值是否足以支撐長期增長?以AI軟件開發(fā)為例,目前數(shù)據(jù)顯示,開發(fā)者生產(chǎn)率能輕松提升15%。許多傳統(tǒng)企業(yè)部署GitHub Copilot后都達(dá)到這一水平。當(dāng)然我們還能實(shí)現(xiàn)更高提升。
Dylan Patel: 這個(gè)數(shù)據(jù)可能低估了實(shí)際效果。根據(jù)我們的觀察,效率提升幅度遠(yuǎn)高于此。
Guido Appenzeller: 根據(jù)我對(duì)大量傳統(tǒng)企業(yè)的調(diào)研,標(biāo)準(zhǔn)化的GitHub Copilot部署通常帶來約15%的效率提升。但實(shí)際上我們完全能實(shí)現(xiàn)更高水平。
Dylan Patel: 但您是否清楚GitHub Copilot的實(shí)際表現(xiàn)?觀察其年度經(jīng)常性收入圖表會(huì)發(fā)現(xiàn)一個(gè)有趣現(xiàn)象:Claude Code在三個(gè)月內(nèi)就實(shí)現(xiàn)了反超,Cursor更是輕松超越。甚至像Replit和Windsurf/Cognition這類公司也即將趕超——這背后的發(fā)展趨勢值得深思。
Guido Appenzeller: 假設(shè)我們能將開發(fā)效率提升至100%,這意味著開發(fā)者生產(chǎn)率可實(shí)現(xiàn)翻倍。全球約3000萬開發(fā)者,按每人創(chuàng)造10萬美元附加值計(jì)算 (美國偏低但全球平均值偏高) ,總價(jià)值將達(dá)3萬億美元。因此我們正在構(gòu)建的技術(shù)理論上可帶來3萬億美元的GDP增值。這些價(jià)值最終將體現(xiàn)在GPU投入上,因?yàn)檫@是主要成本要素。
Erin Price-Wright: 這還僅是代碼模型的貢獻(xiàn),未計(jì)入其他應(yīng)用場景。
Guido Appenzeller: 至少從理論層面看,價(jià)值創(chuàng)造確實(shí)具備持續(xù)增長的基礎(chǔ)。但如何轉(zhuǎn)化為產(chǎn)業(yè)效益則復(fù)雜得多。
Dylan Patel: AI的價(jià)值創(chuàng)造已經(jīng)顯現(xiàn)。最初所謂的“3000億難題”現(xiàn)已升級(jí)為“6000億難題”——紅杉資本很快會(huì)提出1.8萬億美元的版本。這些數(shù)字雖有一定依據(jù),但忽略了關(guān)鍵點(diǎn):當(dāng)前基礎(chǔ)設(shè)施投入對(duì)應(yīng)的是五年而非一年的收益周期,且收益曲線呈指數(shù)增長而非平緩直線。 核心在于:AI創(chuàng)造的價(jià)值已遠(yuǎn)超投入成本,但價(jià)值捕獲機(jī)制存在根本性缺陷。 我確信OpenAI通過ChatGPT創(chuàng)造的價(jià)值中,其實(shí)際捕獲率不足10%。這個(gè)現(xiàn)象同樣適用于Anthropic、Cursor等其他企業(yè)。
以我們內(nèi)部運(yùn)作為例:僅用四名開發(fā)者就實(shí)現(xiàn)了自動(dòng)化監(jiān)管審查——通過Gemini API分析每個(gè)數(shù)據(jù)中心的許可文件與衛(wèi)星影像,自動(dòng)識(shí)別發(fā)電機(jī)型號(hào)、冷卻塔配置、施工進(jìn)度和變電站狀態(tài)。雖然我們?cè)贕emini API上的投入極低,但通過數(shù)據(jù)銷售和咨詢獲得的收益卻非常可觀。而提供這些技術(shù)的公司反而幾乎未能分享收益。
隨著GPT-5等先進(jìn)模型和開源技術(shù)的持續(xù)發(fā)展,推理成本將不斷下降,但這些企業(yè)的價(jià)值捕獲會(huì)越來越困難——目前他們僅能獲得50%甚至更低的推理毛利率。價(jià)值捕獲難題已經(jīng)遠(yuǎn)遠(yuǎn)超過價(jià)值創(chuàng)造本身。
Guido Appenzeller: 簡而言之,您認(rèn)為行業(yè)正在面臨商品化趨勢,導(dǎo)致價(jià)值捕獲能力下降,因此需要對(duì)GPU投入規(guī)模保持更謹(jǐn)慎的預(yù)期?
Dylan Patel: 并非如此。我認(rèn)為仍然存在顯著提升價(jià)值捕獲的空間——正如之前提到的廣告業(yè)務(wù)就是重要的價(jià)值拐點(diǎn)。
Erin Price-Wright: 但這種突破必須發(fā)生在規(guī)模擴(kuò)張之前。我們需要先實(shí)現(xiàn)價(jià)值捕獲模式的創(chuàng)新,才能支撐后續(xù)的大規(guī)模投入。
Dylan Patel: 實(shí)際情況是仍有大量資本尚未投入。超大規(guī)模云服務(wù)商的資本支出明年仍能增長20-30%;而CoreWeave和Oracle這類通過資本市場融資的企業(yè),其資本支出增幅更可遠(yuǎn)超這個(gè)比例。進(jìn)一步分析:全球最大基礎(chǔ)設(shè)施基金 (如Brookfield和Blackstone) 正將目光聚焦AI基礎(chǔ)設(shè)施投資。
至于主權(quán)財(cái)富基金——無論是G42、挪威央行投資局還是新加坡GIC——這些機(jī)構(gòu)對(duì)AI領(lǐng)域的投資才剛剛起步。因此我認(rèn)為, 未來還存在巨大的資本支出空間,且這些投資初期并不完全受經(jīng)濟(jì)回報(bào)驅(qū)動(dòng)。當(dāng)前經(jīng)濟(jì)動(dòng)機(jī)驅(qū)動(dòng)的資本支出確有增長上限,但更多投資源于信念驅(qū)動(dòng):投資者相信未來必將獲得回報(bào),盡管目前還無法通過電子表格精確論證其商業(yè)可行性。
Erik Torenberg: 定制芯片對(duì)NVIDIA的威脅有多大?
Dylan Patel: 這是最關(guān)鍵的問題。觀察谷歌、亞馬遜、Meta的訂單趨勢:雖然微軟的定制芯片表現(xiàn)欠佳,但其他三家公司去年已大幅增加自主芯片訂單。亞馬遜正在生產(chǎn)數(shù)百萬顆Tranium芯片,谷歌的TPU產(chǎn)量也達(dá)到百萬級(jí)——且TPU利用率顯然已達(dá)到100%。雖然Tranium目前尚未達(dá)到理想水平,但亞馬遜與Anthropic終將攻克技術(shù)難題。
我認(rèn)為這對(duì)NVIDIA構(gòu)成最大威脅: 一旦行業(yè)掌握更廣泛的定制芯片應(yīng)用技術(shù),市場格局將發(fā)生根本性轉(zhuǎn)變。 若AI產(chǎn)業(yè)保持高度集中,定制芯片將占據(jù)優(yōu)勢——這還未計(jì)入OpenAI自研芯片團(tuán)隊(duì)的潛在影響。反之若產(chǎn)業(yè)走向分散化,則情況可能完全不同。
Guido Appenzeller: 谷歌的TPU已具備與NVIDIA競爭的實(shí)力,理論上完全可以在公開市場銷售。如今NVIDIA市值甚至超過谷歌——難道谷歌不應(yīng)該向全行業(yè)出售芯片嗎?這理論上應(yīng)該能幫助他們獲得更高的市場估值。
Dylan Patel: 我完全認(rèn)同這個(gè)觀點(diǎn)。據(jù)我所知谷歌內(nèi)部已在討論此事,但這需要實(shí)現(xiàn)三重變革:企業(yè)文化重構(gòu)、谷歌云運(yùn)營模式重組,以及TPU團(tuán)隊(duì)與軟件團(tuán)隊(duì) (包括Jack軟件團(tuán)隊(duì)和XLA編譯器團(tuán)隊(duì)) 的協(xié)同機(jī)制改革。雖然需要經(jīng)歷劇烈調(diào)整過程,但我堅(jiān)信谷歌應(yīng)該直接對(duì)外銷售TPU芯片實(shí)體,而不僅限于租賃算力服務(wù)。
Guido Appenzeller: 頗具諷刺意味的是,理論上這項(xiàng)副業(yè)可能比核心業(yè)務(wù)具有更高的企業(yè)價(jià)值潛力——尤其是在搜索業(yè)務(wù)作為核心業(yè)務(wù)逐漸衰落的背景下。
Dylan Patel: 確實(shí)如此。但如果詢問Sergei的觀點(diǎn),他必然會(huì)堅(jiān)持認(rèn)為Gemini的價(jià)值將遠(yuǎn)超芯片銷售或云服務(wù),只是當(dāng)前價(jià)值尚未完全顯現(xiàn)。關(guān)于NVIDIA的價(jià)值評(píng)估本質(zhì)上取決于產(chǎn)業(yè)集中度:若AI客戶群體高度集中,NVIDIA很難成為全球最具價(jià)值的企業(yè);反之若產(chǎn)業(yè)持續(xù)分散化 (開源模型性能持續(xù)提升、部署成本不斷降低的趨勢已初見端倪) ,那么NVIDIA很可能長期保持全球最高市值的地位。
Guido Appenzeller: 從歷史經(jīng)驗(yàn)看,任天堂的軟件生態(tài)曾席卷全球市場。早期網(wǎng)絡(luò)時(shí)代,思科也曾一度成為全球最具價(jià)值的企業(yè),但最終被基于其基礎(chǔ)設(shè)施構(gòu)建服務(wù)的谷歌、亞馬遜和Meta等公司超越。
Dylan Patel: 這正是NVIDIA大力開發(fā)軟件庫的原因——他們?cè)噲D通過將推理環(huán)節(jié)商品化來維持優(yōu)勢。據(jù)我所知,貴機(jī)構(gòu)甚至沒有投資任何推理API提供商吧?
Guido Appenzeller: 我們投資了各類模型提供商。
Dylan Patel: 模型提供商與純API服務(wù)商存在本質(zhì)區(qū)別。我記得曾與貴團(tuán)隊(duì)討論過為何不投資Together或Fireworks這類純API提供商——當(dāng)時(shí)的觀點(diǎn)是認(rèn)為單純提供模型服務(wù)而不參與模型研發(fā)將會(huì)被商品化。
Guido Appenzeller: 我們?cè)赟table Diffusion生態(tài)中投資了Foul等企業(yè)。
Dylan Patel: 但那邊的商業(yè)模式與LLM領(lǐng)域有所不同。
Guido Appenzeller: 確實(shí),Stable Diffusion領(lǐng)域的公司更傾向于構(gòu)建復(fù)合型模型,這與LLM廠商的技術(shù)路徑存在顯著差異。
Dylan Patel: 但貴機(jī)構(gòu)沒有投資Base10這類API服務(wù)商,根據(jù)基礎(chǔ)設(shè)施團(tuán)隊(duì)的觀點(diǎn),你們認(rèn)為該領(lǐng)域?qū)⒈簧唐坊捎贜VIDIA推動(dòng)的VLM、伯克利開源的SGLANG等軟件生態(tài)日益成熟,并獲得多方支持,這種商品化趨勢將使純API提供商的價(jià)值大幅縮水。這個(gè)判斷與當(dāng)前討論直接相關(guān):為什么選擇這樣的投資策略?
Guido Appenzeller: 我們換個(gè)話題:如何看待芯片初創(chuàng)企業(yè)?大量資本正涌入這個(gè)領(lǐng)域,雖然缺乏精確數(shù)據(jù),但投資規(guī)模可能已達(dá)數(shù)十億美元。
Dylan Patel: 確實(shí)如此。以Etched和Rivos為代表的芯片初創(chuàng)企業(yè)令人印象深刻——這些公司甚至尚未發(fā)布產(chǎn)品就獲得了巨額融資。Maddox等企業(yè)也面臨類似情況。與傳統(tǒng)半導(dǎo)體行業(yè)不同 (以往企業(yè)至少需要先推出芯片才能獲得大額融資) ,如今Etched和Rivos在未公開推出任何芯片的情況下就籌集了大量資金。
這種現(xiàn)象既反映了芯片研發(fā) (尤其是包含眾多復(fù)雜模塊的加速器) 所需的巨額資本投入,也揭示了當(dāng)前市場的特殊性: 過去幾年間涌現(xiàn)出至少十余家新型AI加速器公司,這種融資環(huán)境在半導(dǎo)體行業(yè)發(fā)展史上前所未有。
Guido Appenzeller: 我認(rèn)為還有更多因素需要考慮。
Dylan Patel: 確實(shí)如此。此外還有持續(xù)獲得融資的傳統(tǒng)玩家:Grok、Cerebris、Zamanova、Tenstorrent等企業(yè),以及被SoftBank收購的Graphcore——SoftBank正在向這個(gè)領(lǐng)域持續(xù)注資。大量資本正試圖挑戰(zhàn)NVIDIA的壟斷地位,但實(shí)際面臨巨大挑戰(zhàn):如何真正超越NVIDIA?超大規(guī)模云服務(wù)商的優(yōu)勢在于能基本復(fù)刻N(yùn)VIDIA的技術(shù)路徑。
Guido Appenzeller: 他們擁有自身這個(gè)天然客戶群體,這是巨大優(yōu)勢。
Dylan Patel: 而且可以通過供應(yīng)鏈優(yōu)勢取勝——例如采用成本更低的供應(yīng)商。
Guido Appenzeller: 這本質(zhì)上是一場利潤率壓縮的競賽。
Dylan Patel: 確實(shí)。對(duì)于特定負(fù)載 (例如Meta的推薦系統(tǒng)) ,企業(yè)可以通過專項(xiàng)優(yōu)化獲得優(yōu)勢。但絕大多數(shù)場景下,競爭對(duì)手實(shí)際瞄準(zhǔn)的是相同工作負(fù)載——他們?cè)噲D通過簡化供應(yīng)鏈、內(nèi)部化生產(chǎn)來壓縮利潤率。然而對(duì)其他芯片公司而言,由于缺乏自有客戶群體,他們必須面對(duì)雙重挑戰(zhàn):要么選擇定制芯片供應(yīng)商 (對(duì)方必然要抽取利潤,導(dǎo)致自身售價(jià)受壓) ,要么嘗試完全自研 (但這意味著需要承擔(dān)芯片設(shè)計(jì)、知識(shí)產(chǎn)權(quán)開發(fā)、芯片與服務(wù)器供應(yīng)鏈管理等全方位工作,團(tuán)隊(duì)規(guī)模要求極高) 。
最終結(jié)果是:NVIDIA能維持75%的毛利率,AMD的GPU僅能實(shí)現(xiàn)50%毛利率——盡管AMD擁有頂尖工程技術(shù),但仍需使用更多晶圓面積和內(nèi)存才能達(dá)到同等性能,最終不得不以更低價(jià)格銷售導(dǎo)致利潤空間被壓縮。
Guido Appenzeller: 這個(gè)分析很有說服力。縱觀歷史,新進(jìn)入者通常不會(huì)通過邊際改進(jìn)獲勝 (盡管偶爾發(fā)生) ,而是依靠顛覆性技術(shù)實(shí)現(xiàn)突破——采用全新方法路徑。在當(dāng)前領(lǐng)域是否存在這種可能性?或許我的說法過于簡化,但Transformer模型之所以勝出,部分原因正是其在GPU上的運(yùn)行效率極高:雖然循環(huán)神經(jīng)網(wǎng)絡(luò)表現(xiàn)相近,但在GPU上的運(yùn)行效率極其低下。這是否意味著我們?yōu)樘囟軜?gòu)選擇了模型,導(dǎo)致現(xiàn)在難以誕生真正突破性的新架構(gòu)?
Dylan Patel: 這本質(zhì)上是個(gè)軟硬件協(xié)同設(shè)計(jì)問題。雖然神經(jīng)形態(tài)計(jì)算備受矚目且理論能效極高,但既缺乏硬件生態(tài)也缺少軟件支持——需要數(shù)以萬計(jì)的頂尖AI人才共同投入才可能驗(yàn)證其價(jià)值,涉及硬件、軟件和模型三個(gè)層面的突破。觀察Grok、Cerebris、Samanova等企業(yè),其芯片設(shè)計(jì)都過度契合了開發(fā)時(shí)的主流模型架構(gòu)。這些公司選擇了特定的技術(shù)路線 (例如增加片上內(nèi)存) ,而NVIDIA則采取了截然不同的策略。
Guido Appenzeller: 至少速度優(yōu)勢明顯?
Dylan Patel: 更準(zhǔn)確地說,相比NVIDIA芯片的SRAM內(nèi)存容量,這些企業(yè)的配置要高出數(shù)個(gè)量級(jí)。
Guido Appenzeller: 他們選擇SRAM而非DRAM的方案,但通常DRAM容量會(huì)更少——這里存在明顯的技術(shù)權(quán)衡。
Dylan Patel: 確實(shí)如此——DRAM更少,SRAM更多,但片上SRAM的增加必然擠占計(jì)算單元空間,這最終導(dǎo)致其方案失效。因?yàn)槟P鸵?guī)模持續(xù)擴(kuò)大,這些企業(yè)陷入了一種悖論:他們押注的技術(shù)方向本身更優(yōu) (例如Cerebris運(yùn)行特定模型的能力確實(shí)超越NVIDIA,Grok或特斯拉Dojo在特定任務(wù)上也優(yōu)于NVIDIA芯片) ,但當(dāng)視覺任務(wù)普遍轉(zhuǎn)向Vision Transformer時(shí),由于模型規(guī)模膨脹,?specialized優(yōu)化反而成為制約。
新一代AI加速器公司試圖為Transformer架構(gòu)優(yōu)化,但設(shè)計(jì)之初基于的假設(shè) (隱藏維度8K、特定批量大小和序列長度) 與實(shí)際情況脫節(jié)。實(shí)驗(yàn)室實(shí)際運(yùn)行的模型維度更小,需要的是大量小型矩陣乘法而非巨型單層矩陣運(yùn)算。這使得專為假設(shè)場景設(shè)計(jì)的芯片實(shí)際效率低下。
軟件生態(tài)正持續(xù)圍繞NVIDIA硬件最優(yōu)解演進(jìn)——從DeepSeek、阿里巴巴到各大實(shí)驗(yàn)室的內(nèi)部實(shí)踐莫不如此。甚至谷歌的開源Gemma模型也因TPU與GPU架構(gòu)差異而做出不同技術(shù)選擇。盡管Blackwell架構(gòu)與TPU看似差異巨大,實(shí)則設(shè)計(jì)理念正在趨同。
作為挑戰(zhàn)者,僅擁有供應(yīng)鏈優(yōu)勢遠(yuǎn)遠(yuǎn)不夠 (畢竟缺乏自有客戶群體) ,必須在特定負(fù)載上實(shí)現(xiàn)5倍硬件效率優(yōu)勢,同時(shí)還要祈禱技術(shù)路線不會(huì)突變 ——因?yàn)镹VIDIA每年都在架構(gòu)迭代 (針對(duì)現(xiàn)有模型持續(xù)優(yōu)化) 。挑戰(zhàn)者必須進(jìn)行激進(jìn)的技術(shù)冒險(xiǎn),期待模型發(fā)展路徑與自己的設(shè)計(jì)保持同步。畢竟NVIDIA擁有供應(yīng)鏈效率、制程節(jié)點(diǎn)與內(nèi)存技術(shù)的先發(fā)優(yōu)勢:即使AMD率先采用2納米工藝、更高密度HBM和3D堆疊等本應(yīng)領(lǐng)先的技術(shù),最終仍難以撼動(dòng)其地位。
Guido Appenzeller: 軟件層面仍是關(guān)鍵優(yōu)勢——NVIDIA的軟件生態(tài)確實(shí)卓越。
Dylan Patel: 確實(shí)如此。但問題在于: NVIDIA在網(wǎng)絡(luò)技術(shù)、HBM內(nèi)存、制程工藝等方面都具備領(lǐng)先優(yōu)勢 ;他們能更快推出新品、更快實(shí)現(xiàn)量產(chǎn);在與臺(tái)積電、SK海力士等芯片制造商、內(nèi)存供應(yīng)商、服務(wù)器機(jī)架廠商乃至銅纜供應(yīng)商的談判中都擁有更強(qiáng)的成本控制能力。因此挑戰(zhàn)者必須在硬件效率上實(shí)現(xiàn)5倍優(yōu)勢才可能取勝。
Guido Appenzeller: 但公平地說,如果出現(xiàn)真正可行的競爭對(duì)手 (即使僅具備邊際成本優(yōu)勢) ,大多數(shù)GPU大客戶都會(huì)立即分流部分訂單以培育第二供應(yīng)商。
Dylan Patel: 這就是AMD和微軟當(dāng)前的處境。
Guido Appenzeller: 某種程度上確實(shí)如此,但市場接納度仍然相當(dāng)有限。
Dylan Patel: 但現(xiàn)實(shí)是:Meta仍在持續(xù)采購NVIDIA產(chǎn)品。微軟曾批量購買AMD芯片但最終停止——因?yàn)楸M管AMD具備某些優(yōu)勢,但在能效比層面始終未能超越,且NVIDIA擁有規(guī)模更大的軟件團(tuán)隊(duì)。AMD在我提到的所有維度都只能做到有限競爭。因此挑戰(zhàn)者不能簡單重復(fù)NVIDIA的路徑或試圖像AMD那樣通過執(zhí)行力取勝,必須實(shí)現(xiàn)技術(shù)范式的跨越。但芯片設(shè)計(jì)周期過長導(dǎo)致模型架構(gòu)早已演進(jìn):當(dāng)你在設(shè)計(jì)針對(duì)當(dāng)前模型的芯片時(shí),下一代GPU已經(jīng)在定義新的優(yōu)化方向。
研究路徑同樣面臨困境:雖然神經(jīng)形態(tài)計(jì)算可能是終極方案,但無人真正投入——因?yàn)榧夹g(shù)發(fā)展具有路徑依賴性。 如果另起爐灶重啟技術(shù)路線,將面臨巨大風(fēng)險(xiǎn)。一旦主流技術(shù)走向與你選擇的分支偏離,所有投入都將付諸東流。供應(yīng)鏈因素會(huì)使5倍優(yōu)勢縮水至2.5倍;如果真構(gòu)成威脅,NVIDIA只需略微壓縮利潤率就能讓2.5倍優(yōu)勢變?yōu)閮H50%領(lǐng)先。再加上軟件生態(tài)的差距,最終實(shí)際優(yōu)勢可能只剩50%——這根本不足以顛覆市場格局。
三、美國的電力瓶頸與數(shù)據(jù)中心擴(kuò)張的戰(zhàn)略博弈
Erin Price-Wright: 國防供應(yīng)鏈因素也不容忽視。
Dylan Patel: 確實(shí)涉及國防供應(yīng)鏈。正如Lutnick本人所言——我們?cè)谙⊥恋V產(chǎn)領(lǐng)域不得不采取類似策略。
Erin Price-Wright: 關(guān)鍵在于:能效問題在中國的優(yōu)先級(jí)遠(yuǎn)低于美國,因?yàn)樗麄儞碛凶銐驈?qiáng)大的電力基礎(chǔ)設(shè)施支持。即使使用性能較低的芯片,中國近乎無限的電力供應(yīng)也能完全消化這些能耗——這種差異使得能效標(biāo)準(zhǔn)在中國呈現(xiàn)出完全不同的價(jià)值評(píng)估體系。
Dylan Patel: 這在美國確實(shí)構(gòu)成重大挑戰(zhàn)。正如Jensen反復(fù)強(qiáng)調(diào)的——即使免費(fèi)贈(zèng)送H20芯片在美國也無人問津。我親耳聽到企業(yè)表示:受限于電力配額,即便免費(fèi)獲得H20芯片,其算力密度反而會(huì)導(dǎo)致整體計(jì)算能力下降,這種交易根本不合理。這種能源政策與芯片戰(zhàn)略的互動(dòng)關(guān)系將如何演變,確實(shí)值得深入觀察。
Erin Price-Wright: 那么中國是否在限制AI算力發(fā)展?
Dylan Patel: 我認(rèn)為并非如此。中國并非主動(dòng)限制算力,而是面臨資本效率問題:雖然中國企業(yè)在資本支出增長率上超過美國企業(yè),但由于芯片性能差距,單位美元投入產(chǎn)生的AI輸出 (token等) 仍然較低。真正的制約因素始終是資本配置效率。
中國完全具備加大投入的能力:每年通過國有企業(yè)和非收益性資本支出向半導(dǎo)體行業(yè)補(bǔ)貼約1500-2000億美元。既然Meta和谷歌的資本支出分別達(dá)到600億和800億美元,中國完全可以在AI生態(tài)投入更多資金,只是尚未決策這樣做。 而對(duì)美國而言,實(shí)際制約確實(shí)是電力基礎(chǔ)設(shè)施 :谷歌大量TPU等待數(shù)據(jù)中心供電落地,Meta的GPU也面臨同樣問題——他們甚至開始搭建臨時(shí)帳篷式數(shù)據(jù)中心來應(yīng)對(duì)電力瓶頸。
Guido Appenzeller: 這是否也與其不愿向更廣泛生態(tài)銷售芯片有關(guān)?如果他們堅(jiān)持將芯片限定在自有數(shù)據(jù)中心使用,同時(shí)又未能及時(shí)為超大規(guī)模需求擴(kuò)建數(shù)據(jù)中心,確實(shí)會(huì)形成制約。但若開放市場供應(yīng),這種約束是否還會(huì)存在?
Dylan Patel: 確實(shí)如此。以CoreWeave為例,其核心價(jià)值在于快速部署基礎(chǔ)設(shè)施的能力——雖然軟件體驗(yàn)良好,但多數(shù)客戶實(shí)際采用裸金屬服務(wù):只需在GPU故障時(shí)及時(shí)更換并確保網(wǎng)絡(luò)配置正確即可。這種模式之所以成立,正是因?yàn)槠浣鉀Q了基礎(chǔ)設(shè)施的敏捷供應(yīng)問題。
Guido Appenzeller: 他們的擴(kuò)張更激進(jìn)。
Erik Torenberg: 而且不設(shè)地域限制。
Guido Appenzeller: 公平地說,Jensen也很認(rèn)可他們。
Dylan Patel: 確實(shí)如此。這種去中心化的生態(tài)布局對(duì)NVIDIA反而更有利。關(guān)鍵在于CoreWeave這類企業(yè)完全不受傳統(tǒng)約束:他們能將加密礦場改造為AI數(shù)據(jù)中心——曾以100億美元收購估值僅20億美元的加密礦業(yè)公司,看中的正是其電力基礎(chǔ)設(shè)施資源。當(dāng)前全球都在爭相建設(shè)電力數(shù)據(jù)中心,CoreWeave和Oracle等公司正全力推進(jìn)此事。事實(shí)上,谷歌今日剛收購了加密礦業(yè)公司TeraWolf 8%的股權(quán)。
Erin Price-Wright: 并非因?yàn)橐孀慵用茇泿磐诘V,而是需要數(shù)據(jù)基礎(chǔ)設(shè)施。 他們真正需要的是電力資源。
Dylan Patel: 他們迫切需要電力資源。 所有超大規(guī)模企業(yè)都已暫時(shí)擱置可持續(xù)發(fā)展承諾——因?yàn)楫?dāng)前最緊迫的是獲取電力。 即便不在自建數(shù)據(jù)中心實(shí)施,開放市場仍存在諸多挑戰(zhàn): 電力短缺正在嚴(yán)重制約美國的芯片部署。
雖然CoreWeave等企業(yè)可能推進(jìn)得更快,Oracle也持開放態(tài)度,但美國整體的基礎(chǔ)設(shè)施建設(shè)仍受嚴(yán)重制約。盡管資本已經(jīng)投入 (芯片成本占集群總成本的60%-80%) ,但采購的芯片無處部署——數(shù)據(jù)中心準(zhǔn)備進(jìn)度遠(yuǎn)遠(yuǎn)跟不上。這個(gè)問題困擾著谷歌、微軟、Meta等眾多企業(yè)。
Erin Price-Wright: 美國電力基礎(chǔ)設(shè)施建設(shè)確實(shí)面臨巨大困難。
Dylan Patel: 電力、電網(wǎng)互聯(lián)、輸電系統(tǒng)、變電站——所有這些環(huán)節(jié)都存在問題。德州的電工行業(yè)就是典型:如果你愿意成為流動(dòng)電工,收入可比石油行業(yè)。過去在西德州,體力勞動(dòng)者能賺到十萬美元,但現(xiàn)在情況更夸張:在達(dá)拉斯200英里外的城鎮(zhèn)建設(shè)數(shù)據(jù)中心,從事布線、傳輸系統(tǒng)等工作,薪資比幾年前翻了一番。勞動(dòng)力短缺同樣是嚴(yán)峻挑戰(zhàn)。
中國雖然不存在這些問題,但他們尚未大規(guī)模投入資本。而資本本身也是問題:NVIDIA今年?duì)I收將超2000億美元,明年預(yù)計(jì)突破3000億;谷歌將在TPU數(shù)據(jù)中心投入約500億美元;亞馬遜也為Tranium數(shù)據(jù)中心投入巨額資金。這種資本規(guī)模已接近國家級(jí)別,關(guān)鍵不在于能否支出,而在于如何實(shí)現(xiàn)成本效益最大化。
四、數(shù)據(jù)中心動(dòng)力與冷卻系統(tǒng):下一代發(fā)展瓶頸
Guido Appenzeller: 那么數(shù)據(jù)中心的終極形態(tài)是什么?我們需要更多電力、更高效的冷卻系統(tǒng)——未來所有數(shù)據(jù)中心是否會(huì)建在核反應(yīng)堆旁邊?或是依賴太陽能,甚至利用深海進(jìn)行冷卻?
Dylan Patel: 關(guān)于數(shù)據(jù)中心冷卻的討論存在過度渲染。AI的能耗被嚴(yán)重夸大——事實(shí)上,紫花苜蓿種植的耗水量是AI數(shù)據(jù)中心的100倍,到2030年這一比例仍將維持。而苜蓿的經(jīng)濟(jì)價(jià)值卻微乎其微。雖然有人嘗試海底數(shù)據(jù)中心以降低冷卻成本,但這種方式僅能節(jié)省5-10%的成本,實(shí)際意義有限。真正的解決方案不在于極端環(huán)境部署,而在于優(yōu)化現(xiàn)有冷卻技術(shù)的效率與規(guī)模。
Guido Appenzeller: 但如果要將海水用于冷卻,何不直接將數(shù)據(jù)中心建在海底?
Dylan Patel: 這種方案面臨維護(hù)難題——一旦設(shè)備需要維修就會(huì)陷入困境。電力問題也是類似邏輯:電力本身成本并不高昂,真正的挑戰(zhàn)在于基礎(chǔ)設(shè)施建設(shè)。
Guido Appenzeller: 以及如何將電力輸送到所需位置。
Dylan Patel: 還需要解決空間布局、電壓轉(zhuǎn)換等芯片所需的配套問題。
Erin Price-Wright: 所以核心不在于總電量大小,而在于電力布局與傳輸效率。
Guido Appenzeller: 就全球能源消耗而言,AI數(shù)據(jù)中心的占比仍然不足百分之一。
Dy lan Patel :確實(shí)。 即便到2030年末,美國數(shù)據(jù)中心的電力消耗占比預(yù)計(jì)也僅達(dá)到10%左右。
Guido Appenzeller: 若計(jì)入全部能源消耗,比例會(huì)更低。其實(shí)電動(dòng)汽車普及對(duì)能源結(jié)構(gòu)的影響,可能遠(yuǎn)大于所有AI數(shù)據(jù)中心的能耗總和。
Dylan Patel: 但在歐洲等其他地區(qū),這個(gè)數(shù)字增長并不快。我們需要建設(shè)更多電力設(shè)施,但關(guān)鍵不在于數(shù)量突破,而在于如何科學(xué)規(guī)劃。雖然電價(jià)從每千瓦時(shí)幾美分飆升至10美分,但當(dāng)我們考慮TCL時(shí),集群建設(shè)中的GPU采購、網(wǎng)絡(luò)設(shè)備等支出仍遠(yuǎn)超過電力成本。冷卻系統(tǒng)也是類似情況。
Guido Appenzeller: 在四年攤銷的GPU數(shù)據(jù)中心成本中,電力占比是多少?
Dylan Patel: 若建設(shè)Blackwell架構(gòu)的數(shù)據(jù)中心,80%成本屬于資本性支出——包括GPU采購、網(wǎng)絡(luò)設(shè)備、數(shù)據(jù)中心物理改造及電力轉(zhuǎn)換設(shè)備。其余20%才是局域網(wǎng)、電力、冷卻系統(tǒng)、冷卻塔、備用電源及發(fā)電機(jī)等運(yùn)營成本。正因如此,即便這類成本增加10%或50%也影響有限。
這就解釋了為何馬斯克的做法看似荒謬卻合理:他們不惜成本在數(shù)據(jù)中心外部配置發(fā)電機(jī)和移動(dòng)冷卻器進(jìn)行液冷,而非選擇更經(jīng)濟(jì)的方案——因?yàn)樘崆叭齻€(gè)月建成數(shù)據(jù)中心帶來的額外訓(xùn)練時(shí)間價(jià)值,遠(yuǎn)超過增加的基礎(chǔ)設(shè)施成本。從TCO角度考量,芯片性能提升和更快的上市時(shí)間帶來的收益,完全證明這種決策的正確性。畢竟芯片閑置才是最大的浪費(fèi)。
Erin Price-Wright: 通過完全繞過電網(wǎng)、互聯(lián)系統(tǒng)和公共公用事業(yè)體系。
Dylan Patel: 完全正確。
Guido Appenzeller: 您如何看待Intel的發(fā)展前景?
Dylan Patel: 美國需要Intel的存在。
Erin Price-Wright: 我認(rèn)為世界需要Intel。
Dylan Patel:世界確實(shí)需要Intel。 根據(jù)行業(yè)多家客戶的測試芯片驗(yàn)證,我認(rèn)為三星在先進(jìn)制程研發(fā)方面甚至落后于Intel——行業(yè)普遍認(rèn)同Intel在2納米級(jí)工藝技術(shù)上比三星更先進(jìn),盡管兩家都遠(yuǎn)落后于臺(tái)積電。臺(tái)積電在某種程度上形成壟斷。最常被質(zhì)疑的是:為什么臺(tái)積電沒有賺取更多利潤?明年僅計(jì)劃漲價(jià)3%到10%。作為壟斷企業(yè),他們本可大幅提價(jià),但臺(tái)灣企業(yè)的經(jīng)營理念不同于“貪婪的美國資本家”。雖然臺(tái)積電在紐交所上市 (實(shí)際上大部分股權(quán)由美國持有) ,若由美國人管理,定價(jià)策略必然會(huì)更加激進(jìn)。
當(dāng)前困境在于全球最先進(jìn)的半導(dǎo)體產(chǎn)能 (包括多數(shù)成熟制程) 都集中在一個(gè)島嶼上。這種局面必須改變。Intel雖然落后,但差距并非不可逾越。只是從經(jīng)濟(jì)性角度而言,當(dāng)前格局并不合理。
Guido Appenzeller: 若要讓Intel保持競爭力,是否應(yīng)該將其拆分為多個(gè)獨(dú)立公司?
Dylan Patel: 拆分過程將消耗大量管理層時(shí)間和精力,等完成拆分公司可能早已破產(chǎn)。這才是最大挑戰(zhàn)—— 雖然從理論上Intel應(yīng)該分立,但實(shí)際拆分所需的管理資源投入是不切實(shí)際的。 當(dāng)前更需要的是CEO帕特·基爾辛格專注核心問題。作為史上最杰出的半導(dǎo)體投資人之一,他投資過多家先鋒企業(yè),這種跨極投資策略原本體現(xiàn)其全球視野,但現(xiàn)在卻引發(fā)爭議。事實(shí)上,他真正需要的是深入理解供應(yīng)鏈而非拆分公司,否則永遠(yuǎn)無法解決根本問題。
Intel的癥結(jié)在于從設(shè)計(jì)到產(chǎn)品交付需5-6年,有時(shí)更長。當(dāng)芯片完成流片后,他們往往需要14次修訂迭代,而行業(yè)領(lǐng)先企業(yè)通常只需1-3次修訂就能實(shí)現(xiàn)量產(chǎn)。其他企業(yè)三年內(nèi)就能完成芯片發(fā)布,Intel卻陷入無休止的修訂循環(huán)。
Guido Appenzeller: 那么縱觀Intel現(xiàn)狀,他們?cè)贏I領(lǐng)域仍缺乏競爭力產(chǎn)品,且短期內(nèi)難以突破。這對(duì)他們的市場定位意味著什么?雖然CPU業(yè)務(wù)表現(xiàn)良好,但缺乏優(yōu)秀的AI芯片產(chǎn)品——作為獨(dú)立芯片公司,這種定位是否具有長期可持續(xù)性?
Dylan Patel: IBM每次發(fā)布新主機(jī)都能賺取更多利潤,x86架構(gòu)也遠(yuǎn)未消亡。雖然無法獲得高增長率,但完全能作為盈利性業(yè)務(wù)持續(xù)運(yùn)營——PC業(yè)務(wù)也是同理。盡管面臨ARM架構(gòu)沖擊和AMD競爭,只要將人員規(guī)模縮減至三分之一或一半,這仍可成為高利潤業(yè)務(wù)。
帕特·基爾辛格要拯救Intel必須雙管齊下: 在設(shè)計(jì)部門進(jìn)行大規(guī)模裁員但保留核心人才,確保從設(shè)計(jì)到發(fā)布的周期壓縮至2-3年 (而非5-6年) ;在晶圓廠同樣需要精簡架構(gòu)。 我曾直接向他指出:公司存在荒謬的四層管理體系,某fab自動(dòng)化負(fù)責(zé)人從未與他直接溝通——經(jīng)過實(shí)地考察后,這位低效管理者已被辭退。
Intel大部分團(tuán)隊(duì)曾引領(lǐng)全球生產(chǎn)工藝20年,但積累了太多冗余。基爾辛格需要甄別優(yōu)劣、清理冗余,而非將時(shí)間浪費(fèi)在拆分架構(gòu)上。雖然拆分理論上更合理,但現(xiàn)實(shí)是他必須優(yōu)先解決:如何獲取資本、提升良率、加速產(chǎn)品交付——這些基本問題不解決,等不到轉(zhuǎn)型完成公司就可能破產(chǎn)。
Guido Appenzeller: 我認(rèn)為這些目標(biāo)完全正確。但根據(jù)我此前在Intel的觀察,最大挑戰(zhàn)在于其三大業(yè)務(wù)板塊——軟件、芯片設(shè)計(jì)和核心制造——存在著截然不同的企業(yè)文化。將如此多元的文化體系整合在統(tǒng)一架構(gòu)下運(yùn)營,確實(shí)極具挑戰(zhàn)性。
Dylan Patel: 從運(yùn)營角度應(yīng)該分立公司,但實(shí)體拆分需要耗費(fèi)過長時(shí)間——基爾辛格根本沒有這個(gè)時(shí)間窗口。Intel若不能獲得大規(guī)模注資或裁員半數(shù)員工,破產(chǎn)將是必然結(jié)局。即便裁員30%本屬必要,但引發(fā)的連鎖反應(yīng)也將造成嚴(yán)重沖擊。
更緊迫的是即便完成制造工藝改進(jìn),他們?nèi)孕枰揞~資金建設(shè)下一代晶圓廠——而這正是Intel無力承擔(dān)的。相比實(shí)體拆分,這些才是更致命的問題。雖然長期看制造業(yè)務(wù)必須與芯片設(shè)計(jì)軟件分離 (這樣能增強(qiáng)各實(shí)體的責(zé)任意識(shí)并提升客戶服務(wù)能力) ,但等到拆分完成時(shí)公司早已破產(chǎn)。
唯一希望是獲得大規(guī)模資本注入:如果超大規(guī)模企業(yè)們意識(shí)到臺(tái)積電壟斷可能導(dǎo)致毛利率升至75% (加上共封裝光學(xué)、供電系統(tǒng)等附加成本最終推高總成本) ,或許會(huì)聯(lián)合向Intel各注資50億美元。這種生命線或許能讓Intel獲得喘息之機(jī),最終重塑競爭力——這已是最后的希望。
五、科技巨頭戰(zhàn)略建言
Erik Torenberg: 如果Jensen此刻在這里,您會(huì)給他什么建議?
Dylan Patel: 他手握巨額資產(chǎn)負(fù)債表——自由現(xiàn)金流驚人。新特朗普稅法案允許GPU集群成本在第一年全額折舊 (我們?cè)治鲞^這對(duì)Meta意味著每年100億美元的稅務(wù)影響) ,各大超大規(guī)模企業(yè)都將獲得巨大稅務(wù)優(yōu)惠。既然NVIDIA原本就要支付數(shù)百億美元稅款,何不借此進(jìn)軍基礎(chǔ)設(shè)施領(lǐng)域?雖然這看似瘋狂 (畢竟要自購GPU建設(shè)數(shù)據(jù)中心,與客戶形成競爭) ,但客戶本身已在自研芯片。 他們應(yīng)該通過投資加速數(shù)據(jù)中心生態(tài)建設(shè)——因?yàn)槲覀兡芟鄬?duì)準(zhǔn)確地預(yù)測其明年收入:這本質(zhì)上取決于數(shù)據(jù)中心建設(shè)進(jìn)度 。
現(xiàn)在需要在TPU與GPU之間分配份額,但關(guān)鍵是必須加速基礎(chǔ)設(shè)施投入。與其進(jìn)行股票回購和分紅 (這種保守策略注定失敗) ,不如將資本再投資,構(gòu)建超越芯片和服務(wù)器的端到端基礎(chǔ)設(shè)施控制能力。憑借這筆巨額資金,他完全可以向基礎(chǔ)設(shè)施層深度拓展——若真想成為世界之王 (我相信這是他的目標(biāo)) ,這就是最佳路徑。畢竟到今年底,NVIDIA現(xiàn)金儲(chǔ)備將超1000億美元,這些資金需要找到更戰(zhàn)略性的用途。
Guido Appenzeller: 那么對(duì)Sergey和Sundar有什么建議?
Dylan Patel: 我認(rèn)為他們應(yīng)該全面開放TPU技術(shù)——開始對(duì)外銷售芯片,開源更多XLA軟件 (目前開放部分有限) ,真正實(shí)現(xiàn)技術(shù)透明化并采取更激進(jìn)策略。谷歌在數(shù)據(jù)中心建設(shè)和公司多個(gè)領(lǐng)域都顯得過于保守,TPU團(tuán)隊(duì)的下一代設(shè)計(jì)也缺乏突破性,部分原因是最優(yōu)秀的成員已流向OpenAI (我認(rèn)識(shí)的五名頂尖人才全部離職) 。
如果他們不積極應(yīng)對(duì),ChatGPT和AI代理對(duì)可?monetize?搜索查詢的侵蝕將長期損害谷歌業(yè)務(wù)。雖然DeepMind方面已有所改善 (謝爾蓋深度參與其中) ,但在物理基礎(chǔ)設(shè)施和TPU商業(yè)化方面仍落后。若能對(duì)外銷售TPU并重組數(shù)據(jù)中心建設(shè)體系 (重新奪回算力優(yōu)勢) ,本可壓制競爭對(duì)手發(fā)展勢頭。但現(xiàn)在若再不行動(dòng),某些企業(yè)可能在幾年內(nèi)實(shí)現(xiàn)超越。此外——他們還需要學(xué)會(huì)如何高效交付產(chǎn)品。
Erik Torenberg: 那Zuck呢?
Dylan Patel: 超智能的發(fā)展尚未可知,但他們?cè)跀?shù)據(jù)中心建設(shè)上確實(shí)展現(xiàn)了驚人速度:寧愿搭建臨時(shí)帳篷也不等待傳統(tǒng)數(shù)據(jù)中心,畢竟這些設(shè)施可能五年后就會(huì)過時(shí)。雖然收購思維公司 (Thinking) 或SSI的300億美元計(jì)劃未能實(shí)現(xiàn),但他們用更少的成本招募了大量人才。
Zuck顯然認(rèn)識(shí)到模型與基礎(chǔ)設(shè)施的緊迫性。從他關(guān)于AI的公開論述可以看出其戰(zhàn)略視野:可穿戴設(shè)備、AI集成、購物助手等規(guī)劃都很清晰。但他需要加速產(chǎn)品落地——目前核心IP之外的產(chǎn)品發(fā)布總是差強(qiáng)人意。Meta Reality Labs表現(xiàn)尚可,但應(yīng)該更明確地推出ChatGPT競品、Claude Code替代方案等更多產(chǎn)品,而不是始終局限在自有生態(tài)內(nèi)。
Guido Appenzeller: 您認(rèn)為蘋果是否應(yīng)該具備同樣的緊迫感?如果Tim Cook在場,您會(huì)給他什么建議?
Dylan Patel: 有趣的是,他們最優(yōu)秀的AI人才正在流向Superintelligence——這些人正在開發(fā)AI加速器。蘋果雖然擁有AI模型,但進(jìn)展實(shí)在太慢。盡管在上次財(cái)報(bào)電話會(huì)議中提及將增加相關(guān)資本支出,但現(xiàn)實(shí)是:如果不大規(guī)模投入500億到1000億美元建設(shè)基礎(chǔ)設(shè)施,蘋果很可能錯(cuò)失這班航船。
Guido Appenzeller: 您認(rèn)為當(dāng)前的Siri不足以應(yīng)對(duì)挑戰(zhàn)嗎?
Dylan Patel:蘋果的封閉生態(tài)確實(shí)能提供一定保護(hù),但這種保護(hù)是有限的。 就像IDFA政策——他們切斷了與Meta的數(shù)據(jù)共享,但Meta反而構(gòu)建了更強(qiáng)大的模型,現(xiàn)在比以往任何時(shí)候都擁有更多用戶數(shù)據(jù)和影響力。Meta被逼擺脫依賴后反而變得更強(qiáng),AI領(lǐng)域也會(huì)重演這個(gè)模式。
雖然蘋果能獲取用戶文本等數(shù)據(jù),但其他企業(yè)將通過AI agent整合更全面的用戶數(shù)據(jù)。當(dāng)AI逐漸取代觸控板鍵盤成為主要交互界面時(shí),蘋果對(duì)用戶體驗(yàn)的控制權(quán)將逐漸流失——他們似乎尚未真正意識(shí)到“以AI為計(jì)算接口”意味著什么。雖然營銷話術(shù)提及這一點(diǎn),但這對(duì)計(jì)算范式的顛覆遠(yuǎn)超想象。蘋果擁有頂尖硬件團(tuán)隊(duì)和出色的產(chǎn)品形態(tài),但我不確定他們是否真正理解未來五年世界將如何演變——更關(guān)鍵的是,他們的建設(shè)速度遠(yuǎn)遠(yuǎn)跟不上時(shí)代變革。
Guido Appenzeller: 那么微軟在這方面表現(xiàn)如何?
Dylan Patel: 微軟面臨同樣問題。他們?cè)?023和2024年非常激進(jìn),但隨后大幅收縮——現(xiàn)在OpenAI正逐漸脫離掌控,數(shù)據(jù)中心投資也被大幅削減。他們本可能成為全球最大基礎(chǔ)設(shè)施企業(yè) (規(guī)模兩倍于現(xiàn)狀) ,雖然有人認(rèn)為這種擴(kuò)張可能不經(jīng)濟(jì),但現(xiàn)實(shí)是:他們正在失去對(duì)OpenAI的控制,內(nèi)部模型研發(fā)也遭遇重大挫折。
雖然在LLM競技場表現(xiàn)尚可,但MAI項(xiàng)目已經(jīng)失敗。Azure市場份額正被Oracle、CoreWeave和谷歌等企業(yè)侵蝕。其自研芯片項(xiàng)目在超大規(guī)模企業(yè)中表現(xiàn)最差,執(zhí)行層面問題重重。最令人費(fèi)解的是:擁有最強(qiáng)代碼模型的GitHub為何沒能成為年度經(jīng)常性收入最高的軟件平臺(tái)?
Guido Appenzeller: 他們擁有最優(yōu)秀的IDE、最完善的源代碼倉庫、最強(qiáng)的企業(yè)客戶關(guān)系 (包括與Salesforce的合作) ,最早進(jìn)入市場——可謂占盡先機(jī)。
Dylan Patel: 但現(xiàn)在這些優(yōu)勢正在消失。GitHub Copilot表現(xiàn)不及預(yù)期,Microsoft Copilot仍然糟糕。公司急需徹底整頓——雖然憑借強(qiáng)大的企業(yè)客戶關(guān)系還能維持優(yōu)勢,但若沒有真正具有競爭力的產(chǎn)品支撐,這種局面令人擔(dān)憂。薩提亞在銷售端做得很好,但現(xiàn)在必須聚焦產(chǎn)品力提升。
Guido Appenzeller: 如果是馬斯克在場,您會(huì)給他什么建議?
Dylan Patel: xAI團(tuán)隊(duì)許多人對(duì)擦邊內(nèi)容模型感到不滿,但這其實(shí)能帶來巨額收益——正是加速公司收入增長的關(guān)鍵路徑。雖然馬斯克流失了大量人才并砍掉優(yōu)秀項(xiàng)目,但他始終是頂尖人才的磁石和創(chuàng)造者,因此我不會(huì)賭他失敗。自他重新專注于產(chǎn)品后,Robotaxi項(xiàng)目似乎重現(xiàn)曙光 (我尚未親身體驗(yàn),但試過的朋友反饋不錯(cuò)) 。需要注意的是:那些曾造就他輝煌的即時(shí)決策,有些現(xiàn)在反而造成損害。或許我能給的建議是更聚焦核心產(chǎn)品——盡管他確實(shí)已在這樣做。
原視頻:Dylan Patel on GPT-5’s Router Moment, GPUs vs TPUs, Monetizationhttps://www.youtube.com/watch?v=xWRPXY8vLY4
本文來自微信公眾號(hào): Z Finance ,編譯:Xinyue Wan