AI時(shí)代的端、體裁和商業(yè)模式
一
我們處在一個(gè)有趣的歷史節(jié)點(diǎn)上:新的技術(shù) (AI) 已經(jīng)出現(xiàn),但是新的端 (電腦/手機(jī)/耳機(jī)/手表/眼鏡……) 尚未出現(xiàn)。
過去30年有兩個(gè)大的浪潮:一個(gè)是PC互聯(lián)網(wǎng) (1995-2009) ,一個(gè)是移動(dòng)互聯(lián)網(wǎng) (2010-2020) 。有趣的是,“端”都出現(xiàn)在了時(shí)代的命名里,這符合考古學(xué)用生產(chǎn)工具來命名一個(gè)時(shí)代的做法,如石器時(shí)代/鐵器時(shí)代。1000年后,人們挖出來的大概率是電腦和手機(jī),而不是無形的互聯(lián)網(wǎng)技術(shù)。
技術(shù)是重要的。有人叫即將到來的時(shí)代“AI時(shí)代”,用技術(shù)來命名一個(gè)時(shí)代符合慣例,與用互聯(lián)網(wǎng)技術(shù)來命名“互聯(lián)網(wǎng)時(shí)代”是一樣的。
但是,在技術(shù)之下,端同樣是重要的。互聯(lián)網(wǎng)技術(shù)從1969年的阿帕網(wǎng)就有了,但是端卻局限為大學(xué)和軍隊(duì)的大型電腦。一直等到1990年代,互聯(lián)網(wǎng)技術(shù)與逐漸開始普及的PC機(jī)結(jié)合,互聯(lián)網(wǎng)才真正成為一個(gè)時(shí)代。
站在2025年,我們發(fā)現(xiàn)一個(gè)最大的問題:ChatGPT等新應(yīng)用,基本還是長在原來的端——電腦和手機(jī)上。
Meta在2021年探索了智能眼鏡,字節(jié)在2024年探索了智能耳機(jī)。再早很多年 (2015年) ,出門問問探索過智能手表 (Apple Watch的智能做得不好是非常可惜的) 。但截至目前,這些都還沒能成為足夠普及的新的端。
我認(rèn)為:新的端的出現(xiàn)才是進(jìn)入一個(gè)新的時(shí)代的標(biāo)志,因此,我不覺得我們已經(jīng)進(jìn)入了AI時(shí)代。
二
Chat是AI時(shí)代的新體裁。從歷史看,體裁會(huì)先于端出現(xiàn)。人們對新體裁的采納,導(dǎo)致生產(chǎn)工具用進(jìn)廢退,從而推動(dòng)了新端取代舊端。
把Chat視作一種內(nèi)容體裁,與長視頻、圖文、短視頻、直播等等體裁放在一起討論,好像還沒什么人這么做過。
所謂體裁,用另外的話說是內(nèi)容的形式。我之所以更喜歡用體裁這個(gè)詞,是因?yàn)樗玫匕凳玖诵问綄?nèi)容的限制性,他就像一個(gè)人的外殼,限制了人但也定義了人。
即時(shí)通信比如QQ、YY、微信 (WeChat) 在互聯(lián)網(wǎng)時(shí)代就一直存在。但是即時(shí)通信一直無法成為一種內(nèi)容體裁,而只是工具。原因是:內(nèi)容的背后是創(chuàng)作者。在即時(shí)通信里,人與人是等價(jià)的,不存在創(chuàng)作者和用戶。
直播連麥已經(jīng)是Chat的雛形,但是在沒有AI的情況下,這種一對一的形式規(guī)模做不大。如果一對多那就屬于直播、而不算Chat了。
大模型使規(guī)模化Chat成為可能。按理來說,大模型可以應(yīng)用于一切領(lǐng)域,但是值得想一下,為什么ChatGPT是大模型第一個(gè)跑出來的App?因?yàn)镃hat這種體裁對大模型技術(shù)的應(yīng)用最純粹,不是大模型+。就像在互聯(lián)網(wǎng)時(shí)代跑出來的真正大公司,都是做信息分發(fā)的,這是對互聯(lián)網(wǎng)技術(shù)最純粹的應(yīng)用,而不是做互聯(lián)網(wǎng)+的公司 (例如貝殼) 。
應(yīng)用及其體裁先于端出現(xiàn),這種情況在歷史上并不少見。可適應(yīng)移動(dòng)互聯(lián)網(wǎng)的產(chǎn)品人人網(wǎng) (校內(nèi)網(wǎng)) 2005年上線,新浪微博2009年上線,知乎2010年上線。與后來的今日頭條、抖音不同,他們都不是移動(dòng)原生公司,而是一開始從做PC網(wǎng)頁開始的。
人人網(wǎng)的狀態(tài)/日志、140字微博、問答這些新體裁的出現(xiàn),搶占了用戶時(shí)長。我2010年剛上大一的時(shí)候,在PC上主要消費(fèi)長視頻、博客、BBS帖子等內(nèi)容,后來大量時(shí)間就在水人人、微博、知乎了 (尤其是人人) 。
工具是用進(jìn)廢退的,此時(shí)我對端的屏幕大小、信息處理速度等要求其實(shí)都下降了。水人人、知乎,用手機(jī)足夠了。因此,對我而言,體裁的遷移,促進(jìn)了端的遷移。
林軍《沸騰新十年》里提到,新浪網(wǎng)前總編輯陳彤曾告訴他,微博是移動(dòng)互聯(lián)網(wǎng)時(shí)代的第一個(gè)產(chǎn)品。有早期的蘋果粉去香港買iPhone,發(fā)現(xiàn)蘋果手機(jī)都被搶光了,說是都被玩新浪微博的人買走了。
從這段簡短的論述中我解讀出2個(gè)信息:一是新的時(shí)代的第一個(gè)應(yīng)用可能會(huì)是雙棲的,而不是新端原生的,甚至一開始會(huì)主要在老端上,二是新的應(yīng)用,會(huì)刺激人們購買新的端。
以此推演,ChatGPT很可能成為類似微博的存在——AI時(shí)代的第一個(gè)產(chǎn)品,但是并不是新端原生的,而是一開始主要在電腦和手機(jī)這樣的老端上使用,但是等到ChatGPT占據(jù)人們足夠的時(shí)長后,人們突然發(fā)現(xiàn),如果絕大多數(shù)時(shí)間都是以語音的形式與ChatGPT對話,自己好像也不需要手機(jī)屏幕了,更貼身的手表和耳機(jī)可能是更好的選擇。于是人們開始大量購買手表和耳機(jī),接下來,手表和耳機(jī)的原生應(yīng)用會(huì)出現(xiàn),會(huì)用到新的端獨(dú)有的傳感器 (就像微信搖一搖用到了手機(jī)的陀螺儀) 。
順便說一句,這里我投手表一票。手表與人足夠近,可以成為我們身體的一部分,同時(shí)異物感又沒有那么重。
三
體裁很重要,因?yàn)轶w裁決定了商業(yè)模式。
每個(gè)時(shí)代都有每個(gè)時(shí)代的體裁。PC互聯(lián)網(wǎng)時(shí)代的體裁是長視頻、博客、BBS帖子等。移動(dòng)互聯(lián)網(wǎng)時(shí)代的體裁是微博圖文、短視頻、直播。AI時(shí)代的體裁則是Chat。
這里順便說一下,我認(rèn)為百度之所以在移動(dòng)互聯(lián)網(wǎng)時(shí)代掉隊(duì),不是因?yàn)榘俣缺旧懋a(chǎn)品形態(tài)不適合移動(dòng)互聯(lián)網(wǎng),相反,一個(gè)搜索框的產(chǎn)品形態(tài)是最適合移動(dòng)端的。核心問題是,人們使用百度搜索,搜索出來的結(jié)果的內(nèi)容體裁是什么,這些體裁是否適應(yīng)移動(dòng)端。根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心《2011年中國搜索引擎用戶行為研究報(bào)告》,用戶使用搜索引擎主要的搜索內(nèi)容前5名是新聞、視頻、音樂、學(xué)術(shù)資料、小說。因?yàn)榘俣戎蛔鲂畔⒎职l(fā),很長時(shí)間沒有自己做內(nèi)容 (2016年百家號才上線) ,而用戶搜索的前幾名內(nèi)容體裁,都不一定適用移動(dòng)端。這可能才是百度在移動(dòng)互聯(lián)網(wǎng)時(shí)代掉隊(duì)的根本原因。啟示是進(jìn)入新時(shí)代一定不要只做分發(fā),要參與到新體裁的定義中,并盡早切入創(chuàng)作者生態(tài)。
如果我們把各種體裁,按是不是自然語言的程度排布,最左邊應(yīng)該是學(xué)術(shù)資料 (表格、PPT、專業(yè)書籍) 、然后可能是小說 (我已經(jīng)很久沒看小說了,讀小說樂趣挺高,但是需要的腦力投入太大) 、長視頻 (我在電腦上看電影的一般做法都是暫停,理解一會(huì)兒,然后繼續(xù),看電影至今對我來說都是一件太燒腦的事) ,然后依次是博客長文、BBS帖子、微博圖文、短視頻和直播。短視頻的親民程度是驚人的,也是截至目前用戶規(guī)模最大的內(nèi)容體裁 (抖音有7億日活,微信雖然10億日活,但是如果只算消費(fèi)內(nèi)容的人,用戶應(yīng)該沒有抖音多) 。而直播,則可以說是最易于一般人類理解的內(nèi)容體裁了。這里出于適應(yīng)Chat這個(gè)新體裁的旨趣,部分也出于懶惰,我就不畫圖了,請大家自行腦補(bǔ),進(jìn)行文生圖。
這個(gè)光譜越往左,信息密度越高,對腦力的耗費(fèi)越高,潛在用戶規(guī)模越小。越往右,信息密度越低,對腦力耗費(fèi)越小,潛在用戶規(guī)模越大。
Chat是最自然語言的,理論上講潛在用戶規(guī)模是最大的。所以,像Kimi那樣致力于生成專業(yè)內(nèi)容、目標(biāo)用戶定位很高的路徑很可能是錯(cuò)誤的。而像豆包那樣回復(fù)較短內(nèi)容,且致力于做語音對話、視頻通話等更貼近人類的功能,做下沉用戶的路徑,可能是正確的。理論上講,豆包應(yīng)該可以覆蓋掉抖音都玩不明白的人,日活規(guī)模上限是14億。
商業(yè)模式就是給目標(biāo)用戶提供了什么價(jià)值,通過什么方式變現(xiàn)的問題。這之間往往存在取舍:是為少數(shù)人提供重度服務(wù),還是為多數(shù)人提供沒那么重度的服務(wù)?
Chat雖然目標(biāo)用戶規(guī)模更大,但不一定適合提供重度服務(wù)。以電商為例,目前多數(shù)電商平臺的PC端的客單價(jià)還是高于移動(dòng)端,這是因?yàn)楫?dāng)人們需要做出裝修、購買大家電等重度決策的時(shí)候,仍然會(huì)在PC端查閱資料,進(jìn)行詳細(xì)的比較。但如果從GMV占比看,還是移動(dòng)端占比高,因?yàn)橐苿?dòng)端可以足夠覆蓋所有不需要重度決策的購物,而且這些購物雖然客單價(jià)低,但是是更高頻的,所以總消費(fèi)金額反而更高。
以此推演,未來的電商盤子分配可能是:Chat搶占了更低決策需求、更高頻的部分:比如每天買菜,其實(shí)就是補(bǔ)貨,可能不需要什么挑選,口頭告訴AI語音助手一聲要買什么就行了;此外還有買標(biāo)品的場景,比如充話費(fèi)、買火車票,也不需要決策什么,AI直接幫我們買了就行。還有一種情況:人們在決策的時(shí)候因?yàn)檫x擇太多而陷入選擇困難癥,其實(shí)多數(shù)人沒有那么追求決策的完美,差不多滿意就行,如果這個(gè)決策是可逆的 (比如可以退貨) ,與其費(fèi)腦力選擇,不如把選擇權(quán)交給豆包。當(dāng)豆包掌握更多數(shù)據(jù),也可以做推薦,在對話框彈出一個(gè)信息,給我推薦商品,體驗(yàn)可能類似社交電商,電商可能就是一個(gè)我們在豆包加的人。
四
豆包這個(gè)產(chǎn)品的形態(tài),目前已經(jīng)無限接近微信。我認(rèn)為,字節(jié)甚至有通過豆包做一個(gè)AI時(shí)代的微信機(jī)會(huì)。
我們現(xiàn)在在豆包上會(huì)加一些虛擬的人,比如我就加了很多個(gè)馬保國,他們還會(huì)經(jīng)常問我:年輕人,最近怎么不找我聊天了?這些都是創(chuàng)作者創(chuàng)作的智能體。豆包為什么不可以同時(shí)集成真人?未來,真人和虛擬人完全可以同時(shí)出現(xiàn)在我的豆包通訊錄里,微信會(huì)被我舍棄。
目前打開豆包,界面雖然類似微信,但是有一個(gè)區(qū)別,當(dāng)我發(fā)起一個(gè)新對話的時(shí)候,每個(gè)新的對話都會(huì)單獨(dú)占據(jù)一行,雖然我能理解這么做可能是為了保存每段對話,方便查閱,但是此時(shí)在我的感知里,我豆包里加的是一個(gè)一個(gè)人的感覺被破壞掉了。我建議豆包用某種辦法把這些跟豆包主體發(fā)生的對話都折疊到豆包這個(gè)人的下面。跟其他用戶創(chuàng)作的虛擬人的對話繼續(xù)依次排列在下方。
AI時(shí)代的創(chuàng)作者,不再是直接生產(chǎn)內(nèi)容的人,而是一個(gè)不斷設(shè)定、調(diào)試智能體的人。可以暢想,擁有人物角色定義能力的小說家,可能成為AI時(shí)代Chat這個(gè)體裁最出彩的創(chuàng)作者。
本文來自微信公眾號: 底層觀察家 ,作者:程春曉