AI“撕裂”版權法:Meta與Anthropic迎來不同判決
自從幾年前人工智能技術興起以來,受版權保護的作品是否可以自由用于訓練生成式人工智能模型一直是數十起訴訟的核心問題。上周,美國地方法院宣布了兩項關于Anthropic和Meta的判決,將合理使用抗辯應用于人工智能訓練,初步解答該問題的意見,然而這兩個決定的矛盾性質說明,要真正解決這個問題,還有很長的路要走。
序章:加州48小時內的“合理使用”雙判
2025年6月23日,加州北區地方法院法官William Alsup就Bartz v. Anthropic(以下簡稱Anthropic案)作出了簡易判決。此案提交不到一年,且證據開示仍在進行中。在證據開示完成之前就做出簡易判決的情況非常罕見,因為 可能存在一些尚未記錄的事實,而這些事實可能會影響判決結果。
在Anthropic案宣布裁決后不到48小時后,第二起AI版權合理使用案件Kadrey v. Meta (以下簡稱Meta案) 就得到了判決。該案也在加州北區法院審理,由另一位法官Vincent Chhabria做出了有利于Meta?的即決判決。雖然Chhabria法官認為Meta的使用屬于合理使用。
盡管事實上這兩起案件都是在同一個地區法院幾天之內判決的,而且都裁定Meta和Anthropic的AI訓練屬于合理使用,但這些案件的判決卻截然不同,也并非像某些報道所稱的那樣,完全是AI公司的“勝利”。
帶裂痕的共識:法官們“合理使用”認定的共同點
1. “轉換性使用”的模糊邊界
兩位法官都認定,根據第一項合理使用因素,將受版權保護的作品用于人工智能訓練屬于轉化性使用。他們還都得出結論, 第一項合理使用因素對人工智能公司被告有利。
Anthropic案的Alsup法官基于以下三點考慮判定該使用屬于轉化性使用:(1)輸出不侵權;(2)人工智能訓練與人類學習類似;(3)人工智能是改變游戲規則的技術 (即具有“變革性”) 。筆者認為, Alsup法官完全依賴這些因素是極其錯誤的。
Meta案的Chhabria法官對轉化性使用和第一個合理使用因素的分析比Alsup法官的分析好得多,但同樣存在一個主要缺陷,即 錯誤地關注和重視原告需要證明人工智能系統的輸出與原告的作品實質相似。 實質相似是侵權的檢驗標準,而不是合理使用的標準。 兩種使用“目的的相似性”才是合理使用的檢驗標準。
這兩項判決的另一個共同點是,兩位法官對轉化性使用的分析都沒有討論用于確定轉化性使用的實際法律標準。根據判例法以及最高法院最近在Warhol v. Goldsmith案 (以下簡稱Warhol案) 中的判決,一種使用不能僅因為產生了新的和創新的東西就具有轉化性。
要具有轉化性,使用必須有正當理由 ,即(1)促進版權目的的實現,而不會損害所用作品的市場;(2)使用者必須證明使用該作品對于實現此目的而言是必要的。但這兩個裁決都沒有承認Warhol案的這一關鍵指標。
2. 復制的是“表達”而非“功能”
兩位法官均承認,這些書籍因其受版權保護的表達方式而對人工智能訓練具有價值,并駁回了人工智能公司聲稱其僅使用了書籍中“功能性元素”或“非表達性元素”的主張。
Alsup法官表示:“Anthropic之所以高度重視這些書籍,是因為它們的數據融合了作者所著的書籍,并且它們的價值在于其中包含的創造性表達”,并且“之所以選擇納入訓練集,是因為它們內容完整,并且包含豐富的受保護表達方式。”
Chhabria法官駁回了Meta的論點,即其“僅使用原告的書籍來獲取其‘功能性元素’,而非利用其創造性表達”,并解釋說:“Meta對原告書籍的使用確實取決于書籍的創造性表達。”正如Meta本身所指出的,LLM的培訓是通過學習“詞匯和概念之間的統計關系”以及收集“關于詞序、頻率 (使用哪些詞匯以及使用頻率) 以及語法和句法的統計數據”來實現的。 詞序、詞匯選擇、語法和句法是人們表達思想的方式。
3. “許可市場”論證的循環陷阱:對新興市場的刻意忽視?
第四個合理使用因素——使用對實際和潛在市場的影響,無疑是四個因素中最重要的。 盡管如此,在兩項判決中,第四個因素中關于直接許可市場的考慮幾乎都不存在。兩位法官幾乎沒有給出任何實質的分析,就認定不存在市場損害,因為 版權所有者在法律上無權進入人工智能訓練市場。
Alsup法官關于許可市場的討論僅僅指出,“一個新興的、以狹隘培訓目的授權作品的市場……并非《版權法》賦予作者利用的市場。”他沒有對這一結論做出任何解釋。Chhabria法官的討論甚至更短,他僅用兩句話就得出結論:“為了防止第四個因素的分析陷入循環論證,并在所有案件中都偏袒權利人,因作品用于轉換性目的而支付的許可費用損失造成的損害不予認定。”
兩位法官忽略了一個重要的現實: 一個蓬勃發展的新興人工智能訓練材料許可市場已經存在。 第四個因素下的許可市場只有再被認為是一個潛在的許可市場,并且法官試圖確定該潛在市場是否過于投機時,才可能是循環的和不可認知的。
但是,當一個實際存在的市場已經存在時,循環論證就站不住腳了,兩位法官草率地聲稱該論證是循環的,筆者認為是錯誤的,法官才是進行循環論證的人。
4. 判決的“狹窄性”:僅限于本案特定事實
兩位法官都明確表示,他們的判決非常狹隘,僅限于他們的這一案例。例如,兩位法官都明確表示,如果輸出內容相似或侵權用途不同,他們的判決可能會完全不同。因此,這兩個案件的判決或許不會對原告已經證明輸出內容相似或侵權用途不同的案件產生不利影響——例如Concord訴Anthropic案、NYT訴OpenAI案、Getty訴Stability AI案和Disney訴Midjourney案以及許多其他案件。
Chhabria法官進一步縮小了Meta案裁決的影響,他指出:“絕對沒有規定說,當你使用受保護的作品‘具有變革性’時,就自動使你免于被指控侵犯版權。”并且“這項裁決并不主張Meta使用受版權保護的材料來訓練其語言模型是合法的,僅主張這些原告提出了錯誤的論點,并且未能提供支持正確論點的記錄。”
事實上, Chhabria法官的命令已被許多人認可,為版權所有者如何贏得人工智能侵權案件提供了路線圖。
司法邏輯的對撞:兩案裁決的核心分歧點
1. AI訓練=人類學習?
在Anthropic案的整個判決過程中, Alsup法官反復將人工智能訓練與人類學習進行比較,以證明其關于第一個合理使用因素下的轉化性使用,和第四個合理使用因素下的許可市場的結論。
事實上,Meta案的Chhabria法官強烈批評Alsup法官將人類學習與人工智能訓練進行比較的做法,他表示:“用書本教孩子寫作,與用大量書籍創造一種產品截然不同。通過這類產品,一個人只需投入極少的時間和創造力,就能創作出無數相互競爭的作品。這種不恰當的類比并不能成為忽視合理使用分析中最重要的因素的依據。”
在Meta案判決書中,Chabbria法官批評了Alsup法官的不當比較:
LLM 的書籍閱讀體驗與人類不同。 LLM?會吸收文本,學習詞語在不同語境下如何組合使用的“統計模式”。它通過從訓練數據中提取一段文本,從中刪除一個單詞,預測該單詞的含義,并根據其正確性更新其對語言的總體理解——然后用不同的文本重復這個過程數十億甚至數萬億次。這與人類閱讀書籍的方式不同。
與 (Alsup法官提到的Anthropic案中) 假設的教授不同,Meta并非僅僅將原告的書籍提供給一個人。任何人都可以使用該工具來幫助他們進行進一步的表達,無論是通過幫助其進行頭腦風暴或研究創意寫作項目 (例如原告David Henry Hwang,一位劇作家兼編劇) ,還是通過編寫代碼來開發新的軟件程序 (例如洛克希德·馬丁公司) 。 通過創建一種任何人都可以使用的工具,Meta的抄襲行為有可能以指數級的方式成倍地增加創造性表達,而教授個人則無法做到這一點 。
可見,Alsup法官和Chhabria法官在人類學習和AI訓練問題上的分歧很大。
2. 第四因素焦點:市場稀釋風險是否為“核心威脅”?
兩位法官意見分歧的另一個方面是如何在第四項合理使用要素下處理市場稀釋問題。
在Anthropic案中,Alsup法官再次大量引用人類學習類比表示:“作者的投訴與他們抱怨訓練小學生提高寫作水平會導致競爭作品激增的情況并無不同。這并非《版權法》所關注的那種競爭性或創造性的取代。”他未作任何真正考慮便輕率地否定了間接替代所造成的市場稀釋帶來的損害。
相比之下,Chhabria法官就 可能損害版權所有者實際和潛在市場的間接替代影響 進行了非常深入的討論。他解釋說:
生成式人工智能有可能為市場帶來海量的圖像、歌曲、文章、書籍等。人們只需投入極少的時間和創造力,就能促使生成式人工智能模型生成這些輸出。因此,通過使用受版權保護的作品來訓練生成式人工智能模型,企業所創造的東西往往會極大地破壞這些作品的市場,從而極大地削弱人類以傳統方式創造事物的動力。
“本案……涉及一項技術,它能夠生成數百萬個次級作品,而其投入的時間和創造力,卻遠不及創作原作。任何其他用途——無論是創作單個次級作品,還是開發其他數字工具——都不可能像LLM培訓那樣,讓市場充斥著競爭性作品。因此,市場稀釋的概念變得至關重要。”
Chhabria法官似乎在此案中提出了更強有力的論點。第九巡回法院是否會采納他的觀點還有待觀察,但顯而易見的是,與Alsup法官采取的更為平淡的路線不同,Chhabria法官理解并意識到, 人工智能技術的出現及其對版權激勵機制 (即創作和分發新的受版權保護的作品供公眾欣賞 ) 的影響規模,需要采取更周全的、更符合版權精神以及合理使用抗辯的審理方式。
3. 盜版材料的“原罪”:使用非法來源是否自動喪失合理使用資格?
兩案判決的另一個重要差異在于,對影子圖書館 (例如Z-Library和Books3) 盜版作品的使用考量。
在Meta案中,Chhabria法官豁免了Meta對影子圖書館盜版作品的使用,因為:(1)沒有證據表明Meta的行為“使這些圖書館受益或使其非法活動得以延續——例如,他們從Meta訪問其網站中獲得廣告收入”;(2)Meta最終將它們用于人工智能訓練目的,而他認為這是一種轉化性用途。即只要被告能夠證明盜版在某個環節被用于符合合理使用目的,就免除其大規模盜版行為的罪責。筆者認為,這與允許某人因需要家中藥物而入室行竊并無太大區別。
Alsup法官對Anthropic使用來自非法網站和服務的盜版作品構建數字圖書館的案件采取了截然不同的解讀,認為此類行為使Anthropic喪失了成功進行合理使用抗辯的資格。Alsup法官駁斥了使用盜版作品可以構成合理使用的觀點,并通過以下陳述明確指出: “即使盜版作品被立即用于轉化性使用并立即丟棄,盜版原本可獲得的副本本質上也構成了不可挽回的侵權行為” 以及“Anthropic錯誤地認為,只要創作出令人興奮的最終產品,所有‘公眾看不到的后端步驟’都可以被免責”。
這些意見雖然意義重大,但并不意味著這兩個案件的終結。美國第九巡回法院如何處理這些差異應該會非常有趣,但在此之前,美國版權法將陷入一片混亂。
本文來自微信公眾號: Internet Law Review ,作者:基思·庫弗施密德(Keith Kupferschmid,2015 年起擔任版權聯盟總裁兼首席執行官。曾擔任軟件和信息產業協會(SIIA)總法律顧問兼知識產權高級副總裁長達16年。在此之前,他曾在芬尼根律師事務所(Finnegan, Henderson, Farabow, Garrett & Dunner)、美國專利商標局、美國貿易代表辦公室和美國版權局工作),編譯:互聯網法律評論