社交媒體平臺Reddit對人工智能初創公司Anthropic提起訴訟,指控其未經授權的數據抓取來訓練其Claude聊天機器人。
Reddit在周三提交給舊金山高等法院的文件中聲稱,Anthropic在2024年7月之后訪問其平臺的次數超過10萬次,盡管它公開宣布已停止此類活動。
該文件指控Anthropic違反Reddit的用戶協議,未經同意抓取內容,并繼續使用該平臺的數據來訓練其大型語言模型。
Reddit在訴狀中將Anthropic描述為一家“姍姍來遲”的人工智能公司,該公司在公開場合展現了責任感,同時涉嫌違反規則和界限運營。
訴訟中寫道:“此案涉及Anthropic的兩張面孔。”指控該公司對Reddit內容進行“商業利用”以獲取利潤。
Reddit首席法律官Ben Lee在接受The Verge采訪時表示,沒有其他平臺能夠像Reddit這樣進行如此廣泛的真實對話,據報道,這個跨越數十年的寶藏在人工智能培訓競賽中價值數十億美元。
“現在,人們比以往任何時候都更加尋求真正的人與人的對話。Reddit舉辦了近20年的豐富、人性化的討論,討論幾乎所有可以想象到的話題。這些對話不會在其他地方發生--而且它們對于訓練克勞德這樣的語言模型至關重要,”李說。
Reddit已將其數據授權給人工智能公司,包括2024年初與谷歌簽署的每年6000萬美元的協議。該平臺還與OpenAI、Sprinklr和Cision等公司達成了類似的數據訪問協議。
因此,該訴訟尋求損害賠償、賠償和永久禁令,禁止Anthropic在其任何產品中使用Reddit衍生數據。它還要求法院禁止該公司授權任何在Reddit內容上訓練的人工智能模型或從中獲利。
整個媒體領域圍繞人工智能訓練數據的法律緊張局勢正在加劇。在一起備受矚目的案件中,《紐約時報》于2023年12月起訴了OpenAI和微軟,指控他們未經同意使用其報道。最近,Vox Media和Condé Nast加入了針對人工智能公司Kohere的訴訟,指控類似的版權侵權指控。
像Reddit這樣不斷增加的訴訟加劇了要求在數字經濟中加強用戶權利的呼聲。批評者認為,集中式平臺繼續從用戶生成的內容中提取價值,而回報卻很少。
分散的社交網絡,如Lens Protocol和Farcaster,已經成為替代方案,提供基于區塊鏈的模型,用戶擁有他們的數據并從其使用中獲利。
與此同時,Bittensor和Ocean Protocol等平臺正在構建去中心化的基礎設施,用戶可以在其中貢獻數據或人工智能模型以換取鏈上獎勵。