作者 | 游云庭 上海大邦律師事務(wù)所知識(shí)產(chǎn)權(quán)律師 高級(jí)合伙人 編輯 | 墨客 據(jù)媒體報(bào)道 ,近日世界三大唱片公司之一的環(huán)球唱片在美國起訴了人工智能引擎公司Anthropic,該公司的Claude引擎和ChatGPT齊名。環(huán)球唱片的訴狀附件列出了約 500 件被侵權(quán)作品,要求對(duì)每件賠償15萬美元,這意味著訴訟請(qǐng)求至少7500萬美元。今天就聊聊本案訴狀中的法律看點(diǎn)。 一、用侵權(quán)歌詞訓(xùn)練人工智能過程中有哪些違法? Claude人工智能模型能以貌似人類的方式響應(yīng)用戶的提示,這是因?yàn)楸桓鎻?fù)制并向底層模型輸入了大量文本。具體來說,被告通過以下步驟訓(xùn)練其Claude人工智能模型如何生成文本: 1. 首先, 被告用爬蟲從互聯(lián)網(wǎng)上復(fù)制了包含原告享有版權(quán)的歌詞在內(nèi)的大量文本,這些構(gòu)成了輸入或 "語料庫",Claude人工智能模型就是在這些輸入或 "語料庫的基礎(chǔ)上進(jìn)行訓(xùn)練的。 筆者的解讀:被告獲取訓(xùn)練數(shù)據(jù)未經(jīng)授權(quán)。 2. 其次,被告會(huì)"清理 "復(fù)制的文本,刪除它認(rèn)為技術(shù)上和商業(yè)上與其商業(yè)模式不一致的材料,無論是技術(shù)性的還是商業(yè)性的。比如刪除冒犯性語言,但多數(shù)情況下,這種 "清理 "過程似乎完全忽視了復(fù)制文本所體現(xiàn)的版權(quán)侵權(quán)行為。 筆者的解讀:被告既然可以對(duì)文本進(jìn)行清理,就無法適用“版權(quán)避風(fēng)港”,避風(fēng)港是因?yàn)榉?wù)提供商(如搜索引擎)對(duì)海量數(shù)據(jù)(603138)無法進(jìn)行甄別,法律上才給服務(wù)提供商一個(gè)特權(quán),收到通知后及時(shí)刪除侵權(quán)內(nèi)容即可免責(zé)。但如果服務(wù)商有技術(shù)能力對(duì)獲取的數(shù)據(jù)進(jìn)行甄別,那就不能適用避風(fēng)港原則,合規(guī)的做法應(yīng)該是有用戶問歌詞問題時(shí),給一個(gè)歌曲所在唱片公司的官方鏈接。這才是進(jìn)入避風(fēng)港的正確姿勢(shì)。 3. 被告將以前復(fù)制的大量文本復(fù)制到計(jì)算機(jī)中,并通過多種方式處理這些數(shù)據(jù),以訓(xùn)練Claude人工智能模型,包括"標(biāo)記"、"微調(diào)"、"強(qiáng)化學(xué)習(xí)",所有這些都可能需要對(duì)收集到的文本進(jìn)行額外的復(fù)制。一旦輸入和訓(xùn)練過程完成,被告的Claude人工智能模型就會(huì)生成在結(jié)構(gòu)和風(fēng)格上與訓(xùn)練語料庫中的文本一致的輸出結(jié)果。 筆者的解讀:原告主張被告在訓(xùn)練Claude人工智能模型時(shí)會(huì)多次復(fù)制和使用原告享有版權(quán)的作品。 4. 被告在很大程度上隱瞞了其用于訓(xùn)練人工智能模型的文本的具體來源。只表示:Claude模型的訓(xùn)練依據(jù)包括從互聯(lián)網(wǎng)上公開獲取的信息、從第三方獲得許可的數(shù)據(jù)集,Claude2號(hào)接受訓(xùn)練所依據(jù)的文本將持續(xù)到2023年初,其中90%為英語。而數(shù)據(jù)集(如 "Common Crawl "數(shù)據(jù)集)中包含大量流行歌詞內(nèi)容。被告拒絕透露其用于培訓(xùn)Claude的材料的原因是因?yàn)橐庾R(shí)到自己在未經(jīng)版權(quán)所有者授權(quán)的情況下復(fù)制了受版權(quán)保護(hù)的材料。 筆者的解讀:被告明知侵權(quán)的存在,所以隱瞞數(shù)據(jù)來源。這是一個(gè)獲取懲罰性賠償?shù)囊罁?jù)。 二、Claude人工智能模型在回答問題時(shí)有哪些侵權(quán)? 1. 人工智能訓(xùn)練完成后,被告并未刪除侵權(quán)的訓(xùn)練素材,被告的人工智能模型傳播了大量與出版商受版權(quán)保護(hù)的歌詞相同或近乎相同的副本,進(jìn)一步侵犯了出版商的權(quán)利。訴狀列舉的例子,用戶要求Claude對(duì)凱蒂佩里的《咆哮》、滾石樂隊(duì)的《You Can't Always Get What You Want》輸出歌詞,然后得到了和原版幾乎相同的歌詞。 筆者的解讀:以上內(nèi)容構(gòu)成直接侵權(quán)。 2. 被告的Claude人工智能模型還能為新歌曲生成歌詞,有時(shí)會(huì)包含現(xiàn)有版權(quán)歌曲的歌詞。當(dāng)Claude被要求按照某位藝術(shù)家或詞曲作者的風(fēng)格創(chuàng)作其他類型的版權(quán)作品(如詩歌、短篇小說)時(shí),人工智能模型也會(huì)經(jīng)常有直接抄襲原告享有版權(quán)的歌詞。Claude甚至可能會(huì)將一部受版權(quán)保護(hù)的作品的部分內(nèi)容與其他受版權(quán)保護(hù)的作品的部分內(nèi)容放在一起,有時(shí)甚至有悖于歌曲作者的初衷。 筆者的解讀:以上內(nèi)容除了侵犯原作者的版權(quán)中的財(cái)產(chǎn)權(quán),還侵犯人身權(quán),將他人的作品標(biāo)識(shí)為人工智能創(chuàng)作,侵犯了原作者的署名權(quán)。鑒于人工智能沒有法律上的人格,所以侵權(quán)者是開發(fā)運(yùn)營人工智能的本案被告。 寫到這里,筆者忽然想試試國內(nèi)的人工智能模型有沒有歌詞功能,隨機(jī)問了下文心一言,發(fā)現(xiàn)還真有,不知道有沒有拿到歌詞版權(quán)授權(quán)。 3. Claude還能為歌詞生成和弦譜,環(huán)球的律師認(rèn)為也構(gòu)成侵權(quán)。當(dāng)Claude被要求為某首歌曲提供和弦行進(jìn)時(shí),其往往會(huì)生成包含出版商受版權(quán)保護(hù)的歌詞以及和弦的輸出結(jié)果。訴狀舉了約翰尼-卡什(Johnny Cash)的《Daddy Sang Bass》的例子。 筆者的解讀:生成和弦是一個(gè)有用的功能,現(xiàn)在Claude生成的方式是在全歌的歌詞上進(jìn)行和弦標(biāo)注,這個(gè)被侵權(quán),有一定爭議,因?yàn)椤吨鳈?quán)法》規(guī)定,為評(píng)論一部作品而進(jìn)行適當(dāng)引用的,屬于合理使用。本案中的問題在于,Claude標(biāo)注和弦的方式不是合理引用,而是全文引用,故構(gòu)成實(shí)質(zhì)性替代,不屬于合理使用的范疇。如果Claude只標(biāo)每句歌詞的第一個(gè)詞,其后的字母用*號(hào)表示,其實(shí)是可以達(dá)到向用戶提供和弦詞譜,又不侵權(quán)的目的的。 4. 盡管被告公然利用出版商的歌詞和內(nèi)容用于開發(fā)和訓(xùn)練人工智能模型,但被告禁止他人將被告擁有版權(quán)的內(nèi)容用于同樣的目的,其服務(wù)條款明確禁止使用被告內(nèi)容 "開發(fā)或訓(xùn)練任何人工智能或機(jī)器學(xué)習(xí)算法或模型"。 筆者的解讀:這個(gè)自相矛盾的點(diǎn)在法庭上提出,會(huì)讓被告方的律師挺尷尬,因?yàn)檫壿嫴荒茏郧ⅰ? 三、被告的回應(yīng) 媒體報(bào)道稱,被告目前尚未對(duì)本次訴訟進(jìn)行回應(yīng),但筆者詢問了被告的Claude人工智能模型,如何評(píng)價(jià)環(huán)球唱片對(duì)Anthropic的訴訟,Claude的回復(fù)倒是挺全面的: 1. 版權(quán)法 - 訴訟的核心在于Anthropic的AI助手Claude是否侵犯了環(huán)球的歌詞版權(quán)。法院將要評(píng)估Claude對(duì)歌詞的概括是否構(gòu)成版權(quán)侵犯或合理使用。 2. 合理使用原則 - Anthropic可能會(huì)辯稱Claude的歌詞概括屬于合理使用,允許為評(píng)論、批評(píng)和教育目的進(jìn)行有限的版權(quán)材料使用。但是環(huán)球會(huì)爭辯這些概括超出了界線。 3.建立新的法律先例 - 這個(gè)案件可能會(huì)在版權(quán)和AI方面建立新的先例。法院還沒有對(duì)AI版權(quán)問題做出大量判決。該案件可能有助于澄清標(biāo)準(zhǔn)和界限。 4.對(duì)AI訓(xùn)練的潛在寒蟬效應(yīng) - 如果判Anthropic敗訴,可能會(huì)對(duì)使用版權(quán)文本訓(xùn)練自然語言AI系統(tǒng)產(chǎn)生寒蟬效應(yīng)。開發(fā)者可能不得不限制用于訓(xùn)練的來源材料。 5. 言論自由意義 - Anthropic可能會(huì)聲稱Claude的歌詞概要屬于受保護(hù)的言論,判他們敗訴會(huì)違反第一修正案權(quán)利。然而,版權(quán)法的言論保護(hù)是有限度的。 6. 行業(yè)反應(yīng) - 如果Anthropic敗訴,可能會(huì)促使其他科技公司限制在AI訓(xùn)練中使用版權(quán)內(nèi)容。但如果Anthropic勝訴,可能會(huì)鼓勵(lì)更開放的使用。 總體而言,該案件將對(duì)AI發(fā)展和版權(quán)法產(chǎn)生復(fù)雜影響。法院在做出判決時(shí)將不得不平衡各種利益和原則。最終的裁決將會(huì)塑造AI和知識(shí)產(chǎn)權(quán)的未來格局。 筆者的評(píng)價(jià):這個(gè)回復(fù)很得體,重點(diǎn)突出又很全面。一方面,人工智能是新生事物,用版權(quán)素材訓(xùn)練人工智能是否侵權(quán)或者說,是否構(gòu)成合理使用,現(xiàn)行的著作權(quán)法律確實(shí)沒有明文規(guī)定,回復(fù)強(qiáng)調(diào)了這一點(diǎn)。另一方面,本案的對(duì)人工智能產(chǎn)業(yè)發(fā)展、言論自由等的影響確實(shí)也會(huì)是被告抗辯的重點(diǎn)。然后筆者又問了個(gè)問題:Claude的回復(fù)中含有版權(quán)內(nèi)容,會(huì)不會(huì)對(duì)版權(quán)人的利益和版權(quán)行業(yè)的秩序造成損害。 Claude的答復(fù):您提出了一個(gè)非常好的問題。Claude未經(jīng)授權(quán)使用歌詞確實(shí)可能對(duì)版權(quán)人的利益和版權(quán)行業(yè)的秩序造成一定程度的負(fù)面影響: 1. 可能侵犯版權(quán)人的經(jīng)濟(jì)權(quán)益 - 未經(jīng)授權(quán)使用他人創(chuàng)作可能對(duì)版權(quán)人的收益造成損害,減少其合法獲取報(bào)酬的機(jī)會(huì)。 2. 可能降低創(chuàng)作激勵(lì) - 如果未經(jīng)授權(quán)使用盛行,版權(quán)人的創(chuàng)作激勵(lì)可能會(huì)降低,長期影響創(chuàng)作活力。 3.可能擾亂正常許可秩序 - 大規(guī)模未經(jīng)授權(quán)使用也可能擾亂正常的版權(quán)許可秩序,增加版權(quán)人的許可成本。 4. 可能引發(fā)過度依賴的風(fēng)險(xiǎn) - AI系統(tǒng)過度依賴未經(jīng)授權(quán)使用存在被依賴方侵權(quán)或斷供的風(fēng)險(xiǎn)。 但是,也需要注意以下幾點(diǎn): 1. Claude似乎僅使用了非實(shí)質(zhì)性部分。 2. 合理使用條款給予了一定的合法空間。 3. 對(duì)未來AI的訓(xùn)練模式轉(zhuǎn)變也可能帶來一定正面影響。 4. 可以通過多方討論確定新的平衡點(diǎn)。 所以這需要案件審理后基于具體情況做出權(quán)衡。但您提出了一個(gè)涉及此案核心的非常好的視角。 筆者的評(píng)價(jià):Claude作為一款人工智能,智能程度確實(shí)不低,回答全面且有導(dǎo)向性。 最后,二十多年前,以雅虎、網(wǎng)景、Napster為代表的美國互聯(lián)網(wǎng)產(chǎn)業(yè)崛起的時(shí)候,版權(quán)人的利益受到了很大的傷害,當(dāng)時(shí)通過一系列的訴訟和博弈,美國通過了《千禧年數(shù)字版權(quán)法》[1],以版權(quán)避風(fēng)港劃定了版權(quán)人和互聯(lián)網(wǎng)平臺(tái)之間的利益分界線。 今天當(dāng)人工智能產(chǎn)業(yè)崛起并野蠻生長,吞噬版權(quán)人的利益時(shí),版權(quán)行業(yè)再次用訴訟捍衛(wèi)自己的利益。筆者之前曾在《《權(quán)力的游戲》作者起訴ChatGPT侵權(quán),AI訓(xùn)練要不要獲得著作權(quán)人的授權(quán)?》[2]一文中介紹了文字作品的作者起訴人工智能服務(wù)公司侵權(quán);今天介紹了唱片公司起訴人工智能服務(wù)公司侵權(quán);其實(shí)最近一直很熱的好萊塢罷工也和影視公司使用人工智能奪走了一部分從業(yè)人員的工作有關(guān)。希望最近的一系列博弈會(huì)幫助人工智能產(chǎn)業(yè)和版權(quán)產(chǎn)業(yè)劃分出利益的合理界限,以利于產(chǎn)業(yè)更好的長遠(yuǎn)發(fā)展。
(本文僅代表作者觀點(diǎn),不代表知產(chǎn)力立場) 圖片來源 | 網(wǎng)絡(luò) 往期熱文 本文首發(fā)于微信公眾號(hào):知產(chǎn)力。文章內(nèi)容屬作者個(gè)人觀點(diǎn),不代表和訊網(wǎng)立場。投資者據(jù)此操作,風(fēng)險(xiǎn)請(qǐng)自擔(dān)。 (責(zé)任編輯:張曉波 )
|