偷資料後聘請厲害律師就穩了?AI 侵權官司的真相

作者 | 發布日期 2024 年 08 月 31 日 9:30 | 分類 AI 人工智慧 , 科技政策 , 金融政策 line share Linkedin share follow us in feedly line share
偷資料後聘請厲害律師就穩了?AI 侵權官司的真相


最近參與過電影《黑豹》、《復仇者聯盟》系列和《雷神索爾》系列的概念藝術家歐提茲(Karla Ortiz)領著創作社群一起提告 Stability AI,雖初步獲地方法官支持創作者繼續侵權訴訟,其實這場內容創作者與 AI 模型公司的戰役,要繼續贏仍有許多挑戰。為什麼?原因竟是科技圈的「暗黑」手法:先偷資料再請好律師,可能重現?

最近一連串與生成式AI相關訴訟案搬上檯面後,又造成全球創作人討論與擔憂。

Stability AI因圖像遭藝術家控告、Claude因歌詞被音樂出版商控告、OpenAI因文字被作家媒體控告、GitHub因程式碼被開發者控告,類似訴訟在各地開展。

創作者控告Stability AI案件尤受關注,因不同於Getty Images這類圖庫公司控告Stability AI,而是由曾參與《黑豹》、《復仇者聯盟》和《雷神》等電影的概念藝術家歐提茲(Karla Ortiz)和其他創作者發起。

法官:AI公司未取得創作者同意使用作品

《The Hollywood Reporter》報導,上週美國地方法官歐瑞克(William Orrick)認同創作者部分論點,拒絕駁回控告Stability AI,支持創作者繼續侵權訴訟。

雖然法官沒有處理訓練模型是否屬合理使用議題,但歐瑞克認為,AI公司未經同意,便將藝術家創作存入系統,此舉侵犯後者權利。看來此案似乎法官展現支持創作者態度,但對創作者來說,與AI的戰役仍不容易打。為什麼?

首先,機器侵占任務的自動化焦慮(automation anxiety),已讓白領工作者戰戰兢兢。即便看似最不容易被AI挑戰的創作者,同樣無法置身事外。就像寫程式碼有GitHub Copilot、Codeium輔助,無論文字、圖像、聲音或影音,都有AI工具可用,文字有ChatGPT,圖像有Midjourney、音樂有sudo、影音也有Runway。

這些科技公司開發的AI工具,都是站在前人肩膀上,正是小說家、作曲家、畫家孜孜矻矻創作,作品流傳於世,OpenAI、Anthropic和Midjourney等才能用這些作品訓練模型。

AI是降低門檻的好工具,還是內容小偷?

對一般人來說,AI工具無疑是弭平創作門檻的福音,但對創作者來說,這卻是赤裸裸的偷竊,故2022年底生成式AI映入一般民眾眼簾後,創作者與AI公司戰火便全面燃起。

但舉證一點也不容易。他們要先從以億計的圖片資料庫,找到自己的作品,接著得鑽進技術討論之海,釐清深度學習(deep learning)究竟只是學走資料模式(pattern),還是真把創作化為權重,讓使用者有辦法透過咒語重製。最後,創作者還得跟法院解釋,為何圖像資料拿去訓練模型構成侵權,而不是辯方所說的合理使用。

歐瑞克認為,新創Stability AI開發文產圖(text-to-image)模型,接受使用者指令後,有辦法創造高度真實的圖像,這類AI創作大幅仰賴有版權的作品,且讓模型回應這類指令的意圖,開發工具就是促進侵權。

Stability AI利用LAION資料庫訓練模型,這資料庫並不直接儲存圖像,而是以圖像網址和描述的成對文字(pair)組合,對應兩者後,模型就能「理解」圖像的語意概念。舉例某張有大隊人馬參加馬拉松的照片,對應文字有可能是奔跑、馬拉松和人潮。

有開發者打造搜尋工具,讓藝術家確認自己創作是否被納入資料庫。LAION資料庫不直接儲存圖像,故創作怒火就集中用LAION打造服務的AI公司。

(Source:Stability AI 

施密特:先偷資料再請律師處理

不只文產圖公司面臨訴訟,不同功能的模型代表對應資料,都可能是未經授權。從Google前執行長與董事長、大量投資AI新創的施密特(Eric Schmidt)近期發言,或許能一瞥為何科技新創要先斬後奏,未經同意便運用他人資料。

近期惹了許多非議的史丹佛大學演講,施密特指出大語言模型能力進步,有辦法將使用者文字化為行動,他舉例可向大語言模型下令,請它再現複製版TikTok(Make me a copy of TikTok),並「偷走用戶和音樂,加入我的偏好,接著在30秒內寫好程式碼。」

因大語言模型已從文字對話上升到處理多模態、成為AI代理人的潛力,無論打造網頁介面還是增加功能,大語言模型都能完成。施密特之後補救,發言重點不是非法竊取音樂,但如果是矽谷創業家,產品取得成功,就能找一群菁英律師收拾殘局。「但如果沒人用你的產品,那是否有偷內容也不重要了」。

單看施密特發言,或許能視為科技老兵的個人想法。但施密特不是普通的科技老兵,他投資開發Claude的Anthropic、打造Stable Diffusion的Stability AI,也著力開發AI基礎模型的新創Mistral AI、Inflection AI和French AI startup H等公司的重要投資人。

人工智慧模型商和創作者的戰爭,也讓人想到創作者與盜版者多年的搏鬥。開發者認為資料訓練模型為合理使用,且模性表現提升,不只對公司有益,從社會角度也能一起進步。故海盜黨(Pirate Party)也主張改革著作權,以促進社會福祉。

對創作者來說,正因有多年累積的品味、經驗和美學,方能做出獨樹一幟的風格,但AI工具商卻沒問過作者,就粗暴將作品收入資料庫,用來訓練模型,讓使用者用AI創作時,靈活調度各藝術家的風格。

對創作者來說,這場戰役仍很艱辛。

(本文由 遠見雜誌 授權轉載;首圖來源:shutterstock)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》