開展模型訓(xùn)練的合理使用
生成式人工智能全生命周期主要階段包括模型訓(xùn)練、應(yīng)用運行和模型優(yōu)化等階段,涉及開發(fā)者、服務(wù)提供者、服務(wù)使用者等多方主體。模型訓(xùn)練階段涉及大量數(shù)據(jù)收集、數(shù)據(jù)清洗、分詞后用于模型訓(xùn)練和驗證。生成式人工智能的數(shù)據(jù)來源主要分為兩個部分:第一部分為生成式人工智能的訓(xùn)練數(shù)據(jù)庫,內(nèi)容幾乎涵蓋所有能收集到的人類數(shù)字化信息,包括公共數(shù)據(jù)、網(wǎng)絡(luò)信息、數(shù)字化圖書、自媒體對話數(shù)據(jù)集、報紙雜志、科學(xué)論文等,可能遭遇知識產(chǎn)權(quán)瓶頸;第二部分為生成式人工智能在服務(wù)用戶的過程中所收集和輸出的信息,也就是人工智能合成數(shù)據(jù)收集,可以減少知識產(chǎn)權(quán)風(fēng)險。生成式人工智能的治理應(yīng)順應(yīng)技術(shù)發(fā)展給社會生產(chǎn)帶來的變化,改變原有的“技術(shù)支持者—服務(wù)提供者—內(nèi)容生產(chǎn)者”的監(jiān)管體系,構(gòu)建“基礎(chǔ)模型—專業(yè)模型—服務(wù)應(yīng)用”的生成式人工智能分層治理體系。
從輸入端看,訓(xùn)練數(shù)據(jù)來源的合法合規(guī)問題十分突出,生成式人工智能需要進(jìn)行海量的閱讀和攝取,在海量數(shù)據(jù)的攝取過程中,包括爬蟲技術(shù)無法識別抓取內(nèi)容的著作權(quán)問題,已經(jīng)成為生成式人工智能合規(guī)發(fā)展中制約性的難題?!渡墒饺斯ぶ悄芊?wù)管理暫行辦法》規(guī)定:“生成式人工智能服務(wù)提供者應(yīng)當(dāng)依法開展預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動,使用具有合法來源的數(shù)據(jù)和基礎(chǔ)模型;不得侵害他人依法享有的知識產(chǎn)權(quán);涉及個人信息的,應(yīng)當(dāng)取得個人同意或者符合法律、行政法規(guī)規(guī)定的其他情形。”該條款的主要目的是規(guī)范生成式人工智能服務(wù)提供者數(shù)據(jù)來源的合法性問題,如果數(shù)據(jù)來源不合法不合規(guī),該產(chǎn)品將無法進(jìn)入市場應(yīng)用階段。從輸出端來看,終端用戶、模型提供者的生成內(nèi)容是否擁有著作權(quán),人工智能服務(wù)的提供者生成的內(nèi)容是否侵權(quán),都是法律監(jiān)管和司法實踐中面臨的難點問題。
在大模型產(chǎn)業(yè)快速發(fā)展和應(yīng)用的過程中,圍繞創(chuàng)作激勵與產(chǎn)業(yè)發(fā)展的作品使用行為性質(zhì)面臨諸多爭議,目前已發(fā)生多起作者、版權(quán)方針對生成式人工智能模型訓(xùn)練過程中未經(jīng)授權(quán)的作品使用行為提起訴訟。近期,四位繪畫創(chuàng)作者將某社交平臺訴至法院,訴稱其未經(jīng)授權(quán)使用了原告的原創(chuàng)作品作為訓(xùn)練數(shù)據(jù),從而生成與原作高度相似的圖片,侵犯其創(chuàng)作者的合法權(quán)益,目前案件仍在審理中。去年廣州互聯(lián)網(wǎng)法院開庭審理并一審判決被稱為“全球AIGC平臺侵權(quán)第一案”。原告發(fā)現(xiàn)被告經(jīng)營的網(wǎng)站具有AI對話及AI繪畫功能,其生成的奧特曼形象與原告公司獲得獨占性授權(quán)以及獨立維權(quán)權(quán)利的奧特曼形象構(gòu)成實質(zhì)性相似,遂向法院提起訴訟,爭議焦點是人工智能生成內(nèi)容的著作權(quán)定性問題及應(yīng)用中對作品使用的合法性問題。廣州互聯(lián)網(wǎng)法院最終認(rèn)定,網(wǎng)絡(luò)平臺作為生成式人工智能服務(wù)提供者未盡合理注意義務(wù),未采取措施避免侵權(quán)行為,違反了《生成式人工智能服務(wù)管理暫行辦法》《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》。被告AI公司未經(jīng)許可,復(fù)制了案涉奧特曼作品,構(gòu)成直接侵犯奧特曼著作權(quán)的復(fù)制權(quán);上述行為構(gòu)成對案涉奧特曼作品的改編,且被告未經(jīng)許可,改編了案涉奧特曼作品,侵犯了原告對案涉奧特曼作品的改編權(quán),并責(zé)令其停止侵權(quán)行為,賠償原告經(jīng)濟(jì)損失。該案例的重要性在于確立了網(wǎng)絡(luò)平臺作為人工智能服務(wù)提供者的責(zé)任邊界,在司法上落實了《生成式人工智能服務(wù)管理暫行辦法》《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》的合規(guī)要求。
人工智能生成內(nèi)容的著作權(quán)問題
《民法典》規(guī)定網(wǎng)絡(luò)服務(wù)提供者責(zé)任承擔(dān)的一般原則,即網(wǎng)絡(luò)服務(wù)提供者無須為用戶利用網(wǎng)絡(luò)服務(wù)的侵權(quán)行為承擔(dān)責(zé)任,但對于其知道或應(yīng)當(dāng)知道的網(wǎng)絡(luò)用戶侵權(quán)行為應(yīng)及時采取必要措施以避免損害擴(kuò)大。在人工智能面向終端用戶提供服務(wù)的場景下,生成內(nèi)容是算法自身基于對人工智能服務(wù)使用者輸入內(nèi)容的理解,通過算法生成的方式完成。由于人工智能需要利用現(xiàn)有作品進(jìn)行模型訓(xùn)練,通過依賴訓(xùn)練作品形成的算法模型產(chǎn)生人工智能生成內(nèi)容,不可避免的攜帶訓(xùn)練作品的記憶或痕跡,可能呈現(xiàn)出訓(xùn)練作品的某些元素、特征、風(fēng)格等。如果人工智能生成內(nèi)容與訓(xùn)練作品在表達(dá)上構(gòu)成實質(zhì)性相似狀況,則可能存在侵權(quán)風(fēng)險。目前我國《著作權(quán)法》中著作權(quán)屬主體不包括人工智能模型,因此人工智能模型本身是否能夠成為《著作權(quán)法》保護(hù)的主體存在爭議。在當(dāng)下的司法實務(wù)中,通常是由生成式人工智能的使用者向法院請求著作權(quán)保護(hù)的方式進(jìn)行維權(quán)。北京互聯(lián)網(wǎng)法院近期針對人工智能生成圖片作品(AI繪畫圖片)著作權(quán)侵權(quán)糾紛作出一審判決,認(rèn)定人工智能生成的圖片作品體現(xiàn)了原告的智力投入,具備“智力成果”要件和“獨創(chuàng)性”要件,應(yīng)當(dāng)認(rèn)定為作品,受《著作權(quán)法》保護(hù),體現(xiàn)了人工智能繪畫作品保護(hù)的司法創(chuàng)新。人類大量投入研發(fā)、優(yōu)化的人工智能算法生成的內(nèi)容應(yīng)當(dāng)被認(rèn)定為滿足“創(chuàng)造性”的要求。法院認(rèn)可自然人對其利用人工智能繪畫大模型生成圖片在符合一定條件下享有知識產(chǎn)權(quán),有利于保護(hù)和強化人在人工智能產(chǎn)業(yè)發(fā)展中的主導(dǎo)地位,鼓勵人們使用人工智能軟件創(chuàng)作更多高質(zhì)量作品,促進(jìn)新技術(shù)、新業(yè)態(tài)的健康發(fā)展。該判決填補了人工智能技術(shù)快速發(fā)展導(dǎo)致《著作權(quán)法》保護(hù)滯后的空白。
利用海量的數(shù)據(jù)進(jìn)行深度學(xué)習(xí)、訓(xùn)練并調(diào)用,很可能涉及他人仍在著作權(quán)保護(hù)期內(nèi)的作品?!渡墒饺斯ぶ悄芊?wù)管理暫行辦法》明確規(guī)定,生成式人工智能開展訓(xùn)練數(shù)據(jù)處理活動應(yīng)當(dāng)使用合法來源的數(shù)據(jù),不得侵害他人知識產(chǎn)權(quán)。如果生成式人工智能深度學(xué)習(xí)、訓(xùn)練、調(diào)用的數(shù)據(jù)中,涉及他人仍在著作權(quán)保護(hù)期內(nèi)的作品,或者有他人公開的具有競爭利益的數(shù)據(jù)或者素材,但未經(jīng)他人特別授權(quán)的,是否會構(gòu)成侵權(quán)或者不正當(dāng)競爭?根據(jù)《著作權(quán)法》第五十二條的規(guī)定,剽竊他人作品的,“未經(jīng)著作權(quán)人許可,以改編、翻譯、注釋等方式使用作品的(本法另有規(guī)定的除外)”,均構(gòu)成對他人著作權(quán)的侵權(quán)行為,應(yīng)依法承擔(dān)侵權(quán)民事責(zé)任。所以,生成式人工智能服務(wù)提供者通過其人工智能生成并輸出的內(nèi)容,與他人仍在著作權(quán)保護(hù)期內(nèi)的在先公開作品構(gòu)成實質(zhì)性相似的,只要未經(jīng)著作權(quán)人許可,應(yīng)當(dāng)構(gòu)成對他人著作權(quán)的侵犯,承擔(dān)侵權(quán)責(zé)任。
關(guān)鍵詞:
凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。
資訊
焦點
- 以AI賦能數(shù)字電網(wǎng)發(fā)展
- 1月中國倉儲指數(shù)升至近10個月新高
- 浙江義烏國際商貿(mào)城新春開市見聞:春來早 人奮進(jìn)
- 出口海外倉貨物“離境即退稅”
- 2月8日:“農(nóng)產(chǎn)品批發(fā)價格200指數(shù)”比昨天下降0.25個點
- 山西發(fā)現(xiàn)魏晉時期磚室墓 填補呂梁地區(qū)喪葬史空白
- 銀發(fā)族的春節(jié)消費圖鑒:心儀定制游 追逐智能年貨
- 廣東亮現(xiàn)代化產(chǎn)業(yè)“家底”:汽車等15個行業(yè)規(guī)模全國第一
- 商務(wù)部:中方對單邊霸凌舉措一定會采取必要措施
- 商務(wù)部:中方對單邊霸凌舉措一定會采取必要措施