• <rt id="2wkqu"><small id="2wkqu"></small></rt>
  • 世界短訊!爬蟲(chóng):數(shù)據(jù)獲取捷徑還是會(huì)招致犯罪歧途?
    2023-04-16 10:46:14 來(lái)源:未央網(wǎng) 編輯:

    在GPT、AI繪畫(huà)等人工智能大模型工具極為火熱的當(dāng)下,數(shù)據(jù)再一次成為關(guān)注的焦點(diǎn),成為與土地、勞動(dòng)、知識(shí)等并駕齊驅(qū)的重要生產(chǎn)要素。這主要是因?yàn)椋挥挟?dāng)用于AI大模型訓(xùn)練的優(yōu)質(zhì)數(shù)據(jù)足夠多,才能產(chǎn)生足夠智能、足夠強(qiáng)大的AI工具。

    那么,我們應(yīng)該如何獲取數(shù)據(jù)?使用爬蟲(chóng)工具雖然方便,但未經(jīng)他人同意爬取數(shù)據(jù)的行為是否具有法律風(fēng)險(xiǎn)?今天颯姐團(tuán)隊(duì)就與大家深入聊一聊應(yīng)當(dāng)如何正確使用爬蟲(chóng)工具獲取數(shù)據(jù)。

    使用爬蟲(chóng)獲取數(shù)據(jù)有刑事風(fēng)險(xiǎn)?

    時(shí)至今日,獲取數(shù)據(jù),或者說(shuō)數(shù)據(jù)流通的主流方式主要有兩種:一者是數(shù)據(jù)需求方與數(shù)據(jù)提供方達(dá)成協(xié)議,以開(kāi)放端口(open API)的形式使得數(shù)據(jù)使用方獲取數(shù)據(jù),該種方式合規(guī)性最好但成本較高,常見(jiàn)于商業(yè)數(shù)據(jù)流通領(lǐng)域;一者是數(shù)據(jù)需求方自行通過(guò)爬蟲(chóng)軟件,自動(dòng)取得存在于其他平臺(tái)上的數(shù)據(jù)。對(duì)于大模型AI來(lái)說(shuō),一般需要海量的數(shù)據(jù)進(jìn)行訓(xùn)練,因此純靠協(xié)議的方式一方面難以在短時(shí)間內(nèi)獲取足夠多的數(shù)據(jù),另一方面會(huì)導(dǎo)致訓(xùn)練成本過(guò)高,因此使用爬蟲(chóng)工具就成了無(wú)法回避的問(wèn)題。


    【資料圖】

    那么,使用爬蟲(chóng)工具獲取數(shù)據(jù)可能具有哪些刑事風(fēng)險(xiǎn)?制作爬蟲(chóng)工具并自行使用,在未經(jīng)數(shù)據(jù)來(lái)源方同意或違反robot協(xié)議的情況下,直接爬取大量數(shù)據(jù)的行為,司法實(shí)踐中常被認(rèn)定為侵犯公民個(gè)人信息罪、侵犯商業(yè)秘密罪抑或是侵犯著作權(quán)罪,而具體構(gòu)成何種犯罪則取決于行為人通過(guò)爬蟲(chóng)工具實(shí)際取得了什么類(lèi)型的數(shù)據(jù)。

    侵犯公民個(gè)人信息罪

    對(duì)于諸多數(shù)據(jù)分析公司、營(yíng)銷(xiāo)公司和各種數(shù)據(jù)驅(qū)動(dòng)型企業(yè)來(lái)說(shuō),公民個(gè)人信息的商業(yè)價(jià)值是巨大的,不僅可以將其用于用戶(hù)畫(huà)像、市場(chǎng)分析,還可以向公民定向推送商業(yè)廣告等,因此我國(guó)司法機(jī)關(guān)一直以來(lái)對(duì)侵犯公民個(gè)人信息的行為都保持著較為嚴(yán)厲的處理態(tài)度。

    因此,如果行為人利用爬蟲(chóng)爬取的是公民個(gè)人信息,有可能構(gòu)成“侵犯公民個(gè)人信息罪”。這主要是因?yàn)橐耘廊」駛€(gè)人信息是一種未經(jīng)公民知情同意的非法獲取的行為。《刑法》第二百五十三條之一第三款規(guī)定:“竊取或者以其他方法非法獲取公民個(gè)人信息的,依照第一款的規(guī)定處罰?!睋Q言之,即使行為人沒(méi)有將獲取的公民個(gè)人信息出售或向他人提供,但只要獲取的方式不當(dāng)就有可能構(gòu)成該罪。

    在(2021)浙0703刑初17號(hào)案中,郭某伙同“楊某”通過(guò)爬蟲(chóng)軟件從互聯(lián)網(wǎng)上非法獲取某寶、某東等多個(gè)電商平臺(tái)上的公民個(gè)人信息并用于出售牟利,這些信息中包含能特定到個(gè)人的姓名、手機(jī)號(hào)碼、住址等,共計(jì)541424條。最終法院認(rèn)定郭某構(gòu)成“侵犯公民個(gè)人信息罪”判處四年有期徒刑。

    侵犯商業(yè)秘密罪

    如果行為人利用爬蟲(chóng)工具爬取的是商業(yè)秘密,有可能構(gòu)成“侵犯商業(yè)秘密罪”。一般來(lái)說(shuō),“商業(yè)秘密”是指不為公眾所知悉,能為權(quán)利人帶來(lái)經(jīng)濟(jì)利益,具有實(shí)用性并經(jīng)權(quán)利人采取保密措施的技術(shù)信息和經(jīng)營(yíng)信息。在如今大數(shù)據(jù)時(shí)代,數(shù)據(jù)對(duì)于被爬方而言無(wú)疑是最為重要的資產(chǎn)之一。

    參照《最高人民法院關(guān)于審理侵犯商業(yè)秘密民事案件適用法律若干問(wèn)題的規(guī)定》的規(guī)定,算法、數(shù)據(jù)、計(jì)算機(jī)程序及其有關(guān)文檔等信息,人民法院可以認(rèn)定為構(gòu)成《反不正當(dāng)競(jìng)爭(zhēng)法》第九條第四款所稱(chēng)的技術(shù)信息(第九條第四款為:“本法所稱(chēng)的商業(yè)秘密,是指不為公眾所知悉、具有商業(yè)價(jià)值并經(jīng)權(quán)利人采取相應(yīng)保密措施的技術(shù)信息、經(jīng)營(yíng)信息等商業(yè)信息”)。因此,如果利用爬蟲(chóng)軟件爬取他人“技術(shù)信息”可能會(huì)構(gòu)成侵犯商業(yè)秘密罪。

    但需要說(shuō)明的是,由于使用爬蟲(chóng)工具獲取他人商業(yè)信息而引發(fā)的不正當(dāng)競(jìng)爭(zhēng)之訴雖然已經(jīng)不少,但真正因使用爬蟲(chóng)工具獲取他人商業(yè)秘密而構(gòu)成侵犯商業(yè)秘密罪的案件尚未出現(xiàn),這可能是由于傳統(tǒng)的商業(yè)秘密如食品配方、設(shè)計(jì)圖紙、生產(chǎn)方法等自有其特殊性,持有人一般不會(huì)將其上傳到網(wǎng)絡(luò)保存之故,但我們認(rèn)為,隨著網(wǎng)絡(luò)信息的發(fā)展,商業(yè)秘密所指稱(chēng)的對(duì)象和客體范圍在不斷的擴(kuò)大,不排除未來(lái)會(huì)發(fā)生因爬取他人商業(yè)秘密而被實(shí)際定罪處罰的案件出現(xiàn)。

    侵犯著作權(quán)罪

    如果行為人利用爬蟲(chóng)工具爬取的是他人享有著作權(quán)的作品,有可能構(gòu)成“侵犯著作權(quán)罪”。我國(guó)《刑法》第二百一十七條第一款規(guī)定:在以營(yíng)利為目的的基礎(chǔ)上,“未經(jīng)著作權(quán)人許可,復(fù)制發(fā)行、通過(guò)信息網(wǎng)絡(luò)向公眾傳播其文字作品、音樂(lè)、美術(shù)、視聽(tīng)作品、計(jì)算機(jī)軟件及法律、行政法規(guī)規(guī)定的其他作品的”,違法所得數(shù)額較大或者有其他嚴(yán)重情節(jié)的構(gòu)成“侵犯著作權(quán)罪”

    同時(shí),2021年的《刑法》第十一修正案修改了第二百一十七條,為“侵犯著作權(quán)罪”增加了一個(gè)針對(duì)爬蟲(chóng)等技術(shù)工具的條款:“未經(jīng)著作權(quán)人或者與著作權(quán)有關(guān)的權(quán)利人許可,故意避開(kāi)或者破壞權(quán)利人為其作品、錄音錄像制品等采取的保護(hù)著作權(quán)或者與著作權(quán)有關(guān)的權(quán)利的技術(shù)措施的”。換言之,即使行為人使用爬蟲(chóng)工具后沒(méi)有在互聯(lián)網(wǎng)上傳播或向他人提供非法獲取的作品,但只要利用爬蟲(chóng)工具故意避開(kāi)或破壞了與保護(hù)著作權(quán)相關(guān)的技術(shù)措施,也可以構(gòu)成侵犯著作權(quán)罪。

    在(2022)贛0825刑初號(hào)案件中,被告人肖某于2015年開(kāi)發(fā)了一款名為“XX免費(fèi)小說(shuō)”的App。肖某從2019年開(kāi)始,租用某鵝廠云服務(wù)器將“爬蟲(chóng)”程序編程植入“XX免費(fèi)小說(shuō)”App中,該程序能夠自動(dòng)扒取互聯(lián)網(wǎng)上各個(gè)小說(shuō)網(wǎng)站的網(wǎng)頁(yè)鏈接、小說(shuō)名稱(chēng)、小說(shuō)作者、小說(shuō)簡(jiǎn)介、小說(shuō)圖片等信息并進(jìn)行分類(lèi)存放在騰訊云服務(wù)器當(dāng)中,且不間斷更新扒取內(nèi)容,用戶(hù)在軟件中搜索小說(shuō)相關(guān)文字后,服務(wù)器自動(dòng)從扒取到的小說(shuō)信息中提取出來(lái),通過(guò)轉(zhuǎn)碼將第三方網(wǎng)頁(yè)進(jìn)行重新排版,再插入廣告公司提供的廣告供用戶(hù)閱讀。廣告投放方每月根據(jù)該程序中的點(diǎn)擊量按每次單價(jià)0.2元至1元不等的價(jià)格為肖某結(jié)算廣告推廣費(fèi)。

    法院最終依據(jù)《最高人民檢察院、公安部關(guān)于公安機(jī)關(guān)管轄的刑事案件立案追訴標(biāo)準(zhǔn)的規(guī)定(一)》第二十六條,將肖某使用爬蟲(chóng)軟件獲得他人享有著作權(quán)作品,并在App中向讀者免費(fèi)提供的行為,認(rèn)定為侵犯公民個(gè)人信息罪中“未經(jīng)著作權(quán)人許可,復(fù)制發(fā)行、通過(guò)信息網(wǎng)絡(luò)向公眾傳播其文字作品”的行為,判處肖某構(gòu)成侵犯著作權(quán)罪。

    寫(xiě)在最后

    在當(dāng)今時(shí)代,數(shù)據(jù)已經(jīng)越來(lái)越成為一種極為重要的生產(chǎn)力要素,颯姐團(tuán)隊(duì)認(rèn)為,監(jiān)管機(jī)構(gòu)和司法機(jī)關(guān)應(yīng)當(dāng)認(rèn)識(shí)到,只要是出于合法利用數(shù)據(jù)的目的,在正確使用技術(shù)的前提下,爬蟲(chóng)未必就是一種洪水猛獸。許可老師同樣認(rèn)為:“蘊(yùn)含于數(shù)據(jù)爬取中的數(shù)據(jù)自由流通是數(shù)字社會(huì)的重要價(jià)值......即使在知識(shí)產(chǎn)權(quán)出現(xiàn)之后,事實(shí)或思想也沒(méi)有納入法律保護(hù)的范圍,任何人對(duì)事實(shí)、數(shù)據(jù)或碎片化的信息均不享有權(quán)利?!?/p>

    總之,颯姐團(tuán)隊(duì)認(rèn)為,數(shù)據(jù)需求方不應(yīng)急于求成,在不熟悉數(shù)據(jù)合規(guī)相關(guān)法律、法規(guī)的情況下就急切的通過(guò)爬蟲(chóng)任意爬取數(shù)據(jù)。監(jiān)管機(jī)關(guān)也不應(yīng)當(dāng)直接將使用爬蟲(chóng)的行為視為一種違法、犯罪行為,而是應(yīng)當(dāng)更加耐心細(xì)致處理相關(guān)案件,長(zhǎng)此以往才能促進(jìn)數(shù)字經(jīng)濟(jì)的向上發(fā)展。

    本文系未央網(wǎng)專(zhuān)欄作者:肖颯 發(fā)表,內(nèi)容屬作者個(gè)人觀點(diǎn),不代表網(wǎng)站觀點(diǎn),未經(jīng)許可嚴(yán)禁轉(zhuǎn)載,違者必究!

    關(guān)鍵詞:

    相關(guān)閱讀
    分享到:
    版權(quán)和免責(zé)申明

    凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門(mén)戶(hù)"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門(mén)戶(hù)"的稿件,均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門(mén)戶(hù)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來(lái)源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門(mén)戶(hù)",并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門(mén)戶(hù)"的電頭。

    久久激情五月网站,一本色道综合亚洲精品精品,午夜电影久久久久久,中文无码AV片在线 成a在线观看视频播放 婷婷色中文在线观看
  • <rt id="2wkqu"><small id="2wkqu"></small></rt>