• <rt id="2wkqu"><small id="2wkqu"></small></rt>
  • 世界短訊!爬蟲:數(shù)據(jù)獲取捷徑還是會招致犯罪歧途?
    2023-04-16 10:46:14 來源:未央網(wǎng) 編輯:

    在GPT、AI繪畫等人工智能大模型工具極為火熱的當(dāng)下,數(shù)據(jù)再一次成為關(guān)注的焦點,成為與土地、勞動、知識等并駕齊驅(qū)的重要生產(chǎn)要素。這主要是因為,只有當(dāng)用于AI大模型訓(xùn)練的優(yōu)質(zhì)數(shù)據(jù)足夠多,才能產(chǎn)生足夠智能、足夠強大的AI工具。

    那么,我們應(yīng)該如何獲取數(shù)據(jù)?使用爬蟲工具雖然方便,但未經(jīng)他人同意爬取數(shù)據(jù)的行為是否具有法律風(fēng)險?今天颯姐團隊就與大家深入聊一聊應(yīng)當(dāng)如何正確使用爬蟲工具獲取數(shù)據(jù)。

    使用爬蟲獲取數(shù)據(jù)有刑事風(fēng)險?

    時至今日,獲取數(shù)據(jù),或者說數(shù)據(jù)流通的主流方式主要有兩種:一者是數(shù)據(jù)需求方與數(shù)據(jù)提供方達成協(xié)議,以開放端口(open API)的形式使得數(shù)據(jù)使用方獲取數(shù)據(jù),該種方式合規(guī)性最好但成本較高,常見于商業(yè)數(shù)據(jù)流通領(lǐng)域;一者是數(shù)據(jù)需求方自行通過爬蟲軟件,自動取得存在于其他平臺上的數(shù)據(jù)。對于大模型AI來說,一般需要海量的數(shù)據(jù)進行訓(xùn)練,因此純靠協(xié)議的方式一方面難以在短時間內(nèi)獲取足夠多的數(shù)據(jù),另一方面會導(dǎo)致訓(xùn)練成本過高,因此使用爬蟲工具就成了無法回避的問題。


    【資料圖】

    那么,使用爬蟲工具獲取數(shù)據(jù)可能具有哪些刑事風(fēng)險?制作爬蟲工具并自行使用,在未經(jīng)數(shù)據(jù)來源方同意或違反robot協(xié)議的情況下,直接爬取大量數(shù)據(jù)的行為,司法實踐中常被認定為侵犯公民個人信息罪、侵犯商業(yè)秘密罪抑或是侵犯著作權(quán)罪,而具體構(gòu)成何種犯罪則取決于行為人通過爬蟲工具實際取得了什么類型的數(shù)據(jù)。

    侵犯公民個人信息罪

    對于諸多數(shù)據(jù)分析公司、營銷公司和各種數(shù)據(jù)驅(qū)動型企業(yè)來說,公民個人信息的商業(yè)價值是巨大的,不僅可以將其用于用戶畫像、市場分析,還可以向公民定向推送商業(yè)廣告等,因此我國司法機關(guān)一直以來對侵犯公民個人信息的行為都保持著較為嚴厲的處理態(tài)度。

    因此,如果行為人利用爬蟲爬取的是公民個人信息,有可能構(gòu)成“侵犯公民個人信息罪”。這主要是因為以爬取公民個人信息是一種未經(jīng)公民知情同意的非法獲取的行為。《刑法》第二百五十三條之一第三款規(guī)定:“竊取或者以其他方法非法獲取公民個人信息的,依照第一款的規(guī)定處罰?!睋Q言之,即使行為人沒有將獲取的公民個人信息出售或向他人提供,但只要獲取的方式不當(dāng)就有可能構(gòu)成該罪。

    在(2021)浙0703刑初17號案中,郭某伙同“楊某”通過爬蟲軟件從互聯(lián)網(wǎng)上非法獲取某寶、某東等多個電商平臺上的公民個人信息并用于出售牟利,這些信息中包含能特定到個人的姓名、手機號碼、住址等,共計541424條。最終法院認定郭某構(gòu)成“侵犯公民個人信息罪”判處四年有期徒刑。

    侵犯商業(yè)秘密罪

    如果行為人利用爬蟲工具爬取的是商業(yè)秘密,有可能構(gòu)成“侵犯商業(yè)秘密罪”。一般來說,“商業(yè)秘密”是指不為公眾所知悉,能為權(quán)利人帶來經(jīng)濟利益,具有實用性并經(jīng)權(quán)利人采取保密措施的技術(shù)信息和經(jīng)營信息。在如今大數(shù)據(jù)時代,數(shù)據(jù)對于被爬方而言無疑是最為重要的資產(chǎn)之一。

    參照《最高人民法院關(guān)于審理侵犯商業(yè)秘密民事案件適用法律若干問題的規(guī)定》的規(guī)定,算法、數(shù)據(jù)、計算機程序及其有關(guān)文檔等信息,人民法院可以認定為構(gòu)成《反不正當(dāng)競爭法》第九條第四款所稱的技術(shù)信息(第九條第四款為:“本法所稱的商業(yè)秘密,是指不為公眾所知悉、具有商業(yè)價值并經(jīng)權(quán)利人采取相應(yīng)保密措施的技術(shù)信息、經(jīng)營信息等商業(yè)信息”)。因此,如果利用爬蟲軟件爬取他人“技術(shù)信息”可能會構(gòu)成侵犯商業(yè)秘密罪。

    但需要說明的是,由于使用爬蟲工具獲取他人商業(yè)信息而引發(fā)的不正當(dāng)競爭之訴雖然已經(jīng)不少,但真正因使用爬蟲工具獲取他人商業(yè)秘密而構(gòu)成侵犯商業(yè)秘密罪的案件尚未出現(xiàn),這可能是由于傳統(tǒng)的商業(yè)秘密如食品配方、設(shè)計圖紙、生產(chǎn)方法等自有其特殊性,持有人一般不會將其上傳到網(wǎng)絡(luò)保存之故,但我們認為,隨著網(wǎng)絡(luò)信息的發(fā)展,商業(yè)秘密所指稱的對象和客體范圍在不斷的擴大,不排除未來會發(fā)生因爬取他人商業(yè)秘密而被實際定罪處罰的案件出現(xiàn)。

    侵犯著作權(quán)罪

    如果行為人利用爬蟲工具爬取的是他人享有著作權(quán)的作品,有可能構(gòu)成“侵犯著作權(quán)罪”。我國《刑法》第二百一十七條第一款規(guī)定:在以營利為目的的基礎(chǔ)上,“未經(jīng)著作權(quán)人許可,復(fù)制發(fā)行、通過信息網(wǎng)絡(luò)向公眾傳播其文字作品、音樂、美術(shù)、視聽作品、計算機軟件及法律、行政法規(guī)規(guī)定的其他作品的”,違法所得數(shù)額較大或者有其他嚴重情節(jié)的構(gòu)成“侵犯著作權(quán)罪”

    同時,2021年的《刑法》第十一修正案修改了第二百一十七條,為“侵犯著作權(quán)罪”增加了一個針對爬蟲等技術(shù)工具的條款:“未經(jīng)著作權(quán)人或者與著作權(quán)有關(guān)的權(quán)利人許可,故意避開或者破壞權(quán)利人為其作品、錄音錄像制品等采取的保護著作權(quán)或者與著作權(quán)有關(guān)的權(quán)利的技術(shù)措施的”。換言之,即使行為人使用爬蟲工具后沒有在互聯(lián)網(wǎng)上傳播或向他人提供非法獲取的作品,但只要利用爬蟲工具故意避開或破壞了與保護著作權(quán)相關(guān)的技術(shù)措施,也可以構(gòu)成侵犯著作權(quán)罪。

    在(2022)贛0825刑初號案件中,被告人肖某于2015年開發(fā)了一款名為“XX免費小說”的App。肖某從2019年開始,租用某鵝廠云服務(wù)器將“爬蟲”程序編程植入“XX免費小說”App中,該程序能夠自動扒取互聯(lián)網(wǎng)上各個小說網(wǎng)站的網(wǎng)頁鏈接、小說名稱、小說作者、小說簡介、小說圖片等信息并進行分類存放在騰訊云服務(wù)器當(dāng)中,且不間斷更新扒取內(nèi)容,用戶在軟件中搜索小說相關(guān)文字后,服務(wù)器自動從扒取到的小說信息中提取出來,通過轉(zhuǎn)碼將第三方網(wǎng)頁進行重新排版,再插入廣告公司提供的廣告供用戶閱讀。廣告投放方每月根據(jù)該程序中的點擊量按每次單價0.2元至1元不等的價格為肖某結(jié)算廣告推廣費。

    法院最終依據(jù)《最高人民檢察院、公安部關(guān)于公安機關(guān)管轄的刑事案件立案追訴標(biāo)準(zhǔn)的規(guī)定(一)》第二十六條,將肖某使用爬蟲軟件獲得他人享有著作權(quán)作品,并在App中向讀者免費提供的行為,認定為侵犯公民個人信息罪中“未經(jīng)著作權(quán)人許可,復(fù)制發(fā)行、通過信息網(wǎng)絡(luò)向公眾傳播其文字作品”的行為,判處肖某構(gòu)成侵犯著作權(quán)罪。

    寫在最后

    在當(dāng)今時代,數(shù)據(jù)已經(jīng)越來越成為一種極為重要的生產(chǎn)力要素,颯姐團隊認為,監(jiān)管機構(gòu)和司法機關(guān)應(yīng)當(dāng)認識到,只要是出于合法利用數(shù)據(jù)的目的,在正確使用技術(shù)的前提下,爬蟲未必就是一種洪水猛獸。許可老師同樣認為:“蘊含于數(shù)據(jù)爬取中的數(shù)據(jù)自由流通是數(shù)字社會的重要價值......即使在知識產(chǎn)權(quán)出現(xiàn)之后,事實或思想也沒有納入法律保護的范圍,任何人對事實、數(shù)據(jù)或碎片化的信息均不享有權(quán)利?!?/p>

    總之,颯姐團隊認為,數(shù)據(jù)需求方不應(yīng)急于求成,在不熟悉數(shù)據(jù)合規(guī)相關(guān)法律、法規(guī)的情況下就急切的通過爬蟲任意爬取數(shù)據(jù)。監(jiān)管機關(guān)也不應(yīng)當(dāng)直接將使用爬蟲的行為視為一種違法、犯罪行為,而是應(yīng)當(dāng)更加耐心細致處理相關(guān)案件,長此以往才能促進數(shù)字經(jīng)濟的向上發(fā)展。

    本文系未央網(wǎng)專欄作者:肖颯 發(fā)表,內(nèi)容屬作者個人觀點,不代表網(wǎng)站觀點,未經(jīng)許可嚴禁轉(zhuǎn)載,違者必究!

    關(guān)鍵詞:

    相關(guān)閱讀
    分享到:
    版權(quán)和免責(zé)申明

    凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的稿件,均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶獨家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶",并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的電頭。

    久久激情五月网站,一本色道综合亚洲精品精品,午夜电影久久久久久,中文无码AV片在线 成a在线观看视频播放 婷婷色中文在线观看
  • <rt id="2wkqu"><small id="2wkqu"></small></rt>