曾泓竣 曾千容
摘 要:在大數(shù)據(jù)時(shí)代,隨著搜索引擎利用的日益常態(tài)化,數(shù)據(jù)爬取也隨之迅猛發(fā)展,勢必由此產(chǎn)生許多法律層面問題。本文將從知識產(chǎn)權(quán)保護(hù)的角度,對數(shù)據(jù)爬取衍生出的知識產(chǎn)權(quán)問題以及法律適用進(jìn)行分析。
關(guān)鍵詞:數(shù)據(jù)處理;知識產(chǎn)權(quán);法律適用
中圖分類號:D922.294文獻(xiàn)標(biāo)識碼:A文章編號:2095-4379-(2019)17-0225-01
作者簡介:曾泓竣(1996-),男,廣西北海人,廣西大學(xué),本科。
網(wǎng)絡(luò)爬蟲,是一種用來自動挖掘互聯(lián)網(wǎng)信息的網(wǎng)絡(luò)機(jī)器人,其目的一般用于編纂網(wǎng)絡(luò)索引,也可以用于網(wǎng)絡(luò)搜索引擎等站點(diǎn)通過爬蟲軟件更新自身的網(wǎng)站內(nèi)容或其對其他網(wǎng)站的索引。網(wǎng)絡(luò)爬蟲始于一張被稱作種子的統(tǒng)一資源地址(URL)列表。爬蟲在執(zhí)行的過程中復(fù)制歸檔和保存網(wǎng)站上的信息,這些文件通常儲存,使他們可以較容易的被查看,閱讀和瀏覽他們存儲的網(wǎng)站上并即時(shí)更新的信息。
robots.txt是一種ASCII編碼的文本文件,通常存放于網(wǎng)頁服務(wù)器中,它將提示網(wǎng)絡(luò)爬蟲哪些網(wǎng)頁不應(yīng)被抓取,哪些網(wǎng)頁可以抓取。但這只是一個(gè)約定俗成的規(guī)范,并不具有法律效力,并不能保證所有爬蟲都準(zhǔn)守這一規(guī)則。
目前,我國對爬蟲技術(shù)還沒有專門的法律法規(guī)加以規(guī)定。在通常意義上,爬蟲技術(shù)只是更快速有效地收集互聯(lián)網(wǎng)中的內(nèi)容和信息,因此從技術(shù)中立的角度來看,爬蟲技術(shù)本身并沒有存在任何違反現(xiàn)有的法律法規(guī)之處。隨著大數(shù)據(jù)產(chǎn)業(yè)的快速發(fā)展,數(shù)據(jù)爬取隨著各網(wǎng)絡(luò)主體對資源的爭奪而越發(fā)激烈。數(shù)據(jù)爬取行為存在越來越多的問題和擔(dān)憂,爬蟲技術(shù)帶來的各種問題和顧慮日漸增加。
由于爬蟲的工作方式是通過解析代碼,為了規(guī)避網(wǎng)站經(jīng)營者設(shè)置的反爬蟲措施,爬蟲運(yùn)營方有可能會采取偽裝行為。因此通過爬蟲,爬蟲控制者將有可能訪問和抓取到一般用戶無法接觸到的內(nèi)容。除了使用數(shù)據(jù)爬取技術(shù)獲取數(shù)據(jù)的自身風(fēng)險(xiǎn)外,爬蟲控制者還可能因獲取某些受法律保護(hù)的信息而面臨違法、違規(guī)甚至犯罪的風(fēng)險(xiǎn)。
(一)抓取到的信息屬于受著作權(quán)法保護(hù)的作品
互聯(lián)網(wǎng)中的很多數(shù)據(jù)都可能具備獨(dú)創(chuàng)性,例如文章、圖片、用戶評論等都存在構(gòu)成著作權(quán)法保護(hù)的可能性。對于網(wǎng)絡(luò)爬蟲的數(shù)據(jù)抓取行為是否涉嫌侵權(quán),主要存在下列情況:
就網(wǎng)絡(luò)訪問行為而言,由于爬蟲本身僅僅是對人類訪問行為的模仿,因此訪問行為不會構(gòu)成對人類訪問本身可以訪問的信息的侵權(quán)行為。但是,如果被數(shù)據(jù)抓取到的網(wǎng)站本身設(shè)置有一些技術(shù)措施,以確保只有特定的用戶才可以通過這些技術(shù)措施以訪問這些信息,但是爬蟲運(yùn)營方突破了這些限制,則爬蟲運(yùn)營方的訪問行為可能涉嫌破壞技術(shù)措施的侵權(quán)或違法違規(guī)行為。
就數(shù)據(jù)保存本身而論,根據(jù)著作權(quán)法的角度來闡述,數(shù)據(jù)抓取行為本質(zhì)上是對信息的復(fù)制,因此這些行為有可能構(gòu)成對著作權(quán)人的復(fù)制權(quán)的侵犯。當(dāng)然,我國對臨時(shí)復(fù)制行為是持寬容的態(tài)度。但如果爬蟲控制者在自己的網(wǎng)站上獲取信息并公開傳播抓取到的信息,則可能進(jìn)一步侵犯著作權(quán)人在互聯(lián)網(wǎng)上傳播信息的信息傳播權(quán)。
(二)抓取到的信息屬于商業(yè)秘密
雖然在互聯(lián)網(wǎng)上的公開信息很難構(gòu)成商業(yè)秘密,但網(wǎng)絡(luò)上的某些信息只能由特定的用戶通過采取技術(shù)措施訪問。因此,網(wǎng)絡(luò)信息可能仍然具有商業(yè)秘密所要求的保密性和秘密性,可能構(gòu)成商業(yè)秘密。
根據(jù)《反不正當(dāng)競爭法》第九條相關(guān)規(guī)定,以不正當(dāng)手段獲取他人商業(yè)秘密的行為即構(gòu)成侵犯商業(yè)秘密。后續(xù)該等信息如被進(jìn)一步加以利用,則構(gòu)成對他人商業(yè)秘密的披露和使用,同樣構(gòu)成對他人的商業(yè)秘密的侵犯。
因此,如果爬蟲控制者有意規(guī)避網(wǎng)站運(yùn)營方為獲取信息,突破網(wǎng)站運(yùn)營方設(shè)置的反爬蟲保護(hù)措施,保存甚至公開普通用戶無法訪問的網(wǎng)站內(nèi)容,從而構(gòu)成商業(yè)秘密的侵犯,爬蟲控制者的行為構(gòu)成侵犯他人的商業(yè)秘密。
(三)抓取到的信息屬于反不正當(dāng)競爭保護(hù)的數(shù)據(jù)
如果爬蟲抓取的是UGC模式的網(wǎng)站上用戶發(fā)布的信息,并在爬蟲運(yùn)營者自家的產(chǎn)品或者服務(wù)中提供這些內(nèi)容,則存在構(gòu)成不正當(dāng)競爭的較大的風(fēng)險(xiǎn)。因?yàn)檫@些案件的涉及數(shù)據(jù)和內(nèi)容是構(gòu)成原告競爭力的主要來源。
如在D公司訴B公司不正當(dāng)競爭案件等案件中,法院均認(rèn)為被告未經(jīng)許可,擅自獲取和使用原告網(wǎng)站數(shù)據(jù)的行為影響了原網(wǎng)站的正常使用和獲利,攫取了他人的經(jīng)營成果,損害了互聯(lián)網(wǎng)的市場競爭秩序,構(gòu)成對原告產(chǎn)品的實(shí)質(zhì)性替代,構(gòu)成不正當(dāng)競爭。
為規(guī)避使用爬蟲過程中產(chǎn)生相關(guān)知識產(chǎn)權(quán)侵權(quán)風(fēng)險(xiǎn),爬蟲控制者使用爬蟲時(shí)應(yīng):1.不違反網(wǎng)站設(shè)置的robots協(xié)議;2.在爬蟲策略設(shè)置上,構(gòu)成版權(quán)保護(hù)的數(shù)據(jù),某些特定網(wǎng)站的用戶生成內(nèi)容不能隨意抓取;3.先審查所抓取的內(nèi)容,方能使用、傳播抓取到的相關(guān)數(shù)據(jù)。
[ 參 考 文 獻(xiàn) ]
[1]史欣媛.互聯(lián)網(wǎng)新型不正當(dāng)競爭案件中的行為正當(dāng)性判定標(biāo)準(zhǔn)研究[J].安徽大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版),2017(1):122-130.
[2]覃騰英.《反不正當(dāng)競爭法》視閾下屏蔽廣告行為的定性——以消費(fèi)者利益保護(hù)為視角[J].電子知識產(chǎn)權(quán),2018(6):64-73.