嚴(yán)柏
什么是瀏覽器指紋,看看幾類(lèi)你被互聯(lián)網(wǎng)巨頭監(jiān)控的場(chǎng)景:
場(chǎng)景一:在網(wǎng)站上瀏覽了某個(gè)商品,了解了相關(guān)的商品信息,但并沒(méi)有下單購(gòu)買(mǎi),甚至沒(méi)有進(jìn)行登錄操作,過(guò)兩天同臺(tái)電腦訪問(wèn)其他網(wǎng)站的時(shí)候卻發(fā)現(xiàn)很多同類(lèi)商品的廣告。
場(chǎng)景二:在某博客中你有多個(gè)小號(hào),這些小號(hào)的存在就是為了刷某個(gè)帖子的熱度或者進(jìn)行輿論引導(dǎo),又或者純粹進(jìn)行流量交易,即便你在切換賬號(hào)的時(shí)候清空了Cookie、本地緩存,重開(kāi)路由器來(lái)進(jìn)行操作,你覺(jué)得自己足夠小心,但是管理人員可能還是知道這是同一個(gè)人在操作,從而被打擊。
一般情況下,網(wǎng)站或者廣告商都想要一種技術(shù)可以在網(wǎng)絡(luò)上精確地定位到每一個(gè)個(gè)體,就算你沒(méi)有賬號(hào),沒(méi)有登錄,也可以通過(guò)收集這些個(gè)體的數(shù)據(jù),然后加以分析之后更加精確地去推送廣告和其他的一些活動(dòng)。而這個(gè)技術(shù)就是瀏覽器指紋,這還是用前端技術(shù)來(lái)實(shí)現(xiàn)的。
目前包括Firefox、Safari、Opera和Chrome在內(nèi)的瀏覽器已開(kāi)始提供針對(duì)使用Cookie和IP地址的跨站點(diǎn)跟蹤方法的保護(hù),尤其是為了打擊指紋。
在最近的一項(xiàng)研究中,愛(ài)荷華大學(xué)和加州大學(xué)的研究人員戴維斯研究了一種基于機(jī)器學(xué)習(xí)的方法,稱(chēng)為FP-Inspector,該方法訓(xùn)練分類(lèi)器學(xué)習(xí)指紋。共同作者說(shuō),通過(guò)將靜態(tài)和動(dòng)態(tài)分析相結(jié)合來(lái)提取句法和語(yǔ)義特征,從而有效地補(bǔ)充了彼此的局限性,F(xiàn)P-Inspector克服了動(dòng)態(tài)分析的覆蓋范圍問(wèn)題,同時(shí)解決了靜態(tài)分析無(wú)法處理混淆的問(wèn)題。
一些瀏覽器和隱私工具已嘗試使用API更改和網(wǎng)絡(luò)請(qǐng)求阻止之類(lèi)的技術(shù)來(lái)減輕指紋跟蹤。但是這些需要人工分析,并且難以限制內(nèi)容交付網(wǎng)絡(luò)之類(lèi)的雙重用途第三方提供的腳本。因?yàn)楸仨殗?yán)格定義每個(gè)硬編碼的試探法,以避免誤報(bào),并不斷進(jìn)行更新以捕獲不斷發(fā)展的指紋和非指紋。
相比之下,基于JavaScript的FP-Insp
ector具有獨(dú)立的檢測(cè)組件,該檢測(cè)組件從腳本中提取特征(例如語(yǔ)法和執(zhí)行)并訓(xùn)練分類(lèi)器以識(shí)別指紋(無(wú)監(jiān)督和受監(jiān)督的特征選擇方法將用于訓(xùn)練分類(lèi)器的特征數(shù)量限制為1000個(gè)靜態(tài)特征和1000個(gè)動(dòng)態(tài)特征)。
緩解組件將限制應(yīng)用于檢測(cè)到的腳本;FP-Inspector限制所有已知正在使用指紋識(shí)別的腳本的訪問(wèn),并阻止請(qǐng)求下載從執(zhí)行指紋識(shí)別的域提供的腳本。
為了培訓(xùn)FP-Inspector,研究人員抓取了20000個(gè)網(wǎng)站的主頁(yè),以編譯包含153354個(gè)不同執(zhí)行腳本的17629個(gè)網(wǎng)站的列表。他們從100000個(gè)訪問(wèn)量最高的網(wǎng)站(Alexa的全球排名)中選出了前10000個(gè)網(wǎng)站,并從其余的10000個(gè)網(wǎng)站中隨機(jī)抽取了樣本,使它們可以覆蓋最受歡迎的網(wǎng)站和下層網(wǎng)站在實(shí)驗(yàn)中。實(shí)驗(yàn)表明,F(xiàn)P-Inspector的性能很好,與手動(dòng)設(shè)計(jì)的啟發(fā)式方法相比,檢測(cè)到的指紋腳本多出26%,準(zhǔn)確率達(dá)99.9%。
為了衡量網(wǎng)絡(luò)上指紋識(shí)別腳本的流行程度,研究人員將FP-Inspector的檢測(cè)組件應(yīng)用于Alexa排名最高的71112個(gè)網(wǎng)站。他們發(fā)現(xiàn),現(xiàn)在有超過(guò)四分之一的頂級(jí)站點(diǎn)都部署了指紋識(shí)別(前十萬(wàn)個(gè)站點(diǎn)中的10.18%,總計(jì)2349個(gè)唯一域),并且指紋在不同類(lèi)別的網(wǎng)站上使用不均。使用率范圍從將近14%的新聞網(wǎng)站到僅1%的與信貸和債務(wù)相關(guān)的網(wǎng)站,這是作者之間的差異,這是因?yàn)橹讣y識(shí)別在依賴(lài)廣告和付費(fèi)墻進(jìn)行貨幣化的網(wǎng)站上很普遍。
研究人員說(shuō),他們計(jì)劃發(fā)布提供指紋識(shí)別腳本的域,以跟蹤保護(hù)列表,例如Disconnect和EasyPrivacy。他們寫(xiě)道:“我們計(jì)劃向面向隱私的瀏覽器供應(yīng)商和標(biāo)準(zhǔn)機(jī)構(gòu)報(bào)告這些API的名稱(chēng)和統(tǒng)計(jì)信息。”