• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      社交網(wǎng)絡(luò)機器人檢測綜述

      2022-12-08 04:32:10楊舟
      關(guān)鍵詞:賬號機器社交

      ◆楊舟

      社交網(wǎng)絡(luò)機器人檢測綜述

      ◆楊舟

      (四川大學(xué)網(wǎng)絡(luò)空間安全學(xué)院 四川 610065)

      隨著以微博為代表的社交網(wǎng)絡(luò)平臺的迅速流行,出現(xiàn)了大量社交機器人賬號,部分惡意的機器人在社交網(wǎng)絡(luò)平臺上散布不良信息,進(jìn)行虛假宣傳,甚至發(fā)布煽動性言論、引發(fā)對立情緒。惡意機器人賬號的存在對網(wǎng)絡(luò)空間安全產(chǎn)生了嚴(yán)重威脅,因此,實現(xiàn)社交機器人的有效檢測對于凈化網(wǎng)絡(luò)內(nèi)容、維護(hù)真實的輿論環(huán)境具有十分重要的意義。目前,主要的社交機器人檢測方法包括基于圖的檢測方法、基于機器學(xué)習(xí)的檢測方法、基于異常的檢測方法以及基于眾包的檢測方法。與此同時,社交機器人檢測技術(shù)還面臨著數(shù)據(jù)集難以穩(wěn)定標(biāo)注、缺乏健壯的特征等挑戰(zhàn)。本文歸納和整理了社交機器人檢測研究現(xiàn)狀,并簡要介紹了各項技術(shù)及其優(yōu)缺點。最后,本文總結(jié)和展望了當(dāng)前方法可以進(jìn)一步改進(jìn)的方向。

      社交網(wǎng)絡(luò);機器人賬號檢測;機器學(xué)習(xí);深度學(xué)習(xí)

      隨著社交網(wǎng)絡(luò)平臺的迅速流行,出現(xiàn)了一類“特殊”的社交網(wǎng)絡(luò)賬號——它們由計算機算法自動生成和控制,能像普通賬號一樣長期活躍在社交網(wǎng)絡(luò)上。這些能夠模仿人類在社交網(wǎng)絡(luò)平臺上進(jìn)行活動的賬號被稱作社交機器人。

      社交機器人的出現(xiàn)對社交網(wǎng)絡(luò)環(huán)境原有的秩序產(chǎn)生了不可忽視的影響,部分惡意的機器人賬號有組織地傳播廣告或釣魚網(wǎng)站鏈接,誘導(dǎo)用戶點擊,以此獲利。一些商家則借助社交機器人賬號來進(jìn)行虛假宣傳、抹黑競爭對手,造成了社交網(wǎng)絡(luò)平臺的信任缺失和市場秩序的混亂[1-2]。此外,在國外的政治選舉活動中,一些候選人利用社交機器人在社交網(wǎng)絡(luò)上發(fā)布大量政治觀點,從而達(dá)到搖擺選民、操縱公眾輿論的目的[3-5]。

      惡意社交機器人的存在對網(wǎng)絡(luò)空間安全產(chǎn)生了嚴(yán)重威脅,因此研究出有效的社交機器人檢測方法具有十分重要的意義。

      1 面臨的挑戰(zhàn)

      社交機器人檢測技術(shù)主要采用機器學(xué)習(xí)、社交關(guān)系圖分析等方法構(gòu)建能夠表征用戶的特征來實現(xiàn)社交網(wǎng)絡(luò)賬號的二分類。目前而言,社交機器人檢測問題面臨的挑戰(zhàn)主要有以下三個方面。

      1.1 數(shù)據(jù)集的標(biāo)注

      由于社交機器人并沒有精確的定義,因此研究人員無法使用一個穩(wěn)定的標(biāo)記數(shù)據(jù)集的方法來獲取一個絕對真實的數(shù)據(jù)集。

      1.2 特征的選取

      社交機器人賬號正在快速發(fā)展和演化,這會導(dǎo)致如果只改變特征值,將無法有效檢測到社交機器人賬號。因此,尋找健壯的特征具有十分重要的意義。

      1.3 方法的有效性

      由于現(xiàn)階段難以收集到一個能夠兼容所有檢測類型的數(shù)據(jù)集,因此研究人員發(fā)現(xiàn)比較不同的社交機器人檢測方法、驗證當(dāng)前方法的有效性是一項充滿了挑戰(zhàn)的任務(wù)。

      2 檢測方法

      社交機器人檢測相關(guān)的研究成果在近十年的時間內(nèi)逐漸興起,目前的研究方向主要包括了基于圖的檢測方法、基于機器學(xué)習(xí)的檢測方法、基于異常的檢測方法以及基于眾包的檢測方法。

      盡管社交機器人是一個被廣泛使用的術(shù)語,但目前為止它仍然沒有一個明確的定義。文獻(xiàn)[6]將機器人定義為在線社交網(wǎng)絡(luò)中的自動賬戶。Forelle等人[7]也用類似的方式描述了Twitter上的社交機器人,他們認(rèn)為由能夠自動發(fā)布推文或消息、由計算機自動程序生成的賬號是社交機器人。此外,Grimme和Preuss等人[8]提出了社交機器人的新定義,即“半自動代理”——這些代理能夠通過在線社交網(wǎng)絡(luò)中的單方或多方溝通行為來實現(xiàn)特定的目的。綜上所述,在本文中,我們將社交機器人理解為“自動生成內(nèi)容且能夠在社交網(wǎng)絡(luò)上與人類互動、試圖模仿并可能改變?nèi)祟愋袨榈挠嬎銠C算法”。

      2.1 基于圖的檢測方法

      圖結(jié)構(gòu)廣泛應(yīng)用于社交網(wǎng)絡(luò)相關(guān)的研究中,它可以描述社交網(wǎng)絡(luò)賬號之間直接或間接的關(guān)系,例如正在關(guān)注關(guān)系和關(guān)注者關(guān)系等?;趫D的社交機器人檢測方法依賴于社會圖的特性來區(qū)分機器人賬號和普通賬號。這類方法的典型做法是先使用圖論的相關(guān)方法來對賬號進(jìn)行建模,然后利用機器學(xué)習(xí)方法實現(xiàn)二分類。

      Cornelissen等人[9]提出了一種將網(wǎng)絡(luò)結(jié)構(gòu)度量和無監(jiān)督機器學(xué)習(xí)結(jié)合的方法來對機器人賬號進(jìn)行檢測。他們首先假設(shè)K-1圖比K-2圖更適用于對機器人和人類賬號進(jìn)行區(qū)分,然后基于這個假設(shè)在Twitter數(shù)據(jù)集上測試了分類模型,最后的實驗結(jié)果表明,上述假設(shè)不成立。Hurtado等人[10]則推測具有相似行為活動、并且在社交網(wǎng)絡(luò)結(jié)構(gòu)中高度關(guān)聯(lián)的一組社交賬號是社交機器人賬號,因此他們使用了時間和網(wǎng)絡(luò)信息在Reddit平臺上對政治類機器人進(jìn)行了檢測。最終,他們在該平臺上發(fā)現(xiàn)了一個機器人用戶群。Yang等人[11]先建立了一個基于用戶交互的交互圖模型,然后使用了BP神經(jīng)網(wǎng)絡(luò)模型對用戶進(jìn)行了分類,實驗結(jié)果達(dá)到了98.6%的準(zhǔn)確率。此外,Dorri等人[12]基于社交網(wǎng)絡(luò)的同質(zhì)性對用戶交互網(wǎng)絡(luò)進(jìn)行了建模,然后使用半監(jiān)督機器學(xué)習(xí)方法來檢測機器人賬號。

      社交關(guān)系是社交網(wǎng)絡(luò)用戶的重要屬性之一?;趫D的檢測方法能夠提取出用戶的關(guān)系網(wǎng)絡(luò)特征,并基于此對社交賬號進(jìn)行識別。但是由于在現(xiàn)實中社交網(wǎng)絡(luò)平臺對關(guān)系數(shù)據(jù)的采集進(jìn)行了限制,因此基于圖的檢測方法往往不能完全達(dá)到預(yù)想的性能。

      2.2 基于機器學(xué)習(xí)的檢測方法

      基于機器學(xué)習(xí)算法的社交機器人檢測方法是目前社交機器人檢測領(lǐng)域的主流方法。此類檢測方法主要分為傳統(tǒng)機器學(xué)習(xí)和深度學(xué)習(xí)的方法。

      (1)基于傳統(tǒng)機器學(xué)習(xí)的檢測方法

      基于傳統(tǒng)機器學(xué)習(xí)的方法構(gòu)建了不同的用戶特征,然后利用傳統(tǒng)機器學(xué)習(xí)算法來對賬號進(jìn)行分類。

      David等人[13]確定了一組在Twitter平臺上檢測機器人賬戶的特征。與此同時,他們測量了每個特征的重要性,并應(yīng)用了5種不同的分類方法進(jìn)行了實驗,最終發(fā)現(xiàn),隨機森林分類器的表現(xiàn)最好。Dickerson等人[14]認(rèn)為人類和非人類用戶的情感是不同的,因此他們引入了基于情感分析的特征來檢測Twitter平臺上的機器人。實驗結(jié)果證明,引入的情感特征能夠?qū)⒛P偷腁UC值從0.65提升至0.73。此外,Khaled等人[15]提出了一種基于支持向量機和神經(jīng)網(wǎng)絡(luò)的SVM-NN算法,該算法能夠在使用較少的特征數(shù)量的情況下,得到約98%的檢測準(zhǔn)確率。

      基于傳統(tǒng)機器學(xué)習(xí)的檢測需要提取社交賬號的各類特征輸入機器學(xué)習(xí)模型中進(jìn)行分類,然而這種方法需要花費較高的時間成本來進(jìn)行特征工程,也難以發(fā)現(xiàn)某些潛在的檢測特征。

      (2)基于深度學(xué)習(xí)的檢測方法

      隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的社交機器人檢測方法逐漸成為研究熱點。深度學(xué)習(xí)是機器學(xué)習(xí)的一個重要分支,它以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),實現(xiàn)對數(shù)據(jù)的學(xué)習(xí)。相比傳統(tǒng)機器學(xué)習(xí)方法,深度學(xué)習(xí)方法適應(yīng)性良好,在數(shù)據(jù)量大的情景下表現(xiàn)更好。

      Daouadi等人[17]基于他們所提出的一組用戶特征,提出了一種名為Deep Forest的深度學(xué)習(xí)算法,最后訓(xùn)練得到了精度為97.55%的機器人檢測模型。利用每個社交賬號的社交行為和帖子內(nèi)容,Cai等人[18]使用了CNN-LSTM模型對其進(jìn)行建模并進(jìn)行分類。相比其他方法,該模型實現(xiàn)了用戶特征的自動提取,避免了煩瑣的特征工作。Alom等人[19]通過深度學(xué)習(xí)方法提取了賬號發(fā)布的推文中含有的語義特征,然后將該特征與賬號個人檔案信息中提取的特征融合之后,輸入到推理層進(jìn)行二分類。該方法相比其他幾種基于機器學(xué)習(xí)和深度學(xué)習(xí)的方法,性能有較大的提高。

      2.3 基于異常的檢測方法

      基于異常的社交機器人檢測方法利用了這樣一個假設(shè)——即合法的社交網(wǎng)絡(luò)用戶沒有任何動機在沒有獎勵的情況下做出一些奇怪的行為。因此,在某些預(yù)先設(shè)置的限制下,行為異常的用戶很可能是惡意用戶。這種方法認(rèn)為當(dāng)發(fā)現(xiàn)異常的用戶群體行為時,應(yīng)將該群體歸類為社交機器人群體。

      由于使用這種檢測方法時需要事先規(guī)定“異?!钡囊饬x,因此很難評估規(guī)定的合理性。但是,這種方法可以用于收集社交機器人賬號樣本,以便建立數(shù)據(jù)集并從中提取特征信息以增強未來的檢測方法。

      檢測出賬戶行為異常之后并不觸發(fā)這些賬號的方法被稱為基于動作的檢測。Pan等人在文獻(xiàn)[20]中做出了以下假設(shè):1)人類賬號的行為將會表現(xiàn)出強烈的異質(zhì)性;2)相比人類賬號,機器人賬號的行為并不復(fù)雜。因此,他們認(rèn)為一個社交機器人將有一個相對小的熵。作者利用異常burstiness參數(shù)和時間間隔熵值,將新浪微博上的賬戶分類為人類、人工機器人和自動機器人。最終的實驗發(fā)現(xiàn),機器人賬號發(fā)布的內(nèi)容并不比人類賬號多。

      還有一些基于異常的方法依賴于觸發(fā)社交機器人賬戶的異常行為并通過它們與研究人員設(shè)置的陷阱之間的異常交互來檢測它們,這類方法稱為基于交互的檢測。Lee等人[21]在Twitter上部署了60個蜜罐,歷時7個月獲取了36000個機器人賬號候選者,然后通過分析賬號行為、文本、關(guān)系等特征進(jìn)一步篩選得到最終的檢測結(jié)果。通過合理的評估分析之后,作者發(fā)現(xiàn)檢測結(jié)果能夠達(dá)到98.26%的精度。

      2.4 基于眾包的檢測方法

      眾包是一種在線活動,要求許多人手動完成一項任務(wù)[22]。當(dāng)應(yīng)用于檢測社交機器人時,這種方法需要很高的成本和時間。因此,一些研究人員利用這項技術(shù)來收集標(biāo)記的數(shù)據(jù)集以供進(jìn)一步研究使用。

      這一類方法的代表性研究由Wang等人[23]完成。他們通過社會圖靈測試,檢查了受信任的在線社交網(wǎng)絡(luò)用戶判斷某一賬戶是否為社交機器人的準(zhǔn)確性。然后作者提出了一個系統(tǒng),首先使用自動算法過濾賬戶并輸出可疑賬戶,再由選定的眾籌工作者進(jìn)行進(jìn)一步調(diào)查。在這個系統(tǒng)中,眾籌工作者的投票被聚集起來,以提高社交機器人檢測的準(zhǔn)確性。此外,為了建立仿真數(shù)據(jù)集,Alarifi等人[24]讓10名經(jīng)過挑選和培訓(xùn)的志愿者參與到研究中,這些志愿者作為眾包工作者將Twitter賬戶手動標(biāo)記為人類、自動機器人和人工機器人。此外,Cresci等人[4]為了測量眾包在檢測社交機器人方面的準(zhǔn)確性進(jìn)行了一項測試。在測試中,作者從一家眾包網(wǎng)站雇傭了眾包工作者并要求他們對預(yù)先標(biāo)注的數(shù)據(jù)集進(jìn)行分類。測試結(jié)果顯示,基于眾包的檢測方法成功地檢測到了傳統(tǒng)的垃圾郵件機器人和真實的賬號,但并沒有準(zhǔn)確檢測到惡意的社交機器人。

      3 展望

      由于社交網(wǎng)絡(luò)對人們信息獲取和意見形成的影響程度大幅增加,社交機器人被惡意濫用的問題日趨嚴(yán)重,對網(wǎng)絡(luò)空間安全產(chǎn)生了嚴(yán)重威脅。盡管研究人員建立了強大的模型來檢測社交機器人賬號,但惡意的社交機器人也在不斷地發(fā)展進(jìn)化以逃避檢測。

      因此,本文分析了社交機器人的定義,并整理和歸納了社交機器人檢測的研究現(xiàn)狀。結(jié)果表明,構(gòu)建一個健壯的社交機器人檢測模型具有挑戰(zhàn)性,因為缺乏可信的、全面的且精確標(biāo)注的數(shù)據(jù)集,而且機器人的特征正隨著社交機器人的發(fā)展而改變。當(dāng)前的方法正在試圖克服這些挑戰(zhàn),但還可以做更多的改進(jìn),特別是找到并利用機器人賬號不容易更改的健壯特性。此外,還需要為Twitter以外的平臺構(gòu)建模型,并需要獨立地檢測各種類型的社交機器人。更進(jìn)一步地,還需要探索一些更好的辦法,例如使用自然語言處理技術(shù)來檢測自動或重復(fù)的內(nèi)容。

      [1]Wang Z,Gu S,Zhao X,et al. Graph-based review spammer group detection[J]. Knowledge and Information Systems. 2018,55(3):571-597.

      [2]Byun H,Jeong S,Kim C. SC-Com:Spotting Collusive Community in Opinion Spam Detection[J]. Information Processing & Management. 2021,58(4):102593.

      [3]Pastor-Galindo J,Zago M,Nespoli P,et al. Twitter social bots:The 2019 Spanish general election data[J]. Data in Brief. 2020,32:106047.

      [4]Cresci S,Di Pietro R,Petrocchi M,et al. The paradigm-shift of social spambots:Evidence,theories,and tools for the arms race[J]. 2017.

      [5]Fernquist J,Kaati L,Schroeder R. Political Bots and the Swedish General Election[C]. IEEE,2018.

      [6]Morstatter F,Wu L,Nazer T H,et al. A New Approach to Bot Detection:Striking the Balance Between Precision and Recall[C]. 2016.

      [7]Forelle M,Howard P,Monroy-Hernández A,et al. Political Bots and the Manipulation of Public Opinion in Venezuela[J]. 2015.

      [8]Grimme C,Preuss M,Adam L,et al. Social Bots:Human-Like by Means of Human Control?[J]. Big Data. 2017,5(4): 279-293.

      [9]Cornelissen L,Barnett R,Schoonwinkel P,et al. A network topology approach to bot classification[C]. ACM,2018.

      [10]Hurtado S,Ray P,Marculescu R. Bot Detection in Reddit Political Discussion[C]. ACM,2019.

      [11]Yang W,Dong G,Wang W,et al. Detecting Bots in Follower Markets[C]. Berlin,Heidelberg:Springer Berlin Heidelberg,2014.

      [12]Dorri A,Abadi M,Dadfarnia M. SocialBotHunter:Botnet Detection in Twitter-Like Social Networking Services Using Semi-Supervised Collective Classification[C]. IEEE,2018.

      [13]David I,Siordia O S,Moctezuma D. Features combination for the detection of malicious Twitter accounts[C]. IEEE,2016.

      [14]Dickerson J P,Kagan V,Subrahmanian V S. Using Sentiment to Detect Bots on Twitter:Are Humans more Opinionated than Bots[C]. 2014.

      [15]Khaled S,El-Tazi N,Mokhtar H M O. Detecting Fake Accounts on Social Media[C]. 2018.

      [16]Daouadi K E,Reba? R Z,Amous I. Bot Detection on Online Social Networks Using Deep Forest[C]. Cham:Springer International Publishing,2019.

      [17]Cai C,Li L,Zeng D. Detecting Social Bots by Jointly Modeling Deep Behavior and Content Information[C]. 2017.

      [18]Alom Z,Carminati B,F(xiàn)errari E. A deep learning model for Twitter spam detection[J]. Online Social Networks and Media. 2020.

      [19]Pan J,Liu Y,Liu X,et al. Discriminating bot accounts based solely on temporal features of microblog behavior[J]. Physica A:Statistical Mechanics and its Applications. 2016,450:193-204.

      [20]Lee K,Eoff B D,Caverlee J. Seven Months with the Devils:A Long-Term Study of Content Polluters on Twitter[C]. 2011.

      [21]Estellés-Arolas E,González-Ladrón-De-Guevara F. Towards an integrated crowdsourcing definition[J]. Journal of Information Science. 2012,38(2):189-200.

      [22]Wang G,Mohanlal M,Wilson C,et al. Social Turing Tests: Crowdsourcing Sybil Detection[J]. 2012.

      [23]Alarifi A,Alsaleh M,Al-Salman A. Twitter turing test:Identifying social machines[J]. Information Sciences. 2016,372:332-346.

      猜你喜歡
      賬號機器社交
      社交之城
      英語世界(2023年6期)2023-06-30 06:28:28
      機器狗
      社交牛人癥該怎么治
      意林彩版(2022年2期)2022-05-03 10:25:08
      機器狗
      彤彤的聊天賬號
      施詐計騙走游戲賬號
      派出所工作(2021年4期)2021-05-17 15:19:10
      社交距離
      你回避社交,真不是因為內(nèi)向
      文苑(2018年17期)2018-11-09 01:29:28
      未來機器城
      電影(2018年8期)2018-09-21 08:00:06
      Google Play游戲取消賬號綁定沒有Google賬號也能玩
      CHIP新電腦(2016年3期)2016-03-10 14:52:50
      延边| 石河子市| 大港区| 城步| 汾阳市| 甘肃省| 十堰市| 彭州市| 九寨沟县| 甘洛县| 怀来县| 乃东县| 五指山市| 全南县| 佛山市| 黄山市| 锡林郭勒盟| 米泉市| 军事| 金山区| 香格里拉县| 和平县| 临夏县| 满洲里市| 南召县| 玉屏| 新干县| 潍坊市| 庄浪县| 周宁县| 开阳县| 横山县| 句容市| 镇坪县| 望城县| 平舆县| 潞西市| 商洛市| 且末县| 铜陵市| 康定县|