基于自適應(yīng)差異化圖卷積的社交網(wǎng)絡(luò)新增惡意用戶檢測

2023-10-18 13:17:28吳正昊曾國蓀

計(jì)算機(jī)應(yīng)用研究 2023年9期

關(guān)鍵詞：社交網(wǎng)絡(luò)機(jī)器學(xué)習(xí)

吳正昊曾國蓀

摘要：社交網(wǎng)絡(luò)新增惡意用戶檢測作為一項(xiàng)分類任務(wù)，一直面臨著數(shù)據(jù)樣本不足、惡意用戶標(biāo)注稀少的問題。在數(shù)據(jù)有限的情況下，為了能夠精確地檢測出惡意用戶，提出一種基于自適應(yīng)差異化圖卷積網(wǎng)絡(luò)的檢測方法。該方法通過提取社交網(wǎng)絡(luò)中的用戶特征和社交關(guān)系構(gòu)建社交網(wǎng)絡(luò)圖。構(gòu)建社交網(wǎng)絡(luò)圖后，計(jì)算節(jié)點(diǎn)與鄰居的相似度，并對鄰居進(jìn)行優(yōu)先級排序，利用優(yōu)先級順序采樣關(guān)鍵鄰居。關(guān)鍵鄰居的特征通過自適應(yīng)權(quán)重的加權(quán)平均方式聚合到節(jié)點(diǎn)自身，以此更新節(jié)點(diǎn)特征。特征更新后的節(jié)點(diǎn)通過特征降維和歸一化計(jì)算得到惡意值，利用惡意值判斷用戶的惡意性。實(shí)驗(yàn)表明該方法和其他方法相比，具有更高的惡意用戶查全率和整體查準(zhǔn)率，并且能夠快速地完成對新增用戶的檢測，證明了自適應(yīng)差異化圖卷積網(wǎng)絡(luò)能夠有效捕捉到少量樣本的關(guān)鍵特征。

關(guān)鍵詞：社交網(wǎng)絡(luò)；用戶分類；機(jī)器學(xué)習(xí)；圖神經(jīng)網(wǎng)絡(luò)；惡意用戶

中圖分類號：TP183?? 文獻(xiàn)標(biāo)志碼：A

文章編號：1001-3695（2023）09-041-2820-06

doi：10.19734/j.issn.1001-3695.2022.12.0835

Detection of new malicious users in social networks based on adaptive differential graph convolution

Wu Zhenghao1，2，Zeng Guosun1

（1.Dept. of Computer Science & Technology，Tongji University，Shanghai 201804，China；2.Embedded System & Service Computing Key Laboratory of Ministry of Education，Shanghai 201804，China）

Abstract：As a classification task，the detection of new malicious users in social networks has been facing the lack of datasets and labels of malicious users.With limited data，this paper proposed a method based on adaptive differential graph convolution to detect malicious users accurately.By extracting user features and social relationships in the social network，the method constructed the social network graph.After this，it calculated the similarities between node and its neighbors to prioritize the neighbors，and used the priority order to sample key neighbors.The node used adaptive weighted average to aggregate the features of key neighbors to itself，to update its features.After feature updating，by feature dimension reduction and normalization，the node got its malicious value，for malicious detection.The experiment results show that，compared to other methods，the proposed method achieves higher precision and overall accuracy on detection of new malicious users，with a satisfactory speed.Results also demonstrate that adaptive differential graph convolutional networks can effectively capture the key features of a small number of data samples.

Key words：social network；user classification；machine learning；graph neural network；malicious user

0 引言

社交網(wǎng)絡(luò)是當(dāng)今互聯(lián)網(wǎng)重要的組成部分，也是眾多互聯(lián)網(wǎng)用戶生活中不可或缺的一部分。隨著社交網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大，海量用戶中也出現(xiàn)了一些抱有惡意目的的用戶。有研究統(tǒng)計(jì)，熱門社交網(wǎng)絡(luò)平臺Twitter的活躍用戶中有9%～15%是機(jī)器賬號［1］，其中大多數(shù)是發(fā)布廣告、色情內(nèi)容、欺詐鏈接等有害信息的惡意賬號。Twitter平均每天會新增百萬條以上的垃圾信息，大部分來源于惡意用戶控制的機(jī)器賬號［2］。除了散布垃圾信息，惡意用戶還會利用社交網(wǎng)絡(luò)實(shí)施信息攻擊。2013年，黑客組織敘利亞電子軍攻擊了美聯(lián)社的社交網(wǎng)絡(luò)賬號并發(fā)布白宮受到恐怖襲擊的虛假消息，一度讓美股市場崩盤［3］。2016年美國總統(tǒng)選舉期間，Twitter平臺的惡意賬號散布了約31%的不可靠政治信息［4］。據(jù)研究分析，這些賬號發(fā)布的政治信息在協(xié)助特朗普選舉的過程中起到了重要作用［5］。除此之外，社交網(wǎng)絡(luò)惡意用戶還從其他方面威脅著社會穩(wěn)定。例如，利用虛假信息制造網(wǎng)絡(luò)輿論，對社交網(wǎng)絡(luò)的個(gè)人或群體實(shí)施網(wǎng)絡(luò)霸凌［6］；在社交網(wǎng)絡(luò)實(shí)施消費(fèi)欺詐，用假裝交易退款、低價(jià)促銷等手段欺騙用戶財(cái)產(chǎn)［7］；在社交網(wǎng)絡(luò)傳播虛假新聞，潛移默化地影響大眾對政治、娛樂、社會政策等事物的認(rèn)知［8］。惡意用戶的存在嚴(yán)重增加了正常用戶在使用社交網(wǎng)絡(luò)中被欺詐、騷擾、誤導(dǎo)的風(fēng)險(xiǎn)，為了應(yīng)對惡意用戶對網(wǎng)絡(luò)安全、社會穩(wěn)定、政治滲透等方面帶來的現(xiàn)實(shí)威脅，惡意用戶檢測技術(shù)的發(fā)展變得尤為迫切。

當(dāng)前主流的惡意用戶檢測方法可大致分為基于人工、基于社交網(wǎng)絡(luò)關(guān)系圖和基于機(jī)器學(xué)習(xí)三類?；谌斯さ姆椒z測準(zhǔn)確度高，但耗時(shí)耗力、效率低下［9］?；谏缃痪W(wǎng)絡(luò)關(guān)系圖的方法檢測效率高，但需要事先了解惡意用戶在社交網(wǎng)絡(luò)中的分布特征。由于獲取這方面的信息并不容易，所以此類檢測方法大多對社交網(wǎng)絡(luò)的用戶分布進(jìn)行了人為假設(shè)。最簡單的假設(shè)之一是Gong等人［10］提出的同質(zhì)偏好假設(shè)，即兩個(gè)相連的用戶更可能具有相似的屬性和類別?；谶@一假設(shè)提出的檢測方法多數(shù)采用隨機(jī)游走技術(shù)，如文獻(xiàn)［11］。另一種常見的假設(shè)是由Leskovec等人［12］研究提出的小型社群假設(shè)，即整個(gè)在線社交網(wǎng)絡(luò)由若干個(gè)小型社群構(gòu)成?；谶@種假設(shè)，一些研究人員將馬爾可夫網(wǎng)絡(luò)和置信度傳播等方法應(yīng)用于惡意用戶檢測，如BOTection［13］。

然而，無論是同質(zhì)偏好假設(shè)還是小型社群假設(shè)，其衍生出的檢測方法的準(zhǔn)確性都嚴(yán)重依賴于對網(wǎng)絡(luò)結(jié)構(gòu)理論假設(shè)的正確性，這也是基于社交網(wǎng)絡(luò)關(guān)系圖方法的通?。?4］。為了擺脫先驗(yàn)知識和理論假設(shè)的束縛、提高檢測技術(shù)的智能程度和泛化能力，越來越多的研究開始將圖神經(jīng)網(wǎng)絡(luò)應(yīng)用到惡意用戶檢測中。圖神經(jīng)網(wǎng)絡(luò)作為一種基于圖結(jié)構(gòu)數(shù)據(jù)的機(jī)器學(xué)習(xí)方法，能夠在缺少先驗(yàn)知識的條件下，有效地利用社交網(wǎng)絡(luò)關(guān)系圖的結(jié)構(gòu)特征和用戶節(jié)點(diǎn)特征，完成用戶節(jié)點(diǎn)分類等任務(wù)。

GCN［15］是最早被提出用于節(jié)點(diǎn)半監(jiān)督分類的圖神經(jīng)網(wǎng)絡(luò)之一，它基于圖的拉普拉斯矩陣分解定義圖卷積操作，利用圖卷積更新節(jié)點(diǎn)特征并對節(jié)點(diǎn)進(jìn)行分類。GraphSAGE［16］從另一個(gè)角度定義圖卷積，它將圖節(jié)點(diǎn)的信息卷積分為采樣和聚合兩階段，使節(jié)點(diǎn)特征更新方式更加靈活。文獻(xiàn)［17］首先將圖卷積神經(jīng)網(wǎng)絡(luò)引入惡意用戶檢測，提出了基于GCNN的Twitter惡意用戶檢測框架，為圖神經(jīng)網(wǎng)絡(luò)檢測惡意用戶提供了性能參考基準(zhǔn)。GAT［18］將注意力機(jī)制融入圖卷積過程，以區(qū)分不同節(jié)點(diǎn)的重要性。文獻(xiàn)［19］將GAT提出的圖注意力機(jī)制融入了惡意用戶檢測中，檢測性能相較傳統(tǒng)方法有顯著提升。近兩年也有研究將異質(zhì)圖神經(jīng)網(wǎng)絡(luò)引入惡意用戶檢測中，如文獻(xiàn)［20］提出的Bot-MGAT。

可見，研究人員已經(jīng)開始將經(jīng)典的和改進(jìn)的圖神經(jīng)網(wǎng)絡(luò)應(yīng)用于惡意用戶檢測，但仍然面臨一些問題。第一，在社交網(wǎng)絡(luò)中，惡意用戶的數(shù)量遠(yuǎn)小于正常用戶，而被明確標(biāo)注為惡意用戶的樣本數(shù)量更加稀少。在大量正常樣本特征的影響下，經(jīng)典的圖神經(jīng)網(wǎng)絡(luò)很難學(xué)習(xí)到惡意用戶的典型特征，導(dǎo)致檢測效果不盡如意。第二，當(dāng)前的主流方法大多通過增加模型層數(shù)、改變網(wǎng)絡(luò)架構(gòu)以及融合多視角信息對經(jīng)典圖神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn)，這些改進(jìn)能夠在一定程度上提升檢測準(zhǔn)確率，但也會導(dǎo)致模型對訓(xùn)練數(shù)據(jù)的依賴和復(fù)雜度的增加。在訓(xùn)練數(shù)據(jù)較少的情況下，模型會因?yàn)槎嘁暯切畔⒌娜笔Ф阅芡嘶?。除此之外，隨著新增用戶加入社交網(wǎng)絡(luò)，高復(fù)雜度模型的訓(xùn)練開銷和檢測開銷也會越來越大。面對以上問題，本文旨在針對惡意用戶檢測這一應(yīng)用場景，構(gòu)建一種簡潔且能夠盡可能捕捉有限學(xué)習(xí)數(shù)據(jù)中重要信息的圖卷積神經(jīng)網(wǎng)絡(luò)，并在此基礎(chǔ)上提出一種新增惡意用戶的檢測方法。

4 實(shí)驗(yàn)與分析

4.1 實(shí)驗(yàn)數(shù)據(jù)集和運(yùn)行環(huán)境

實(shí)驗(yàn)采用Twitter 1KS-10KN dataset［21］作為數(shù)據(jù)集對模型進(jìn)行訓(xùn)練和驗(yàn)證。該數(shù)據(jù)集是本研究領(lǐng)域常用的基準(zhǔn)數(shù)據(jù)集，基本信息如表1所示。

為了更直觀地了解惡意用戶和正常用戶在社交網(wǎng)絡(luò)圖中的分布情況，本文將數(shù)據(jù)集進(jìn)行了可視化，如圖3所示。

圖中紅色代表惡意用戶，藍(lán)色代表正常用戶（見電子版）。在中心聚集的是度數(shù)較高的節(jié)點(diǎn)，也就是社交網(wǎng)絡(luò)中關(guān)注者和粉絲數(shù)較多的用戶。絕大多數(shù)惡意用戶都集中在這一區(qū)域，他們廣泛地關(guān)注其他用戶，以便將惡意信息傳播給更多人。一部分正常用戶也在這一區(qū)域，他們通常是社交網(wǎng)絡(luò)中具有一定影響力的意見領(lǐng)袖或現(xiàn)實(shí)中的知名人物，因而有較多追隨者。在網(wǎng)絡(luò)邊緣聚集并形成圓環(huán)節(jié)點(diǎn)群的是度數(shù)較低、但仍擁有一定的鄰居和粉絲的用戶，他們代表著絕大部分使用社交網(wǎng)絡(luò)的普通人：用戶有自己的小范圍社交圈，部分追隨中心區(qū)域的高影響力用戶。分布在這一區(qū)域的用戶絕大部分是正常用戶，但仍有少量惡意用戶混雜在正常用戶群中，只是影響范圍更小。在中心區(qū)域和圓環(huán)之間，散布著極少量的孤立用戶，他們在網(wǎng)絡(luò)中不存在社交關(guān)系，沒有關(guān)注的價(jià)值。

對實(shí)驗(yàn)數(shù)據(jù)集的分析進(jìn)一步說明了惡意用戶檢測中的正負(fù)樣本數(shù)量不平衡問題：惡意用戶遠(yuǎn)少于正常用戶，需要從有限的樣本中盡可能學(xué)習(xí)到惡意用戶的典型特征。此外，可視化圖顯示出惡意用戶存在多種分布特征，既有聚集性惡意群體，也有分散的惡意個(gè)體，要求檢測方法具有更強(qiáng)的魯棒性。

在網(wǎng)絡(luò)結(jié)構(gòu)分析后，進(jìn)一步對用戶資料的屬性特征進(jìn)行了分析和篩選，忽略了與用戶惡意性明顯不相關(guān)的屬性項(xiàng)，選擇了如表2所示的七項(xiàng)用戶屬性作為特征進(jìn)行實(shí)驗(yàn)。由于各個(gè)特征的值數(shù)量級差異較大，為了避免量級較小的特征作用被掩蓋，實(shí)驗(yàn)對數(shù)據(jù)進(jìn)行了L2標(biāo)準(zhǔn)化處理。

實(shí)驗(yàn)運(yùn)行于Windows平臺，使用Python語言編程，基于PyTorch和Deep Graph Library平臺搭建檢測模型。實(shí)驗(yàn)平臺主要硬件配置為：CPU i7-10750H、GPU RTX 3060 12 GB。

4.2 評價(jià)指標(biāo)

檢測模型性能對比采用的指標(biāo)包括準(zhǔn)確率、召回率、精確率和F1值。

準(zhǔn)確率即模型預(yù)測標(biāo)簽正確的樣本數(shù)與總測試樣本數(shù)的比例，是最直觀的模型評價(jià)指標(biāo)。但在正樣本遠(yuǎn)少于負(fù)樣本的情況下，準(zhǔn)確率并不能很好地反映模型檢測惡意用戶的能力，因此還需要結(jié)合召回率和準(zhǔn)確率判斷模型性能。

召回率是指模型檢測出的正確的正樣本數(shù)與全部正樣本數(shù)的比例，而精確率是指模型檢測正確的正樣本數(shù)和所有預(yù)測為正的樣本數(shù)的比例。召回率反映了模型發(fā)現(xiàn)惡意用戶的能力，精確率則反映了模型預(yù)測惡意用戶的準(zhǔn)確程度。如果召回率高而精確率低，說明模型的誤報(bào)率很高；反之說明模型在檢測中過于謹(jǐn)慎，導(dǎo)致檢測能力下降。

F1值是根據(jù)召回率和精確率計(jì)算出的反映模型綜合性能的指標(biāo)，F(xiàn)1值越高，說明模型的召回率和精確率都較高，沒有出現(xiàn)指標(biāo)值兩極分化的情況。因此，在所有評價(jià)指標(biāo)中，F(xiàn)1值的重要性是最高的。

4.3 實(shí)驗(yàn)結(jié)果與分析

為了檢驗(yàn)本文提出的自適應(yīng)差異化圖卷積模型的性能和效果，選取了多層感知機(jī)MLP模型、三種經(jīng)典圖神經(jīng)網(wǎng)絡(luò)模型，以及2022年最新提出的Bot-MGAT模型［20］作為基準(zhǔn)模型對比。將Twitter 1KS-10KN數(shù)據(jù)集按照節(jié)點(diǎn)數(shù)6：2：2的比例分為訓(xùn)練集、驗(yàn)證集和測試集，分別包含6 600、2 200、2 200個(gè)節(jié)點(diǎn)。在設(shè)置相同訓(xùn)練參數(shù)和訓(xùn)練批次的情況下，分別訓(xùn)練各基準(zhǔn)模型和本文提出的自適應(yīng)差異化圖卷積模型，并在測試數(shù)據(jù)集上驗(yàn)證對比各模型檢測惡意用戶的效果。

具體的實(shí)驗(yàn)參數(shù)為：所有的線性變換W維度均為256，權(quán)重組或注意力頭數(shù)為4（如果有），LeakyReLU函數(shù)的負(fù)軸斜率為0.2，特征向量和權(quán)重向量的丟棄率均為0.5，初始學(xué)習(xí)率為0.01，一階鄰居和二階鄰居采樣數(shù)均為10，交叉熵?fù)p失函數(shù)中的超參數(shù)γ0=1和γ1=2。在自適應(yīng)差異化圖卷積網(wǎng)絡(luò)中，一階優(yōu)先采樣鄰居數(shù)為7，隨機(jī)采樣鄰居數(shù)為2，二階優(yōu)先采樣鄰居和隨機(jī)采樣鄰居數(shù)均為5，結(jié)構(gòu)緊密度εlow=1，εhigh=2。

實(shí)驗(yàn)結(jié)果如表3、4所示。表3展示了不同方法在測試數(shù)據(jù)集上檢測惡意用戶的各項(xiàng)指標(biāo)?？梢?，自適應(yīng)差異化圖卷積網(wǎng)絡(luò)在檢測準(zhǔn)確率、召回率和F1值都高于其他方法，綜合表現(xiàn)最優(yōu)。MLP是基于傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)分類方法，它只利用節(jié)點(diǎn)的屬性數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí)，忽略了網(wǎng)絡(luò)中的社交關(guān)系。因此，在惡意樣本數(shù)較少的情況下，MLP很難學(xué)習(xí)到惡意用戶的典型特征，從而導(dǎo)致檢測惡意用戶的召回率很低。GCN考慮了網(wǎng)絡(luò)的結(jié)構(gòu)特征，由于惡意節(jié)點(diǎn)和與惡意節(jié)點(diǎn)相關(guān)的邊在網(wǎng)絡(luò)中占比都很低，單層GCN無法完全提取到惡意用戶的深層次特征，所以檢測效果惡意用戶的能力較差。在增加一層網(wǎng)絡(luò)后，GCN檢測惡意用戶的能力有顯著提升，但由于GCN存在固有的結(jié)構(gòu)限制，只能進(jìn)行直推式學(xué)習(xí)，無法解決檢測新增節(jié)點(diǎn)惡意性的問題。GAT和GraphSAGE都是歸納式模型，能夠利用已有的模型檢測新增節(jié)點(diǎn)，但在實(shí)驗(yàn)測試中，兩種方法的召回率都很低，層數(shù)的疊加對性能的提升也并不顯著。從兩者網(wǎng)絡(luò)結(jié)構(gòu)分析推測，GAT雖然在聚合鄰居信息時(shí)考慮了鄰居的重要性，但沒有對鄰居采樣，可能聚合到噪聲信息；GraphSAGE對鄰居進(jìn)行了采樣，但忽略了不同鄰居的重要性，因此很難學(xué)習(xí)到惡意用戶的關(guān)鍵特征。最新的Bot-MGAT基于社交網(wǎng)絡(luò)的多視角信息，在構(gòu)建檢測模型框架時(shí)為不同類型的社交關(guān)系分別設(shè)置了多層圖注意力網(wǎng)絡(luò)，但在只有單類型關(guān)系的數(shù)據(jù)集下，其性能因數(shù)據(jù)缺失而退化為近似于一般的多層GAT模型。

為了驗(yàn)證二階段采樣和自適應(yīng)聚合函數(shù)模塊在網(wǎng)絡(luò)中起到的作用，實(shí)驗(yàn)在相同的條件下分別去掉這些模塊，用隨機(jī)采樣和平均聚合代替，以對比分析各模塊在自適應(yīng)差異化圖卷積網(wǎng)絡(luò)中的作用。

表4分別展示了用隨機(jī)采樣替換二階段采樣、用平均聚合替換自適應(yīng)聚合的自適應(yīng)差異化圖卷積網(wǎng)絡(luò)在測試數(shù)據(jù)集上檢測惡意用戶的各項(xiàng)指標(biāo)。顯然，替換網(wǎng)絡(luò)的任一模塊后，模型檢測惡意用戶的能力都有所下降。根據(jù)性能下降的幅度可以看出，自適應(yīng)聚合模塊在網(wǎng)絡(luò)中起到的作用比二階段采樣模塊更大，因?yàn)槎A段采樣只是對節(jié)點(diǎn)鄰居的初步篩選，只有在自適應(yīng)聚合模塊的協(xié)助下才能更好地幫助發(fā)現(xiàn)重要鄰居信息。

在測試模型檢測性能指標(biāo)過程中，實(shí)驗(yàn)記錄了在本測試環(huán)境下的節(jié)點(diǎn)平均檢測時(shí)間。結(jié)果顯示，本文的檢測方法每秒可檢測約100名新增用戶，能基本滿足實(shí)時(shí)性要求。

5 結(jié)束語

社交網(wǎng)絡(luò)惡意用戶檢測是網(wǎng)絡(luò)安全領(lǐng)域中的重要課題之一。在惡意用戶檢測中，社交網(wǎng)絡(luò)用戶不斷新增和惡意用戶樣本標(biāo)注稀少是要面對的兩個(gè)主要難題。在已知學(xué)習(xí)數(shù)據(jù)有限的情況下，現(xiàn)有的檢測方法大多趨于兩個(gè)極端：過于簡單而無法學(xué)習(xí)到惡意用戶特征，或過于復(fù)雜而無法滿足不斷新增的檢測需求。基于這一背景，本文提出了自適應(yīng)差異化圖卷積神經(jīng)網(wǎng)絡(luò)，在圖卷積的采樣和聚合過程中都從不同角度強(qiáng)化了對惡意用戶特征的學(xué)習(xí)，利用有限的數(shù)據(jù)最大程度強(qiáng)化模型對惡意用戶的檢測能力。為了能夠迅速檢測不斷新增的社交網(wǎng)絡(luò)用戶，本文在自適應(yīng)差異化圖卷積網(wǎng)絡(luò)的基礎(chǔ)上提出了一種檢測新增用戶惡意性的方法。實(shí)驗(yàn)在數(shù)據(jù)集Twitter 1KS-10KN dataset上對方法的有效性進(jìn)行了測試和驗(yàn)證，結(jié)果顯示本文方法相較其他基準(zhǔn)檢測方法有著更高的準(zhǔn)確度和較快的新增用戶檢測速度。

本文構(gòu)建的自適應(yīng)差異化圖卷積網(wǎng)絡(luò)模型在檢測社交網(wǎng)絡(luò)新增節(jié)點(diǎn)的惡意性上取得了較好的效果，但仍存在一些局限性和可以改進(jìn)的地方。例如，在模型構(gòu)建方面，忽略了用戶的社交文本信息，只處理了單類型社交關(guān)系；在模型訓(xùn)練方面，為了盡可能檢測出更多的惡意用戶而降低了正常樣本的權(quán)重，導(dǎo)致了一部分檢測精確率的下降。這些內(nèi)容將在未來的研究中進(jìn)一步深入和改進(jìn)，以便得到效果更好的新增惡意用戶檢測模型。

參考文獻(xiàn)：

［1］Varol O，F(xiàn)errara E，Davis C，et al.Online human-bot interactions：detection，estimation，and characterization［C］//Proc of International AAAI Conference on Web and Social Media.Palo Alto，CA：AAAI Press，2017：280-289.

［2］Chu Zi，Gianvecchio S，Wang Haining，et al.Who is tweeting on Twitter：human，bot，or cyborg？［C］//Proc of the 26th Annual Computer Security Applications Conference.New York：ACM Press，2010：21-30.

［3］Foster P.′Bogus′AP Tweet about explosion at the White House wipes billions off US markets［EB/OL］.（2013-04-23）［2022-12-18］.https：//www.telegraph.co.uk/finance/markets/10013768/Bogus-AP-tweet-about-explosion-at-the-White-House-wipes-billions-off-US-markets.html.

［4］Fryling K.Study：Twitter bots played disproportionate role spreading misinformation during 2016 election［EB/OL］.（2018-11-20）［2022-12-18］.https：//news.iu.edu/stories/2018/11/iub/releases/20-twitter-bots-election-misinformation.html.

［5］Bovet A，Makse H A.Influence of fake news in Twitter during the 2016 US presidential election［J］.Nature communications，2019，10（1）：7.

［6］Balakrishnan V，Khan S，F(xiàn)ernandez T，et al.Cyberbullying detection on Twitter using big five and dark triad features［J］.Personality and Individual Differences，2019，141：252-257.

［7］Liu Zhiwei，Dou Yingtong，Yu P S，et al.Alleviating the inconsistency problem of applying graph neural network to fraud detection［C］//Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York：ACM Press，2020：1569-1572.

［8］Pérez E A，Pedrero E L M，Rubio R J，et al.Fake news reaching young people on social networks：distrust challenging media literacy［J］.Publications，2021，9（2）：24.

［9］劉蓉，陳波，于泠，等.惡意社交機(jī)器人檢測技術(shù)研究［J］.通信學(xué)報(bào)，2017，38（S2）：197-210.（Liu Rong，Chen Bo，Yu Ling，et al.Overview of detection techniques for malicious social bots［J］.Journal on Communications，2017，38（S2）：197-210.）

［10］Gong N Z，F(xiàn)rank M，Mittal P.Sybilbelief：a semi-supervised learning approach for structure-based sybil detection［J］.IEEE Trans on Information Forensics and Security，2014，9（6）：976-987.

［11］Karpov I，Glazkova E.Detecting automatically managed accounts in online social networks：graph embeddings approach［M］//van der Aalst W M P，Batagelj V，Buzmakov A，et al.Recent Trends in Analysis of Images，Social Networks and Texts.Cham：Springer International Publishing，2021：11-21.

［12］Leskovec J，Lang K J，Dasgupta A，et al.Community structure in large networks：natural cluster sizes and the absence of large well-defined clusters［J］.Internet Mathematics，2009，6（1）：29-123.

［13］Alahmadi B A，Mariconti E，Spolaor R，et al.BOTection：bot detection by building Markov chain models of bots network behavior［C］//Proc of the 15th ACM Asia Conference on Computer and Communications Security.New York：ACM Press，2020：652-664.

［14］仲麗君，楊文忠，袁婷婷，等.社交網(wǎng)絡(luò)異常用戶識別技術(shù)綜述［J］.計(jì)算機(jī)工程與應(yīng)用，2018，54（16）：13-23.（Zhong Lijun，Yang Wenzhong，Yuan Tingting，et al.Survey of abnormal user identification technology in social network［J］.Computer Engineering and Applications，2018，54（16）：13-23.）

［15］Kipf T N，Welling M.Semi-supervised classification with graph convolutional networks［C］//Proc of International Conference on Learning Representations.2017.

［16］Hamilton W L，Ying Z，Leskovec J.Inductive representation learning on large graphs［C］//Proc of the 31st Conference on Neural Information Processing Systems.Red Hook，NY：Curran Associates Inc.，2017：1025-1035.

［17］Alhosseini S A，Tareaf R B，Najafi P，et al.Detect me if you can：spam bot detection using inductive representation learning［C］//Proc of World Wide Web Conference.New York：ACM Press，2019：148-153.

［18］Velicˇkovic＇ P，Cucurull G，Casanova A，et al.Graph attention networks［C］//Proc of International Conference on Learning Representations.2018.

［19］Zhao Chensu，Xin Yang，Li Xuefeng，et al.An attention-based graph neural network for spam bot detection in social networks［J］.Applied Sciences，2020，10（22）：8160.

［20］Alothali E，Salih M，Hayawi K，et al.Bot-MGAT：a transfer learning model based on a multi-view graph attention network to detect social bots［J］.Applied Sciences，2022，12（16）：8117.

［21］Yang Chao，Harkreader R，Zhang Jialong，et al.Analyzing spammers social networks for fun and profit：a case study of cyber criminal ecosystem on Twitter［C］//Proc of the 21st International Conference on World Wide Web.New York：ACM Press，2012：71-80.

收稿日期：2022-12-20；修回日期：2023-02-13? 基金項(xiàng)目：國家自然科學(xué)基金資助項(xiàng)目（62072337）；國家重點(diǎn)研發(fā)計(jì)劃資助項(xiàng)目（2019YFB1704100）

作者簡介：吳正昊（1999-），男，四川德陽人，碩士研究生，主要研究方向?yàn)閳D神經(jīng)網(wǎng)絡(luò)、信息安全（zhenghaowu1999@foxmail.com）；曾國蓀（1964-），男，江西吉安人，教授，博導(dǎo)，博士，主要研究方向?yàn)樾畔踩?、大?shù)據(jù)處理和并行分布計(jì)算等．

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

基于自適應(yīng)差異化圖卷積的社交網(wǎng)絡(luò)新增惡意用戶檢測