在當(dāng)前大數(shù)據(jù)時(shí)代,海量數(shù)據(jù)的挖掘和分析尤為重要,數(shù)據(jù)挖掘技術(shù)在媒體、金融、醫(yī)療、交通、電商等領(lǐng)域都取得了廣泛的應(yīng)用.但是,大數(shù)據(jù)的復(fù)雜多樣性以及數(shù)據(jù)挖掘技術(shù)在各行業(yè)應(yīng)用的特殊性也為數(shù)據(jù)挖掘領(lǐng)域提出了新的理論和技術(shù)挑戰(zhàn).為及時(shí)反映國(guó)內(nèi)同行在數(shù)據(jù)挖掘領(lǐng)域的最新研究成果,《計(jì)算機(jī)研究與發(fā)展》本次推出“數(shù)據(jù)挖掘前沿進(jìn)展”專(zhuān)題征文,以進(jìn)一步推動(dòng)我國(guó)數(shù)據(jù)挖掘領(lǐng)域的創(chuàng)新發(fā)展.
本專(zhuān)題得到了國(guó)內(nèi)同行的廣泛關(guān)注,經(jīng)公開(kāi)征文共收到稿件55篇.特約編委邀請(qǐng)多位數(shù)據(jù)挖掘及相關(guān)領(lǐng)域的專(zhuān)家參與審稿工作,每篇稿件都由2位專(zhuān)家進(jìn)行初審,2位特邀編委參考初審意見(jiàn)進(jìn)行了復(fù)審,從中選擇出了11篇優(yōu)秀稿件.此外,專(zhuān)題與第7屆中國(guó)數(shù)據(jù)挖掘會(huì)議(CCDM 2018)合作,從333篇會(huì)議投稿中遴選出了6篇高質(zhì)量稿件納入本專(zhuān)題.最終共有17篇稿件入選本專(zhuān)題.
首先,在大數(shù)據(jù)時(shí)代背景下,研究面向特定應(yīng)用領(lǐng)域的數(shù)據(jù)挖掘方法與技術(shù)具有重要意義.
史玉良等人的論文“基于用電特征分析的竊電行為識(shí)別方法”對(duì)獲取的用戶竊電行為數(shù)據(jù)進(jìn)行分析、處理,提出一種基于用電特征分析的竊電行為識(shí)別方法,實(shí)現(xiàn)對(duì)竊電嫌疑用戶的篩查;謝娟英等人的論文“蝴蝶種類(lèi)自動(dòng)識(shí)別研究”發(fā)布了一個(gè)同時(shí)包含標(biāo)本照片和生態(tài)照片的蝴蝶圖像數(shù)據(jù)集,并提出基于深度學(xué)習(xí)技術(shù)的蝴蝶種類(lèi)自動(dòng)識(shí)別系統(tǒng),包含對(duì)蝴蝶的位置自動(dòng)檢測(cè)和物種鑒定;杜航原等人的論文“基于網(wǎng)絡(luò)節(jié)點(diǎn)中心性度量的重疊社區(qū)發(fā)現(xiàn)算法”基于搜索密度峰值的聚類(lèi)思想,設(shè)計(jì)了一種網(wǎng)絡(luò)節(jié)點(diǎn)的中心性度量模型,并提出了一種重疊社區(qū)發(fā)現(xiàn)算法;梁吉業(yè)等人的論文“面向短文本分析的分布式表示模型”提出了一種詞對(duì)主題句向量模型(BTPV),該模型將詞對(duì)主題模型(BTM)得出的主題信息融入Paragraph Vector中;崔婉秋等人的論文“面向微博短文本的社交與概念化語(yǔ)義擴(kuò)展搜索方法”融合文本語(yǔ)義和標(biāo)簽等社交結(jié)構(gòu)信息,用社交語(yǔ)義對(duì)文本做進(jìn)一步擴(kuò)充,在此之下挖掘微博文本之間更多的潛在語(yǔ)義關(guān)系,提高微博短文本搜索的準(zhǔn)確性;朝魯?shù)热说恼撐摹白冹禺?huà)像:一種數(shù)量級(jí)壓縮物端數(shù)據(jù)的多粒度信息模型”提出了一種數(shù)量級(jí)壓縮物端數(shù)據(jù)的多粒度信息模型——變熵畫(huà)像(VEP),并設(shè)計(jì)實(shí)現(xiàn)了一種基于時(shí)間序列分解原理,且滿足VEP理論的物端數(shù)據(jù)存儲(chǔ)原型——TSR-VEP;鐘志權(quán)等人的論文“基于卷積神經(jīng)網(wǎng)絡(luò)的左右眼識(shí)別”利用一個(gè)深度卷積神經(jīng)網(wǎng)絡(luò)提出并驗(yàn)證了一種能夠自動(dòng)判別左右眼的新方法;吳建盛等人的論文“基于快速多示例多標(biāo)記學(xué)習(xí)的G蛋白偶聯(lián)受體生物學(xué)功能預(yù)測(cè)”利用快速多示例多標(biāo)記學(xué)習(xí)方法,基于新的混合特征,對(duì)G蛋白偶聯(lián)受體的基因本體學(xué)分子功能和生物學(xué)過(guò)程進(jìn)行了預(yù)測(cè);郭穎婕等人的論文“基于U統(tǒng)計(jì)量和集成學(xué)習(xí)的基因互作檢測(cè)方法”提出了一種基于U統(tǒng)計(jì)值與集成學(xué)習(xí)器的假設(shè)檢驗(yàn)框架GBUtrees,通過(guò)構(gòu)造統(tǒng)計(jì)量用于表征疾病性狀與2個(gè)基因之間關(guān)系偏離加性模型的程度,檢測(cè)以基因?yàn)閱挝坏幕?基因相互作用.
此外,作為實(shí)現(xiàn)智能化的核心技術(shù),基于機(jī)器學(xué)習(xí)的智能數(shù)據(jù)分析是數(shù)據(jù)挖掘領(lǐng)域研究的熱點(diǎn).
朱斐等人的論文“一種最大置信上界經(jīng)驗(yàn)采樣的深度Q網(wǎng)絡(luò)方法”在傳統(tǒng)深度Q網(wǎng)絡(luò)中引入優(yōu)先級(jí)概念,提出基于最大置信上界的采樣算法,通過(guò)獎(jiǎng)賞、時(shí)間步、采樣次數(shù)共同決定經(jīng)驗(yàn)池中樣本的優(yōu)先級(jí),提高所采樣本的多樣性;王倩等人的論文“密集異構(gòu)網(wǎng)絡(luò)中基于強(qiáng)化學(xué)習(xí)的流量卸載算法”將強(qiáng)化學(xué)習(xí)的思想引入流量卸載算法中,提出了一種異構(gòu)網(wǎng)絡(luò)中基于強(qiáng)化學(xué)習(xí)的流量卸載算法;綦小龍等人的論文“一種可度量的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法”提出了一種通過(guò)互信息排序的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法,該方法包括度量信息矩陣學(xué)習(xí)和“偷懶”啟發(fā)式策略2部分;鄒麗等人的論文“語(yǔ)言值直覺(jué)模糊概念格及其應(yīng)用”定義了語(yǔ)言值直覺(jué)模糊形式背景,構(gòu)造了語(yǔ)言值直覺(jué)模糊概念格,研究了語(yǔ)言值直覺(jué)模糊概念之間以及語(yǔ)言值直覺(jué)模糊概念格之間的貼近度,并提出了語(yǔ)言值直覺(jué)模糊概念格的模式識(shí)別方法,將其應(yīng)用于中醫(yī)疾病診斷識(shí)別中;王博等人的論文“布爾Game的核求解算法”研究了以布爾Game為輸入的核求解問(wèn)題;宋攀等人的論文“基于神經(jīng)網(wǎng)絡(luò)探究標(biāo)簽依賴(lài)關(guān)系的多標(biāo)簽分類(lèi)”基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)提出了一種探究標(biāo)簽之間依賴(lài)關(guān)系的算法,用以提升多標(biāo)簽分類(lèi)算法的性能;田澤等人的論文“稀疏約束下快速低秩共享的字典學(xué)習(xí)方法及其人臉識(shí)別”在字典學(xué)習(xí)中采用降維和字典聯(lián)合進(jìn)行學(xué)習(xí)的方式,同時(shí)施加低秩約束獲得共享字典,并將其應(yīng)用于人臉識(shí)別中;楊曉慧等人的論文“基于符號(hào)語(yǔ)義映射的知識(shí)圖譜表示學(xué)習(xí)算法”提出了一個(gè)基于符號(hào)語(yǔ)義映射的神經(jīng)網(wǎng)絡(luò)模型用于學(xué)習(xí)圖分布式表示,并且通過(guò)為圖中的每個(gè)關(guān)系類(lèi)型引入一個(gè)逆關(guān)系鏡像,使得模型能夠適應(yīng)多種不同類(lèi)型的(同構(gòu)或異構(gòu))網(wǎng)絡(luò)的關(guān)系推理任務(wù).
本專(zhuān)題主要面向數(shù)據(jù)挖掘及其相關(guān)領(lǐng)域的研究人員,在一定程度上反映了我國(guó)學(xué)者在數(shù)據(jù)挖掘等領(lǐng)域研究的前沿進(jìn)展.在此,我們要特別感謝《計(jì)算機(jī)研究與發(fā)展》編輯部對(duì)專(zhuān)題工作的指導(dǎo)與幫助,感謝編輯部在征文發(fā)布、論文評(píng)審與意見(jiàn)匯總、論文定稿、修改及出版工作中所付出的辛勤努力和汗水,感謝所有稿件評(píng)審專(zhuān)家及時(shí)、認(rèn)真的評(píng)審工作.此外,我們還要感謝諸多踴躍投稿的作者,感謝他們對(duì)專(zhuān)題工作的支持和對(duì)《計(jì)算機(jī)研究與發(fā)展》的信任.
最后,感謝專(zhuān)題的讀者們,希望本專(zhuān)題能夠?qū)ο嚓P(guān)領(lǐng)域的研究工作有所促進(jìn).