王 莉
(太原理工大學(xué) 大數(shù)據(jù)學(xué)院,太原 030024)
在信息技術(shù)快速發(fā)展的時(shí)代,數(shù)據(jù)已成為重要的生產(chǎn)要素,大數(shù)據(jù)上升為國家戰(zhàn)略。本期本欄目專門刊發(fā)了由中國計(jì)算機(jī)學(xué)會(huì)CCF主辦,CCF大數(shù)據(jù)專家委員會(huì)和中山大學(xué)聯(lián)合承辦的第九次全國大數(shù)據(jù)學(xué)術(shù)會(huì)議推薦的5篇優(yōu)秀論文,內(nèi)容涵蓋了電力數(shù)據(jù)挖掘,智慧司法,醫(yī)學(xué)圖像分類,推薦系統(tǒng),實(shí)體關(guān)系抽取等各方面的內(nèi)容。反映了當(dāng)前大數(shù)據(jù)在各行業(yè)的廣泛應(yīng)用,相關(guān)成果將為研究人員帶來啟發(fā)。
杜清月等的文章“基于帕累托效應(yīng)視角下的推薦系統(tǒng)多角度公平性”,通過對(duì)抗正則化器消除用戶嵌入中的敏感屬性信息,采用基于曝光的負(fù)采樣策略,提高推薦系統(tǒng)的準(zhǔn)確率實(shí)現(xiàn)了用戶物品的多角度,公平性。王紅等的文章“基于多跳注意力的實(shí)體關(guān)系聯(lián)合抽取方法及應(yīng)用研究”,提出了一種頭實(shí)體增強(qiáng)的多跳注意力隱性關(guān)系聯(lián)合挖掘模型,實(shí)現(xiàn)了文本中潛在的隱含關(guān)系三元組挖掘,在多個(gè)數(shù)據(jù)集上都有較好的表現(xiàn)。陳曦等的文章“大范圍低壓供電區(qū)電力消費(fèi)及竊電規(guī)律研究”,從供電、用電、線損、竊電4個(gè)方面進(jìn)行數(shù)據(jù)分析,建立統(tǒng)計(jì)模型與聚類模型,探索電力消費(fèi)和竊電的規(guī)律。許梓濤等的文章“一個(gè)新的上下文感知類案匹配與推薦方法”,針對(duì)司法判案提出了一個(gè)端到端高效率的文本匹配與推薦模型,應(yīng)用到中國“法研杯”2019相似案件匹配任務(wù)中效果良好。謝娟英等的文章“新冠肺炎CXR圖像分類新模型COVID-SERA-NeXt”,在ResNeXt模型基礎(chǔ)上提出一種針對(duì)新型冠狀病毒胸部X射線圖像分類的模型,在多項(xiàng)指標(biāo)上優(yōu)于基礎(chǔ)模型。
CCF大數(shù)據(jù)學(xué)術(shù)會(huì)議自2013年舉辦以來,已經(jīng)成為國內(nèi)大數(shù)據(jù)領(lǐng)域的旗艦會(huì)議,受到國內(nèi)外同行的廣泛關(guān)注。經(jīng)過大會(huì)組委會(huì)至少3個(gè)大數(shù)據(jù)領(lǐng)域?qū)<业木W(wǎng)絡(luò)評(píng)審、組委會(huì)組織專家的線下論文會(huì)審以及期刊社的編審,最終遴選出5篇優(yōu)秀論文入選本期專題,期望本專題的出版對(duì)大數(shù)據(jù)領(lǐng)域研究人員提供啟發(fā)和幫助。