信息技術(shù)的發(fā)展使得數(shù)據(jù)采集、存儲、管理等成本下降,同時也給機器學(xué)習(xí)等人工智能方法提供了足夠的訓(xùn)練樣本,使大數(shù)據(jù)成為人工智能發(fā)展的三大重要基礎(chǔ)(數(shù)據(jù)、算法和算力)。在近年來大數(shù)據(jù)技術(shù)發(fā)展的基礎(chǔ)上,人工智能在技術(shù)發(fā)展和落地應(yīng)用等方面都獲得了諸多突破。在當前大數(shù)據(jù)產(chǎn)業(yè)鏈日趨成熟的背景下,大數(shù)據(jù)與人工智能的結(jié)合也在向更全面的方向發(fā)展,跨越了棋類游戲、網(wǎng)頁搜索、語音合成、人臉識別等單點應(yīng)用,逐步發(fā)展到無人駕駛、智慧交通、智能司法、工控機器人、智能網(wǎng)絡(luò)應(yīng)用等更復(fù)雜的應(yīng)用形態(tài)。本專題選取了材料科學(xué)、智能司法、內(nèi)容分析等多個領(lǐng)域中的一些成功案例,探討了大數(shù)據(jù)技術(shù)如何支撐人工智能中的知識表示、推理預(yù)測、智能算法、認知計算等方面和環(huán)節(jié),達到支撐整個領(lǐng)域智能應(yīng)用的目標。
任帥等人在《基于材料數(shù)值計算大數(shù)據(jù)的材料輻照機理發(fā)現(xiàn)》中,研究了材料輻照效應(yīng)的數(shù)值模擬問題,挖掘分析了輻照損傷機理和性能演化規(guī)律,達到認識核材料服役性能的目的。在綜述了近年來該領(lǐng)域相關(guān)工作的基礎(chǔ)上,文章重點介紹了自主研發(fā)的材料輻照效應(yīng)分子動力學(xué)軟件和隨機團簇動力學(xué)軟件,以及其在國產(chǎn)超級計算機上的實際算例。
近年來,大數(shù)據(jù)、人工智能與司法實踐的不斷融合推動了智慧法院的建設(shè)發(fā)展。本期專題選取了貴州大學(xué)秦永彬老師團隊的兩個相關(guān)工作。黃輝等人在《基于BERT閱讀理解框架的司法要素抽取方法》中,針對司法要素抽取的現(xiàn)狀問題,提出基于BERT閱讀理解框架的要素抽取方法,引入標簽信息和法律先驗知識構(gòu)造輔助問句,利用BERT機器閱讀理解模型建立輔助問句和裁判文書之間的語義聯(lián)系,并在婚姻家庭、勞動爭議、借款合同3類案件上進行了驗證。孫倩等人在《結(jié)合案件要素序列的罪名預(yù)測方法》中,提出了一種結(jié)合案件要素序列的罪名預(yù)測方法。該方法將案情事實過程表示為一系列以“行為”為核心、具有時序關(guān)系的案件要素序列,利用圖卷積神經(jīng)網(wǎng)絡(luò)進行要素表示,融合文本語義特征來預(yù)測案件罪名。
張寶華等人在《基于多輸入模型及句法結(jié)構(gòu)的中文評論情感分析方法》中,針對基于規(guī)則的方法中句法規(guī)則特征的作用,提出了一種將句法規(guī)則特征融入神經(jīng)網(wǎng)絡(luò)的新模型。該模型結(jié)合MCNN、LSTM和全連接神經(jīng)網(wǎng)絡(luò),同時將文本向量、情感詞向量和語法規(guī)則向量輸入獨立的神經(jīng)網(wǎng)絡(luò)模型中,對模型提出的特征進行拼接,得到更加全面的文本 特征。
杜雪濤在《大數(shù)據(jù)認知計算在內(nèi)容安全管控中的應(yīng)用》中,從通信網(wǎng)絡(luò)中的海量垃圾和不良信息特征提取及攔截封堵需求出發(fā),研究了如何使用基于大數(shù)據(jù)的認知計算技術(shù)代替人工進行海量數(shù)據(jù)分析和理解,幫助人們制訂內(nèi)容安全管控策略。針對電信詐騙治理、不良消息治理、變體消息治理和不良網(wǎng)站治理4個方面遇到的實際問題,分別提出了大數(shù)據(jù)認知計算的解決方案。
限于篇幅,本專題難以覆蓋大數(shù)據(jù)對人工智能、智能應(yīng)用的支撐作用的其他方面,也無法深入探討各類技術(shù)方法的核心細節(jié)。希望本專題能在大數(shù)據(jù)與人工智能、智能應(yīng)用的聯(lián)系方面起到拋轉(zhuǎn)引玉的作用,為學(xué)術(shù)界和產(chǎn)業(yè)界帶來一些樣例和啟示。