• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      水利工程安全隱患文本挖掘與智能管理技術(shù)研究

      2024-01-10 06:56:08楊濤趙嵩
      企業(yè)科技與發(fā)展 2023年12期
      關(guān)鍵詞:決策樹排查隱患

      楊濤,趙嵩

      (1.深圳市科榮軟件股份有限公司,廣東深圳 518001;2.云南大學(xué)信息學(xué)院,云南昆明 650504)

      0 引言

      隨著安全信息化工作的推進(jìn),水利工程建設(shè)積累了大量繁雜、多源異構(gòu)的隱患文本數(shù)據(jù),但是現(xiàn)階段的水利工程施工安全隱患分析主要依靠安全管理人員的個(gè)人經(jīng)驗(yàn),效率較低且難以發(fā)現(xiàn)隱患數(shù)據(jù)的內(nèi)部聯(lián)系。自然語(yǔ)言處理技術(shù)的發(fā)展,實(shí)現(xiàn)水利工程施工安全隱患文本的智能分類與管理成為可能。

      建筑業(yè)施工的安全隱患分類尚處于起步階段,目前業(yè)界對(duì)安全隱患的分類方式主要有兩種:一是基于人為預(yù)設(shè)框架的隱患分類,如HALLOWELL等[1]整合已有出版物對(duì)安全隱患的分類,總結(jié)得到接觸有害物質(zhì)、過(guò)度疲勞、重復(fù)運(yùn)動(dòng)等10 類安全隱患;二是基于數(shù)據(jù)聚類分析的隱患分類,如ZHAO 等[2]對(duì)地鐵隧道建設(shè)工程的243個(gè)安全事件進(jìn)行結(jié)構(gòu)分析,并采用聚類分析方法從事件組中挖掘并確定對(duì)事故發(fā)生影響最大的因素。雖然文本分類模型可以實(shí)現(xiàn)隱患文本的高效、精確分類,但是無(wú)法從文本中獲取更詳細(xì)的隱患信息[3]。針對(duì)分類后的安全隱患文本,詞云圖與共現(xiàn)網(wǎng)絡(luò)分析是文本挖掘中的常用方法,能夠發(fā)現(xiàn)文本的內(nèi)部特征及外部特征,具有較高的實(shí)用性與可靠性。潘杏等[4]利用詞云圖從時(shí)間維度對(duì)地鐵施工的安全隱患進(jìn)行可視化分析,挖掘地鐵安全隱患,排查要點(diǎn);薛楠楠等[5]利用共現(xiàn)網(wǎng)絡(luò),識(shí)別建筑工人不安全行為及其影響因素之間的關(guān)系。

      本文利用隨機(jī)森林模型進(jìn)行隱患文本的智能分類,并結(jié)合TF-IDF 算法獲得更深層次的語(yǔ)義信息,提升文本分類的精確度。本文所提方法可以為水利工程施工安全隱患問(wèn)題的文本智能分類及隱患排查線索的挖掘提供參考。

      1 研究?jī)?nèi)容與方法

      1.1 研究?jī)?nèi)容

      安全模塊對(duì)智慧監(jiān)管平臺(tái)每個(gè)標(biāo)段下的安全隱患描述進(jìn)行深入分析。首先,對(duì)安全隱患問(wèn)題描述文本數(shù)據(jù)進(jìn)行預(yù)處理。其次,采用TF-IDF 特征提取方法將隱患文本描述轉(zhuǎn)換為特征向量,采用隨機(jī)森林(Random Forest,RF)模型將安全隱患預(yù)測(cè)為10 個(gè)類別,分別是高處墜落、機(jī)械傷害、物體打擊、觸電、火災(zāi)爆炸、起重傷害、文明施工、機(jī)電信息、安保設(shè)施、建筑物破損。再次,依據(jù)分類后的結(jié)果,利用詞云和詞頻統(tǒng)計(jì)方法展現(xiàn)安全隱患概況,挖掘隱患核心詞;采用序列相似度匹配算法(Sequence Matcher,SM)從原始安全隱患數(shù)據(jù)里面匹配出包含核心詞的隱患數(shù)據(jù)集,采用隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型從數(shù)據(jù)集中聚類分析出每個(gè)核心詞的代表性數(shù)據(jù),作為每個(gè)類別下的隱患排查線索。最后,通過(guò)詞云圖可視化隱患的安全管理要點(diǎn)及隱患數(shù)據(jù)的內(nèi)部聯(lián)系,挖掘安全隱患文本中隱含的重要信息和內(nèi)在規(guī)律,用于輔助水利工程安全管理實(shí)踐。本研究為隱患文本智能知識(shí)挖掘提供新的思路,也為水利工程施工安全隱患排查及預(yù)防提供新的指導(dǎo)手段。

      1.2 研究方法

      1.2.1 文本預(yù)處理

      為獲得有效、可用的施工安全隱患數(shù)據(jù),本文結(jié)合工程施工安全隱患判定標(biāo)準(zhǔn)《工程管理人員“三管三必須”檢查手冊(cè)》等相關(guān)規(guī)范及實(shí)際工程施工經(jīng)驗(yàn),對(duì)施工安全隱患數(shù)據(jù)進(jìn)行處理。首先,由于數(shù)據(jù)來(lái)源于人工記錄,所以對(duì)工程數(shù)據(jù)中含有主觀推斷的信息、缺失值、異常值等數(shù)據(jù)均采用手動(dòng)方式進(jìn)行剔除,以獲得有效、可用的安全隱患數(shù)據(jù)。其次,針對(duì)水利工程施工安全領(lǐng)域的特點(diǎn),制作該領(lǐng)域的安全隱患字典輔助分詞,包括手動(dòng)添加專有名詞到自定義詞典中,例如“高處墜落”“電氣安全”“腳手架”等,以豐富和完善分詞效果,有效避免術(shù)語(yǔ)被錯(cuò)誤地分開或合并,提高數(shù)據(jù)處理和分析的精確度。再次,停用詞表采用哈爾濱工業(yè)大學(xué)停用詞表,在此基礎(chǔ)上將不規(guī)范的關(guān)鍵詞、無(wú)意義的詞添加到停用詞表中,用于去除隱患問(wèn)題描述文本中的停用詞(例如空格、標(biāo)點(diǎn)符號(hào))等影響文本處理與分析的無(wú)效信息。最后,采用jieba 分詞技術(shù)對(duì)隱患問(wèn)題描述文本進(jìn)行分詞操作,操作主要包含如下4個(gè)步驟:字典匹配、詞性標(biāo)注、建立有向無(wú)環(huán)圖和最短路徑分詞。

      1.2.2 基于隨機(jī)森林模型的安全隱患文本分類

      1.2.2.1 TF-IDF文本向量化

      為將安全隱患文本數(shù)據(jù)轉(zhuǎn)換為機(jī)器學(xué)習(xí)模型所能處理的數(shù)值型數(shù)據(jù),采用TF-IDF 實(shí)現(xiàn)文本數(shù)據(jù)的特征提取和向量化。TF-IDF 是一種常用的文本特征提取方法[6],用于評(píng)估一個(gè)詞對(duì)一個(gè)文檔集合的重要程度。TF-IDF 在對(duì)文本進(jìn)行特征提取的過(guò)程中,首先,將文本數(shù)據(jù)進(jìn)行分詞處理,將文本分割為單個(gè)的詞語(yǔ)或單詞序列。其次,TF-IDF 會(huì)構(gòu)建一個(gè)詞匯表,其中包含所有在文本數(shù)據(jù)中出現(xiàn)的不重復(fù)的詞語(yǔ),每個(gè)詞語(yǔ)將被賦予一個(gè)唯一的索引。再次,計(jì)算TF值,TF 表示安全隱患詞語(yǔ)在安全隱患文檔中出現(xiàn)的頻率。最后,將每個(gè)文檔中每個(gè)詞語(yǔ)的TF-IDF 值按照其索引位置組成一個(gè)向量,將文本數(shù)據(jù)轉(zhuǎn)換為向量表示,向量的維度等于詞匯表的大小。

      1.2.2.2 隨機(jī)森林分類模型

      為實(shí)現(xiàn)安全隱患文本的自動(dòng)預(yù)測(cè)分類,采用隨機(jī)森林分類模型對(duì)安全隱患數(shù)據(jù)進(jìn)行分類。隨機(jī)森林是一種基于決策樹模型[7],通過(guò)袋裝采樣技術(shù)(Bagging)在模型訓(xùn)練過(guò)程中引入隨機(jī)選擇屬性的算法,具備理論深度較低、計(jì)算量輕便等特點(diǎn)。

      (1)決策樹。決策樹作為基本的樹模型已被機(jī)器學(xué)習(xí)領(lǐng)域諸多模型使用,它的工作原理是從根節(jié)點(diǎn)出發(fā)后,在每一個(gè)分支節(jié)點(diǎn)找到最佳的分裂屬性后進(jìn)行分裂。隨著分裂節(jié)點(diǎn)的不斷增多,分裂節(jié)點(diǎn)不斷逼近停止條件,直到滿足停止條件時(shí),分裂節(jié)點(diǎn)停止分裂,構(gòu)成決策樹。決策樹的優(yōu)點(diǎn)在于其具備良好的可解釋性,決策樹中的每一個(gè)根節(jié)點(diǎn)都代表對(duì)一項(xiàng)特征的測(cè)試,從根節(jié)點(diǎn)延伸出去的每一條路徑都代表一條規(guī)則,路徑最終到達(dá)的葉節(jié)點(diǎn)則代表一個(gè)測(cè)試結(jié)果。也正因如此,決策樹良好的可解釋性體現(xiàn)在使用者可以通過(guò)逆向追溯每一條根節(jié)點(diǎn)和葉節(jié)點(diǎn)之間的路徑得到樣本的預(yù)測(cè)過(guò)程。決策樹的缺點(diǎn)在于作為單個(gè)的預(yù)測(cè)模型,其泛化性較差,對(duì)數(shù)據(jù)的質(zhì)量要求極高,如果數(shù)據(jù)存在少量噪聲就會(huì)嚴(yán)重影響決策樹的預(yù)測(cè)結(jié)果。因此,為彌補(bǔ)上述缺陷,需要將多個(gè)決策樹模型進(jìn)行集成,形成集成學(xué)習(xí)算法。

      (2)裝袋采樣。裝袋采樣技術(shù)的訓(xùn)練過(guò)程可總結(jié)為從容量為S的訓(xùn)練集樣本中采用有放回的方式隨機(jī)拿出N個(gè)樣本,這N個(gè)樣本便組成新的訓(xùn)練集樣本。上述采樣方式重復(fù)M次,組成M個(gè)獨(dú)立且具有相同權(quán)重的袋裝采樣樣本集合。隨機(jī)森林算法的集成模型的思想源于裝袋采樣技術(shù)選取的多個(gè)訓(xùn)練集,其中每一個(gè)由袋裝采樣算法生成的樣本集合之間已經(jīng)通過(guò)重采樣進(jìn)行樣本重構(gòu),而非簡(jiǎn)單的復(fù)制粘貼。正因如此,樣本集合之間的差異是源于隨機(jī)森林算法內(nèi)的諸多決策樹模型彼此之間存在隨機(jī)性。因此,袋裝采樣技術(shù)可以通過(guò)保證集成模型中每個(gè)子模型的預(yù)測(cè)精度且維持子模型之間的低相關(guān)性,以提高隨機(jī)森林算法的準(zhǔn)確率。

      (3)隨機(jī)森林。隨機(jī)森林作為一種集成模型,是由諸多決策樹模型組合而成,其算法流程如圖1所示。

      圖1 隨機(jī)森林算法流程

      1.2.2.3 文本分類模型評(píng)估指標(biāo)

      為評(píng)估隨機(jī)森林模型文本分類的有效性,采用精確率(P)、召回率(R)、F1 值評(píng)估模型的性能,各評(píng)價(jià)指標(biāo)的計(jì)算方法如下:

      其中:精確率P表示模型預(yù)測(cè)為正例的樣本中預(yù)測(cè)結(jié)果是正確的比例;召回率R表示被預(yù)測(cè)正確的正例樣本與總正例樣本的比率;F1值是精確率與召回率的調(diào)和平均指標(biāo),可精確反映出模型多方面的效果。

      1.2.3 基于LDA的安全隱患排查線索

      1.2.3.1 隱患詞云分析

      詞云圖是一種將詞語(yǔ)按照出現(xiàn)的頻率進(jìn)行排列的可視化方法,可以直觀地展示高頻關(guān)鍵詞的分布情況。在安全管理的過(guò)程中,為更清晰、全面地了解每個(gè)安全隱患類型下的具體隱患內(nèi)容,可以對(duì)每個(gè)安全隱患類型下的隱患數(shù)據(jù)進(jìn)行詞頻統(tǒng)計(jì),并繪制詞云圖,從而更好地反映隱患的總體特征。

      1.2.3.2 序列相似度匹配算法

      為根據(jù)隱患核心詞得到更加清晰的安全隱患致因,采用SM 算法[8]將上述利用詞頻統(tǒng)計(jì)方法挖掘出的隱患核心詞去原始隱患描述中匹配出眾多的包含該核心詞的隱患原始描述數(shù)據(jù)。SM 算法通過(guò)計(jì)算兩個(gè)序列之間的最長(zhǎng)公共子序列(Longest Common Subsequence,LCS)的長(zhǎng)度,計(jì)算兩個(gè)序列的相似度。LCS是指兩個(gè)序列中最長(zhǎng)的一個(gè)相同的子序列,它的長(zhǎng)度可以表示兩個(gè)序列的相似度。假設(shè)兩個(gè)序列分別為X和Y,LCS(X,Y)的長(zhǎng)度為len(LCS(X,Y)),那么它們的相似度計(jì)算如下:

      1.2.3.3 隱含狄利克雷分布

      采用SM 算法從原始安全隱患描述數(shù)據(jù)中匹配出包含安全隱患核心詞的原始隱患描述數(shù)據(jù)較多,為從眾多數(shù)據(jù)中選擇出一條具有代表性的安全隱患原始描述數(shù)據(jù)作為該核心詞的隱患排查線索,首先,對(duì)于每個(gè)包含核心詞的數(shù)據(jù)集,使用LDA 主題模型進(jìn)行聚類分析,將其聚成一個(gè)類別。其次,在每個(gè)數(shù)據(jù)集中計(jì)算主題關(guān)鍵詞的出現(xiàn)次數(shù),并選擇出現(xiàn)次數(shù)最多的前5 個(gè)主題關(guān)鍵詞作為該數(shù)據(jù)集的代表性關(guān)鍵詞。再次,計(jì)算每個(gè)數(shù)據(jù)集中核心詞和代表性關(guān)鍵詞的出現(xiàn)次數(shù)。最后,從每個(gè)數(shù)據(jù)集中選擇出現(xiàn)核心詞和代表性關(guān)鍵詞最多的一條數(shù)據(jù)作為代表性數(shù)據(jù)。通過(guò)這一流程,選擇出一條最具有代表性的安全隱患原始描述數(shù)據(jù),為核心詞提供有價(jià)值的隱患排查線索。

      LDA 主題模型結(jié)構(gòu)如圖2所示。從圖2 中可以看到,以白色圈表示隱藏變量,以灰色圈表示觀測(cè)變量,以及代表變量重復(fù)性質(zhì)的矩形形狀,這一結(jié)構(gòu)呈現(xiàn)了模型內(nèi)在的復(fù)雜關(guān)聯(lián),通過(guò)隱藏變量和觀測(cè)變量之間的交互,揭示潛在的主題結(jié)構(gòu)。這種設(shè)計(jì)提供對(duì)文本或其他數(shù)據(jù)集的更深層次理解,并為進(jìn)一步分析和建模提供了基礎(chǔ)。

      圖2 LDA主題模型結(jié)構(gòu)

      2 關(guān)鍵技術(shù)問(wèn)題和技術(shù)路線

      2.1 技術(shù)問(wèn)題

      (1)水利工程建設(shè)過(guò)程中積累的安全隱患文本數(shù)據(jù)來(lái)源于現(xiàn)場(chǎng)人工安全檢查記錄,存在語(yǔ)言含糊、描述不規(guī)范等問(wèn)題,因此如何將這些繁雜、多源異構(gòu)的隱患文本數(shù)據(jù)去除非中文字符、進(jìn)行分詞和去除停用詞,是確保后續(xù)特征提取和模型訓(xùn)練準(zhǔn)確性和可靠性的技術(shù)難點(diǎn)。

      (2)安全隱患文本數(shù)據(jù)存在規(guī)模大、數(shù)據(jù)稀疏的問(wèn)題,如何將安全隱患描述文本數(shù)據(jù)轉(zhuǎn)換為機(jī)器學(xué)習(xí)模型能處理的數(shù)值型數(shù)據(jù),而且數(shù)據(jù)轉(zhuǎn)換在捕捉安全隱患關(guān)鍵詞的同時(shí),保留隱患描述的信息豐富性,確保最后機(jī)器學(xué)習(xí)模型的預(yù)測(cè)準(zhǔn)確率也是技術(shù)難點(diǎn)。

      (3)雖然機(jī)器學(xué)習(xí)模型可以實(shí)現(xiàn)隱患文本的高效、精確分類,但是無(wú)法從文本中獲取更詳細(xì)的隱患知識(shí)。因此,針對(duì)分類后的安全隱患文本,需要進(jìn)一步分析各類安全隱患文本的管理要點(diǎn)及隱患數(shù)據(jù)的內(nèi)部聯(lián)系。

      (4)安全隱患核心詞可以反映各類安全隱患問(wèn)題的管理要點(diǎn),針對(duì)施工規(guī)模較大且安全隱患高發(fā)的標(biāo)段,僅根據(jù)安全隱患核心詞排查安全隱患問(wèn)題,由于包含該核心詞的問(wèn)題數(shù)量較多,涉及的施工場(chǎng)地較廣,要排查的范圍較大,因此如何根據(jù)安全隱患核心詞,從原始的隱患描述數(shù)據(jù)中找出一條具有代表性的安全隱患問(wèn)題作為隱患排查線索,明確隱患的致因,進(jìn)一步縮小隱患排查的范圍成為技術(shù)難點(diǎn)。

      2.2 技術(shù)路線

      (1)數(shù)據(jù)預(yù)處理:首先,使用正則表達(dá)式去除非中文字符,保留安全隱患描述中的中文文本。其次,制作針對(duì)水利工程施工安全隱患的詞典。最后,利用jieba 分詞庫(kù)對(duì)安全隱患文本進(jìn)行分詞,并根據(jù)預(yù)定義的停用詞表去除無(wú)意義的常用詞匯。

      (2)文本特征提取及向量化:采用TfidfVectorizer(文本特征提取)對(duì)預(yù)處理后的隱患文本描述進(jìn)行特征提取,選取適當(dāng)?shù)奶卣鲾?shù)量轉(zhuǎn)換為機(jī)器學(xué)習(xí)模型可識(shí)別的特征向量。

      (3)文本分類模型訓(xùn)練:采用機(jī)器學(xué)習(xí)模型里的隨機(jī)森林分類器對(duì)特征向量進(jìn)行訓(xùn)練,并實(shí)現(xiàn)安全隱患自動(dòng)預(yù)測(cè)分類,分為10個(gè)類別。

      (4)隱患數(shù)據(jù)挖掘:利用詞云和詞頻統(tǒng)計(jì)方法展現(xiàn)安全隱患概況,挖掘隱患核心詞。通過(guò)可視化隱患的安全管理要點(diǎn)及隱患數(shù)據(jù)的內(nèi)部聯(lián)系,進(jìn)而挖掘安全隱患文本中隱含的重要信息和內(nèi)在規(guī)律,用于輔助水利工程安全管理實(shí)踐。

      (5)隱患排查線索挖掘:首先,根據(jù)每一個(gè)核心詞,依次利用SM 算法從原始隱患數(shù)據(jù)中匹配出包含核心詞的隱患數(shù)據(jù)集。其次,采用隱含狄利克雷分布(LDA)模型依次對(duì)包含核心詞的數(shù)據(jù)集進(jìn)行聚類分析,主題類別設(shè)置為1。最后,結(jié)合隱患核心詞和該數(shù)據(jù)集的主題關(guān)鍵詞從數(shù)據(jù)集中匹配出每個(gè)隱患核心詞的隱患排查線索。

      3 結(jié)果與分析

      3.1 基于RF的文本分類模型效果

      以珠江三角洲水資源配置工程信息化平臺(tái)智慧監(jiān)管模塊下的安全隱患臺(tái)賬信息做為數(shù)據(jù)源。本文從安全管理系統(tǒng)中獲取到2019—2023年施工期間的80 953 條安全隱患原始數(shù)據(jù)作為數(shù)據(jù)源。每條安全隱患數(shù)據(jù)主要包含標(biāo)段、隱患描述、隱患類型、整改措施和檢查日期等字段,其中標(biāo)段、隱患描述、隱患類型和整改措施均為非結(jié)構(gòu)化的文本數(shù)據(jù)。本文主要借助隱患描述信息進(jìn)行安全隱患分類及隱患信息挖掘,每條隱患記錄均有手動(dòng)標(biāo)記的隱患種類標(biāo)簽。

      本文將數(shù)據(jù)集按照7∶3的比例劃分為訓(xùn)練集、測(cè)試集。對(duì)所有數(shù)據(jù)進(jìn)行打亂處理。表1 為隱患數(shù)據(jù)集中的樣本實(shí)例,以消防安全、用電作業(yè)、文明施工3個(gè)類別描述樣本為例。

      表1 隱患分類數(shù)據(jù)集示例

      本文所用的隨機(jī)森林分類模型使用的編程語(yǔ)言為Python3.7,利用Pytorch 學(xué)習(xí)框架下的sklearn 庫(kù)。模型超參數(shù)選擇的結(jié)果為n_estimators=12,max_depth=4,criterion="gini"。模型各項(xiàng)指標(biāo)見表2。

      表2 模型指標(biāo)

      3.2 隱患詞云圖分析

      為幫助安全管理人員快速捕捉不同種類施工隱患的關(guān)鍵信息,借助詞云圖更加直觀地為安全管理人員展示不同隱患種類及其主要隱患表征。在隱患描述內(nèi)容中加入隱患部位信息,并將隱患部位、常見隱患詞匯等構(gòu)建用戶詞典加入分詞器中,利用Word Cloud 工具包為不同隱患類別選擇關(guān)鍵短語(yǔ),繪制隱患特征詞云圖。本文在每次繪制隱患詞云圖時(shí),選取前20個(gè)關(guān)鍵短語(yǔ)剔除對(duì)隱患知識(shí)挖掘無(wú)顯著影響的無(wú)意義詞語(yǔ),在此基礎(chǔ)上繪制隱患詞云圖。圖3 中的詞語(yǔ)字體越大,代表該詞語(yǔ)出現(xiàn)的頻率越高,與其相關(guān)的隱患越容易發(fā)生。例如,“安全帽”“乙炔”“電纜”等字體較大,則需對(duì)相關(guān)的安全隱患進(jìn)行重點(diǎn)關(guān)注。

      圖3 詞云圖

      3.3 基于SM-LDA模型的安全隱患排查線索分析

      根據(jù)上述詞云圖統(tǒng)計(jì)分析出的高頻隱患核心詞有氧氣瓶、安全帽、乙炔、護(hù)欄、材料、電纜、龍門吊、盾構(gòu)、積水、標(biāo)識(shí)牌。

      以高頻詞“安全帽”為例,首先利用SM 算法從原始隱患數(shù)據(jù)中匹配出包含核心詞的隱患數(shù)據(jù)集(見表3)。其次,利用LDA 主題模型對(duì)表3 中包含核心詞“安全帽”的數(shù)據(jù)進(jìn)行聚類分析,將類別設(shè)定為1,在該數(shù)據(jù)集中計(jì)算主題關(guān)鍵詞出現(xiàn)的次數(shù),得到該數(shù)據(jù)集的主題關(guān)鍵詞列表;從主題關(guān)鍵詞列表中選擇出現(xiàn)次數(shù)最多的前5 個(gè)主題關(guān)鍵詞作為該數(shù)據(jù)集的代表性關(guān)鍵詞,即“安全帽”“佩戴”“人員”“現(xiàn)場(chǎng)”“作業(yè)”。最后,從表3的數(shù)據(jù)集中選擇出一條出現(xiàn)代表性關(guān)鍵詞最多的安全隱患描述作為“安全帽”這個(gè)詞的具體隱患排查線索,即“現(xiàn)場(chǎng)作業(yè)人員未正確佩戴安全帽”,該描述包含代表性關(guān)鍵詞最多。同理,根據(jù)高頻隱患核心詞挖掘分析得到更具針對(duì)性的隱患排查線索(見表4)。

      表3 包含“安全帽”的隱患描述

      表4 安全隱患排查線索表

      4 結(jié)語(yǔ)

      本文基于RF 模型對(duì)珠江三角洲水資源配置工程信息化平臺(tái)的安全隱患臺(tái)賬數(shù)據(jù)進(jìn)行文本分類和信息挖掘。通過(guò)隱患描述信息,模型展現(xiàn)了良好的分類效果。隨后,通過(guò)詞云圖,直觀地展示不同隱患種類的關(guān)鍵信息。同時(shí),基于SM 算法和LDA 模型的排查線索分析為安全管理人員提供針對(duì)性的隱患排查指引。綜合而言,本文的研究結(jié)果可為水利工程施工安全管理人員提供參考和指導(dǎo),能為提升水利工程施工現(xiàn)場(chǎng)的安全性和效率提供幫助。本文側(cè)重于對(duì)安全隱患數(shù)據(jù)的分析,缺少對(duì)安全隱患在時(shí)間序列方面的研究,后續(xù)將進(jìn)一步結(jié)合安全隱患發(fā)生的時(shí)間因素進(jìn)行回歸分析。

      猜你喜歡
      決策樹排查隱患
      隱患隨手拍
      隱患隨手拍
      互聯(lián)網(wǎng)安全隱患知多少?
      隱患隨手拍
      高層建筑消防安全排查情況及處理對(duì)策
      配網(wǎng)二次回路故障的排查分析
      電子制作(2019年20期)2019-12-04 03:52:04
      給家中來(lái)個(gè)危險(xiǎn)排查吧
      媽媽寶寶(2019年10期)2019-10-26 02:45:42
      一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      如何排查并改錯(cuò)
      卓尼县| 阳西县| 山阳县| 密山市| 如东县| 拜城县| 邓州市| 游戏| 双牌县| 罗城| 逊克县| 凤山县| 乌苏市| 新蔡县| 阜平县| 夏邑县| 普兰县| 蕉岭县| 且末县| 东光县| 依兰县| 镇雄县| 乐亭县| 静安区| 栖霞市| 新乡县| 临夏县| 南京市| 巴林右旗| 闵行区| 高雄县| 土默特左旗| 大余县| 镇江市| 大庆市| 临漳县| 顺平县| 应用必备| 深水埗区| 黄龙县| 花垣县|