李瑩 楊士 唐靜 蔡繼永
關鍵詞:社會力量;災后救援;自合作;文本聚類;主題模型
中圖分類號:TP321 文獻標識碼:A
文章編號:1009-3044(2023)08-0019-03
0 引言
自然災害事件的發(fā)生往往會對社會造成巨大的損失[1]。如何在自然災害發(fā)生時,快速、有序、高效地組織救援是當今社會迫切需要解決的問題。
民間力量參與社會救助事業(yè)在我國古代就有記載[2],社會救援力量在災后救援中承擔著重要的角色。在2008年2月,中國南方大部分地區(qū)遭遇了五十年不遇的冰凍災害[3],為了讓救援活動順利開展,四面八方的社會組織成員積極地參與到此次抗凍救災活動中。除此之外,社會組織在汶川地震、蘆山地震等災后救援中也起到了重要的作用,這說明我國社會組織正在不斷發(fā)展和進步。但是,社會組織在參與災后救援過程中,也存在著職責不清、缺乏統(tǒng)一指揮調度、相互之間無協(xié)作等問題,因此明確救災類社會組織的構成,對其進行統(tǒng)一的管理是目前亟待解決的問題。
本文根據(jù)關鍵詞“志愿”“應急救援”“慈善”來收集社會組織信息以及其業(yè)務范圍,并結合TF-IDF與LSA主題模型對各類社會組織細化標簽,通過主題聚類分析明確各社會組織在救援行動中的職責和任務,以此來明確社會組織間災后救援時的職責定位。文本主題聚類是將相似度較高的同種類型的文本聚合在一起,因為它不需要先驗知識,因此,是一種無監(jiān)督的機器學習方法。近年來,國內外學者在文本聚類方面做了很多的研究。評價一個文本聚類的標準包括三個方面:聚類的質量是否滿足應用需求、聚類的效率是否高以及聚類的可視化是否清晰明了。本文采用TF-IDF與LSA主題聚類模型,對社會組織進行細化標簽,并根據(jù)困惑度選擇最佳主題數(shù)量,確定各類社會組織的救災類型。
1 災后救援中社會組織間自合作現(xiàn)狀分析
自2008年以來,我國的社會力量逐漸壯大,并積極投身于災后救援工作。社會組織在參與救援時,具備很多社會優(yōu)勢,如能夠及時了解各種受災群體的需求,并為其提供更專業(yè)化的救助等[4]。社會組織在參與救援的過程中也存在著一系列問題,如信息獲取渠道不暢通、信息內容不對稱等。針對這些問題,國內外學者也提出了一系列的解決方案,如張雷等人[5]在全方位分析災后的需求后,采用基于優(yōu)化模型的分組算法,對地震災害應急救援隊伍的分組問題進行求解,王薇等人[6]為了解決社會支援組織在突發(fā)事件中能力不足等問題,設置了5個一級指標和18個二級指標構建能力評價體系,以此加強社會救援組織能力的建設。
目前,參與災后救援的社會組織力量逐漸壯大,他們在參與災后救援的工作時,并不是單打獨斗,而是共同協(xié)作的方式。
總體來說,不同救援類型的社會組織在災后救援中擔當著不同的角色,不僅包括資源收集者、行動倡導者、信息整合者,還包括專業(yè)服務者、組織連接者等,其供給鏈條如圖1所示。
當自然災害發(fā)生時,組織協(xié)調者負責對整個救援活動的流程進行調度與策劃[7],并將信息收集組織收集上來的信息進行整合,整合的信息通過網(wǎng)絡等方式傳遞出去。當災區(qū)外的社會組織成員接收到救災信息后,開始向各方籌集物資,并派送專業(yè)的救援人員前往災區(qū)展開救援??梢钥闯?,災區(qū)中的各類組織在其中發(fā)揮著不同的作用,單一類型組織難以應對復雜多變的災區(qū)情況,因此,需要組織間進行橫向合作和資源共享,以此提高救援效率。
2 基于TF-IDF與LSA模型的社會組織聚類分析
2.1 TF-IDF模型
在此公式中,f表示單詞j在文檔i 中出現(xiàn)的頻率,N 表示總文檔數(shù),n表示文檔中出現(xiàn)單詞j 的文檔數(shù)量。該公式所計算的是某一文本的高詞語頻率,以及該詞語在文本集合中的低文本頻率,以此計算出高權重的TF-IDF,得出文本中的重要詞語。
2.2 LSA 模型
LSA(Latent Semantic Analysis) 是自然語言中基于潛在語義分析的文本主題獲取模型[9],LSA通過奇異值分解方法得到語句中的主題。該模型首先需要將文本轉化為單詞矩陣,然后設定特定數(shù)量的主題,對單詞文本矩陣進行奇異值分解,以此來得到主題向量空間,其公式如式(3) 所示:
在該公式中,m 表示單詞的維度,n 表示樣本的個數(shù),k 表示主題數(shù)量,其中,m、n、k 滿足不等式,如式(4) :
LSA主題模型是將由文字轉化成的高維數(shù)據(jù)映射為具有較低維度的矩陣,減少了問題的大小,并給出了文字和文字的上下語義關系。
2.3 TF-IDF 與LSA 模型的主題分析
在該主題分析模型中,首先使用TF-IDF模型對文本進行重要詞頻統(tǒng)計,得出TF-IDF矩陣,然后利用LSA模型分析,首先分析文本集合,根據(jù)文本信息建立Term-Document矩陣;建立后,對該集合進行奇異值SVD分解,并對分解后的矩陣進行降維,保留前n個主題詞;降維后,根據(jù)特定的主題數(shù)量,對文本中的主體進行提??;最后,將社會組織救災類服務主題提取出來。
2.4 數(shù)據(jù)采集
本文通過查詢中國社會組織公共服務平臺,以“志愿”“應急救援”“慈善”三個詞為關鍵詞,搜索相關類型的社會組織信息,通過查找,獲取12 042個社會組織的業(yè)務范圍介紹(見表1) 。
在救災工作范疇內,各個社會組織都有自己的職能。例如,一個公益類型的社會組織,其工作范疇主要包括:從事志愿者注冊管理、培訓等工作,為志愿者發(fā)展創(chuàng)造機遇;承擔政府和相關單位所委派的各種社工服務;組織社會工作者的專題研討、推廣及學術交流;推進精神文明建設、社區(qū)建設、扶貧開發(fā)工作;協(xié)助老年人、助殘、關愛未成年兒童、救災和大型社會性事件等;向有特別困難和需求的人士提供服務等。
2.5 數(shù)據(jù)預處理
數(shù)據(jù)采集結束時,為了防止因重復信息造成研究結論不正確,須進行去重處理,確保各個文本的獨立性。為獲得大量有價信息,節(jié)約空間和提升統(tǒng)計質量,對大量中文文本信息進行去除停用詞的操作,本文將使用jieba分詞對大量中文文本信息進行處理,部分詞頻的統(tǒng)計成果見表2所示。
2.6 主題挖掘
利用TF-IDF與LSA主題模型對社會組織業(yè)務范圍進行主題挖掘。首先對預處理后的數(shù)據(jù)進行關鍵詞提取和向量轉換,主題數(shù)目以圖1中社會組織供給鏈為基礎,設置主題數(shù)范圍為[1,6]。
本文實驗的參數(shù)設置為a=1/K, β=0.01,高斯采樣的迭代次數(shù)設置為1 500次,LSA主題數(shù)根據(jù)模型困惑度計算結果見圖2所示。
從圖2中可以看出,當主題數(shù)增加時,模型困惑度也逐漸減小,并逐漸趨向穩(wěn)定狀態(tài)。因此,本實驗的主題數(shù)設置為6。
3 實驗結果分析
根據(jù)LSA主題模型聚類結果,總結出七個社會組織服務類型,見表3。
從分析結果可以看出,我國的救援類社會組織呈現(xiàn)多元化發(fā)展,如專業(yè)救援組織,其主要從事的是有關于自然災害的救援工作,其占比數(shù)達到15.2%;以救助區(qū)兒童為主要救援工作的社會組織占比數(shù)為8.4%;公益類型的社會組織,占比數(shù)達到21.1%。從表3中的七個主題來看,我國的社會救援組織是災后救援的重要力量,不同救援的社會組織發(fā)揮著不同的作用。
4 結論
本文采用TF-IDF和LSA算法對國內災害救助中的各類社會力量組織進行了聚類分析,以此加強其自我協(xié)作能力。因為社會組織在救災工作的特殊性,其在救災工作中所扮演的角色不盡相同,而其各自的特點也有所區(qū)別。因此,有效橫向協(xié)作與垂直協(xié)作可以大大提高救援效率。并且高效的協(xié)作方式對拯救受災群眾的生命和財產(chǎn)具有重要意義。研究表明,在災害發(fā)生后,隨著社會組織的規(guī)模越來越大,其提供的服務類型也越來越多,這些社會組織之間的協(xié)作是提高救援效率的有效途徑。因此,明確社會救援組織類型,提前做好災前部署是極其重要的。