曹佳雨 趙俊
摘要:目前,以微博為主導(dǎo)的網(wǎng)絡(luò)媒體平臺(tái)已經(jīng)成為民眾信息交流的主要渠道。分析微博相關(guān)評(píng)論文本,有利于為醫(yī)療服務(wù)管理提供幫助。研究基于新浪微博,挖掘網(wǎng)民對(duì)醫(yī)療服務(wù)體驗(yàn)的評(píng)價(jià)內(nèi)容,進(jìn)行意見挖掘、情感分析等實(shí)證研究,把握和理解網(wǎng)民就診體驗(yàn)關(guān)注點(diǎn)演變情況,為醫(yī)療機(jī)構(gòu)改進(jìn)就醫(yī)流程、改善就醫(yī)體驗(yàn)提供參考。
關(guān)鍵詞:微博;用戶評(píng)論;觀點(diǎn)發(fā)掘;情感分析
根據(jù)《2020年微博用戶發(fā)展報(bào)告》,截至2020年9月,微博月活躍用戶達(dá)5.11億,日活躍用戶達(dá)224億,廣泛覆蓋全國范圍。伴隨互聯(lián)網(wǎng)高速發(fā)展,微博迅速推廣,越來越多的網(wǎng)民可以借助網(wǎng)絡(luò)平臺(tái)獲知信息,發(fā)表觀點(diǎn)。微博是一種當(dāng)下時(shí)興的互聯(lián)網(wǎng)社交平臺(tái),具有發(fā)布信息便利性強(qiáng)、閱覽時(shí)效性高等優(yōu)點(diǎn),逐漸成為民眾搜集信息、溝通交流的主要工具。
網(wǎng)絡(luò)輿情即指網(wǎng)民對(duì)社會(huì)環(huán)境中的種種現(xiàn)象和事件表達(dá)的態(tài)度、想法、看法、情緒等觀點(diǎn)的總和。針對(duì)就醫(yī)體驗(yàn)相關(guān)網(wǎng)絡(luò)文本數(shù)據(jù)進(jìn)行分析,有利于把握了解網(wǎng)民用戶對(duì)于醫(yī)療服務(wù)的觀點(diǎn)體驗(yàn),有助于醫(yī)療機(jī)構(gòu)獲得及時(shí)反饋,提高其服務(wù)水平。
內(nèi)容情感分析是指通過分析自然語言、計(jì)算機(jī)語言來挖掘主觀文本包含具有隱藏情感色彩的信息,例如判斷文本內(nèi)容是消極還是積極。文獻(xiàn)研究表明,目前情感分析方法已經(jīng)相對(duì)成熟,利用該方法進(jìn)行研究具有一定的參考價(jià)值。
研究框架
數(shù)據(jù)采集
利用網(wǎng)絡(luò)爬蟲收集數(shù)據(jù),基于“就診”“就醫(yī)”等關(guān)鍵詞,收集至2021年7月31日的個(gè)人用戶原創(chuàng)微博內(nèi)容,包括博主頭像、發(fā)布ID、文本主頁、用戶賬號(hào)是否認(rèn)證、博文獨(dú)立網(wǎng)址、發(fā)布日期、發(fā)布媒介、轉(zhuǎn)發(fā)數(shù)量、評(píng)論數(shù)量和點(diǎn)贊數(shù)量等信息。
數(shù)據(jù)處理
將原創(chuàng)微博內(nèi)容導(dǎo)入到Excel表格中,按照博主ID、賬號(hào)類型、博文網(wǎng)址分類記錄表格管理。根據(jù)研究條件,篩選過濾不符合研究需要的相關(guān)博文。篩選條件包括微博賬號(hào)類型為非個(gè)人,微博無效內(nèi)容,如廣告、網(wǎng)頁鏈接或與研究主題無關(guān)的微博文本數(shù)據(jù)。使用Jieba分詞組件對(duì)文本數(shù)據(jù)進(jìn)行處理,刪除重復(fù)和無關(guān)的文本數(shù)據(jù),參照停用詞表刪除停用詞,基于單詞詞性對(duì)每一個(gè)被分割出來的關(guān)鍵詞的詞性依次標(biāo)注記錄。結(jié)合關(guān)鍵詞詞語屬性標(biāo)注記錄結(jié)果,剔除屬性為助詞、虛詞、連詞、介詞等沒有實(shí)際含義的主體詞語和所有的標(biāo)點(diǎn)、符號(hào),最終獲得每條帶有詞語屬性分類標(biāo)注的微博內(nèi)容文本主題詞數(shù)據(jù)集合。
觀點(diǎn)發(fā)掘
通過對(duì)微博內(nèi)容文本的閱讀可以得出,網(wǎng)民為了表達(dá)某些觀點(diǎn)所使用的詞語往往都存在一類能夠涵蓋基本觀點(diǎn)內(nèi)涵的關(guān)鍵詞。因此在本研究中,使用微博文本中出現(xiàn)的關(guān)鍵詞的重要程度作為指標(biāo)來評(píng)價(jià)文本內(nèi)容數(shù)據(jù)的主要內(nèi)容。高頻詞是指微博用戶在微博內(nèi)容中頻繁使用出現(xiàn)的詞語或者短語。本文采用文本特征加權(quán)法提取熱點(diǎn),計(jì)算主題詞權(quán)重,過濾低頻詞,提取高頻詞。通過上述方法所提取的意見詞語后,再進(jìn)行兩次人工鑒別、選擇、過濾提取內(nèi)容觀點(diǎn),進(jìn)一步進(jìn)行聚類分析。情感分析
網(wǎng)友的情緒即是網(wǎng)友在受到外界社會(huì)生活刺激從而產(chǎn)生的心理層面的感受,可以分為積極情感、消極情感以及中性情感。本文利用情感分析工具Snow NLP對(duì)文本內(nèi)容進(jìn)行分析,對(duì)積極情緒、消極情緒和中性情緒詞語進(jìn)行分類和計(jì)數(shù),最終統(tǒng)計(jì)得到網(wǎng)友積極情緒、消極情緒和中性情緒數(shù)量和所占比例。
研究結(jié)果
觀點(diǎn)發(fā)掘
研究共收集4772條微博數(shù)據(jù),最終篩選得到27條有效數(shù)據(jù),處理的可視化詞云圖如下。其中,按Tf—idf值排名前十的熱點(diǎn)詞分別是:“健康、朋友、感染、比較、那個(gè)、第一、必須、確診、中醫(yī)、病情”(見圖1)。首先可以看出網(wǎng)民對(duì)健康問題的關(guān)注度日漸提高,廣大群眾對(duì)健康的需求也成為了一個(gè)重要話題;其次,特征詞“朋友”的高頻率說明朋友之間的交流是用戶溝通的主要渠道;“比較、那個(gè)、第一”等詞反映出用戶對(duì)醫(yī)療機(jī)構(gòu)的要求也在逐漸增加,體現(xiàn)人們對(duì)醫(yī)療衛(wèi)生資源的多層面需求日益加大;“確診”等詞匯主要與疫情相關(guān),顯示了民眾對(duì)當(dāng)前疫情的重視,以及對(duì)疫情期間就醫(yī)行為的關(guān)注;“中醫(yī)”體現(xiàn)了隨著健康素養(yǎng)的增加,民眾對(duì)傳統(tǒng)中醫(yī)藥的評(píng)價(jià)與需求逐漸加大,越來越受到民眾的認(rèn)可支持;“病情”直觀反映了人們對(duì)自身健康安全的關(guān)注,成為人們就醫(yī)治療的主要需求??傮w來說,網(wǎng)民的就醫(yī)體驗(yàn)與對(duì)醫(yī)療保健服務(wù)和健康的需求的日益增長相關(guān),主要集中在治療效果、醫(yī)療資源選擇和診療方式等方面,希望獲得更好更優(yōu)質(zhì)的醫(yī)療服務(wù)。
情感分析
研究利用情感分析工具Snow NLP對(duì)評(píng)論文本進(jìn)行情感分析,計(jì)算主題詞情感值,情感值范圍在0~1之間,取值越接近1,表達(dá)情感越正向,越接近0表達(dá)情感越負(fù)面。本文以0.5為分界值,把情感值大于0.5分的劃分為正向情感文本,小于0.5分的視為負(fù)向情感文本,其余標(biāo)記為中性情感文本(見圖2)。分析可見,中性情感最多,共4825條,占48.6%,其次是正向情感,共3143條,占31.6%,負(fù)向情感最少,共1963條,僅占19.8%。數(shù)據(jù)顯示大部分網(wǎng)民沒有過多地表達(dá)個(gè)人情感,對(duì)就醫(yī)體驗(yàn)話題的評(píng)論也較為理性。正向情感占比高于負(fù)向情感,表明網(wǎng)民就醫(yī)體驗(yàn)的滿意度較高,結(jié)合評(píng)論內(nèi)容可發(fā)現(xiàn)與醫(yī)療服務(wù)質(zhì)量高、醫(yī)療服務(wù)效果好等原因相關(guān),體現(xiàn)了改善醫(yī)療服務(wù)工作的顯著成效。負(fù)向情感文本里的關(guān)鍵詞主要包含表達(dá)自身消極情緒狀態(tài),如“擔(dān)心、緊張、壓抑”等和對(duì)就醫(yī)體驗(yàn)的負(fù)面評(píng)價(jià),如“無語、一塌糊涂、不好”等,側(cè)面反映目前看病難、看病貴、看病煩等問題仍然存在。
討論
以健康需求為關(guān)注點(diǎn),未來需要進(jìn)一步完善需求保障
研究分析可得患者就醫(yī)體驗(yàn)的變化,這些變化在某種程度上也反映了影響患者在就醫(yī)過程中的主要關(guān)注點(diǎn)。通過熱點(diǎn)圖譜可見患者的健康需求為主要影響因素?;颊邔?duì)各種醫(yī)療服務(wù)的需求是否被滿足與就醫(yī)體驗(yàn)正相關(guān),醫(yī)療衛(wèi)生等部門機(jī)構(gòu)未來應(yīng)落實(shí)“以患者為中心”的服務(wù)精神,將服務(wù)模式從“能提供什么”轉(zhuǎn)變?yōu)椤靶枰峁┦裁础?,提升服?wù)滿意度。
網(wǎng)民對(duì)就醫(yī)服務(wù)的情感價(jià)值存在提升空間,未來應(yīng)注重情感支持與人文關(guān)懷
情緒價(jià)值對(duì)網(wǎng)民就醫(yī)體驗(yàn)和就醫(yī)行為存在積極影響,當(dāng)接受醫(yī)療服務(wù)時(shí),患者期望獲得更好的情感體驗(yàn)也演化為健康需求的一部分,即不只是基于業(yè)務(wù)關(guān)系的醫(yī)患溝通,更多的是情感上的支持和關(guān)懷。未來應(yīng)更多地關(guān)注患者就醫(yī)過程中的情感體驗(yàn),予以更豐富的情感支持和人文關(guān)懷,從而提升患者的就醫(yī)體驗(yàn)。
堅(jiān)持落實(shí)分級(jí)診療制度,確保能最大限度利用有限的醫(yī)療資源
看病難,主要是因?yàn)殡y以享受優(yōu)質(zhì)的醫(yī)療資源,實(shí)施分級(jí)診療制度可以有效促進(jìn)醫(yī)療衛(wèi)生資源的合理配置、基本醫(yī)療衛(wèi)生服務(wù)公平化的關(guān)鍵舉措。未來應(yīng)在深化醫(yī)改的基礎(chǔ)上,明確各層次醫(yī)療機(jī)構(gòu)的職能定位,推進(jìn)不同級(jí)別機(jī)構(gòu)間的協(xié)同合作,促進(jìn)形成高效的分級(jí)診療模式。
搭建官方信息溝通平臺(tái)
做好官方微博等溝通渠道建設(shè),積極接受公眾網(wǎng)民的評(píng)論、建議,有利于及時(shí)掌握網(wǎng)絡(luò)輿情狀況,及時(shí)全面了解與醫(yī)療相關(guān)的新聞、熱點(diǎn)動(dòng)態(tài),有針對(duì)性、高效地把握處理網(wǎng)絡(luò)輿情的時(shí)機(jī),也可以為醫(yī)療機(jī)構(gòu)媒體宣傳提供幫助。
做好負(fù)面言論的處理工作
積極關(guān)注網(wǎng)民公眾的就醫(yī)需求和情感狀態(tài),結(jié)合微博等網(wǎng)絡(luò)平臺(tái),及時(shí)對(duì)負(fù)面消極評(píng)論進(jìn)行澄清回復(fù),對(duì)疑問咨詢細(xì)心解答,針對(duì)發(fā)布不良言論的用戶,采用教育警告等懲罰措施,阻止違法信息的進(jìn)一步傳播。
建立網(wǎng)絡(luò)輿情協(xié)調(diào)管理體系
網(wǎng)絡(luò)輿情的處理往往牽涉多方利益的部門系統(tǒng),由于信息溝通不充分、整體
規(guī)劃不合理等問題的出現(xiàn),可能會(huì)在處理過程中產(chǎn)生回避推卸責(zé)任,導(dǎo)致輿情處理不及時(shí)的后果。醫(yī)療機(jī)構(gòu)應(yīng)加強(qiáng)網(wǎng)絡(luò)輿情協(xié)調(diào)管理體系的建設(shè),全方位、科學(xué)合理整合規(guī)劃資源,使不同機(jī)關(guān)部門能夠各司其職、積極處理,體現(xiàn)統(tǒng)籌協(xié)調(diào)能力。
研究借助微博平臺(tái),搜集網(wǎng)民關(guān)于就醫(yī)體驗(yàn)的博文內(nèi)容,使用Tf—idf算法進(jìn)行特征降維,Snow NLP分析模塊進(jìn)行情感分析,繪制微博平臺(tái)用戶就醫(yī)體驗(yàn)熱點(diǎn)圖譜,分析用戶就醫(yī)關(guān)注點(diǎn)和情感體驗(yàn),為今后提升醫(yī)療機(jī)構(gòu)服務(wù)水平提供建議。研究發(fā)現(xiàn),網(wǎng)民就醫(yī)體驗(yàn)總體較好,患者的健康需求、推薦意愿、醫(yī)療服務(wù)質(zhì)量和服務(wù)便利可及性是主要的關(guān)注點(diǎn),看病難、看病貴、看病煩等問題仍是影響患者就醫(yī)體驗(yàn)的主要因素。未來應(yīng)進(jìn)一步完善需求保障,注重情感支持與人文關(guān)懷,堅(jiān)持推進(jìn)分級(jí)診療制度,提升民眾的就醫(yī)滿意度。此外,本文在研究過程中依然存在一定不足之處:研究僅針對(duì)微博用戶數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)來源渠道相對(duì)簡單;并且情感分析只是基于Python的第三方庫,數(shù)據(jù)處理過程也較為簡單。在未來將會(huì)基于更多平臺(tái),擴(kuò)大數(shù)據(jù)樣本的全面性,提高研究結(jié)果的科學(xué)性、準(zhǔn)確性。
參考文獻(xiàn):
[1]微博數(shù)據(jù)中心.2020年微博用戶發(fā)展報(bào)告[EB/OL].(2021-03- 12)https://data.weibo.com/report/reportDetail?i d=456.
[2]吳鵬,劉恒旺,沈思.基于深度學(xué)習(xí)和OCC情感規(guī)則的網(wǎng)絡(luò)輿情情感識(shí)別研究[J].情報(bào)學(xué)報(bào),2017,36(09):972—980.
[3]趙妍妍,秦兵,劉挺.文本情感分析[J].軟件學(xué)報(bào),2010.
[4]左芬.突發(fā)事件網(wǎng)絡(luò)輿情的負(fù)面效應(yīng)及其應(yīng)對(duì)研究[D].湖南師范大學(xué).
(作者單位:1.南京醫(yī)科大學(xué)醫(yī)政學(xué)院
2.南京醫(yī)科大學(xué)第一附屬醫(yī)院)