李進(jìn)華 張婷婷
〔摘 要〕[目的/意義]社會(huì)化問(wèn)答社區(qū)的投票機(jī)制有利于信息消費(fèi)者篩選高質(zhì)量回答。本文以用戶(hù)原創(chuàng)回答為研究對(duì)象,探討影響知識(shí)分享用戶(hù)感知有用性的影響因素。[方法/過(guò)程]以信息接受模型為基礎(chǔ),基于知乎社區(qū)71 495條回答,結(jié)合文本分析與負(fù)二項(xiàng)回歸分析方法,從回答特征、回答質(zhì)量和回答者特征3個(gè)方面探討知識(shí)分享有用性的影響因素。[結(jié)果/結(jié)論]研究結(jié)果表明,回答特征(及時(shí)性、圖片或引用)、回答質(zhì)量(答案中心度、情感支持)、回答者特征(社會(huì)網(wǎng)絡(luò)中心度、可信度)均對(duì)回答有用性投票具有正向影響?;卮鸬恼Z(yǔ)言多樣性對(duì)回答有用性投票具有負(fù)向影響。本研究通過(guò)實(shí)證進(jìn)行客觀分析,有利于促進(jìn)回答者貢獻(xiàn)高質(zhì)量回答并對(duì)社會(huì)化問(wèn)答社區(qū)進(jìn)行高質(zhì)量的信息服務(wù)提供可行性建議。
〔關(guān)鍵詞〕知識(shí)分享;用戶(hù)感知有用性;信息接受模型;知乎社區(qū)
DOI:10.3969/j.issn.1008-0821.2018.04.003
〔中圖分類(lèi)號(hào)〕C912.67;G203 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2018)04-0020-09
〔Abstract〕[Purpose/Signficance]The voting mechanism of social Q&A; community is helpful for information consumers to select high quality answers.This paper focused on the original knowledge sharing of users in social Q&A; community,and explored the factors that influence the user perceived usefulness of knowledge sharing.[Method/Process]Based on the information adoption model and 71495 answers in social Q&A; community,combining text analysis and negative binomial regression analysis,this paper discussed the influencing factors of knowledge sharing usefulness from three aspects of answer characteristics,answer quality and respondent characteristics.[Result/Conclusion]The results showed that the answer characteristics(timeliness,pictures or citations),answer quality(answer centrality,emotional support),respondent characteristics(social network centrality,credibility)had a positive impact on answer useful votes.However,the linguistic diversity of answers had a negative effect on answer useful votes.And this research promoted the sharers to contribute high quality knowledge sharing and provides feasible suggestions for high quality information service in social Q&A; community.
〔Key words〕knowledge sharing;user perceived usefulness;information acceptance model;zhihu community
社會(huì)化問(wèn)答平臺(tái)是一種基于社會(huì)網(wǎng)絡(luò)關(guān)系的問(wèn)答服務(wù)模式,其“關(guān)注”模塊將用戶(hù)、問(wèn)題、話題、回答等要素相互關(guān)聯(lián)起來(lái)構(gòu)建了龐大且多元化的知識(shí)網(wǎng)絡(luò)[1]。社會(huì)化問(wèn)答社區(qū)積極鼓勵(lì)和促進(jìn)社區(qū)用戶(hù)進(jìn)行知識(shí)的交換與流動(dòng),即回答者可以對(duì)同一問(wèn)題進(jìn)行全方位、多角度討論,為提問(wèn)者和瀏覽者提供不同的參考視角。而提問(wèn)者和瀏覽者則可以通過(guò)點(diǎn)贊、踩、評(píng)論等方式對(duì)回答進(jìn)行評(píng)價(jià)。社會(huì)化問(wèn)答社區(qū)中的信息是由用戶(hù)生成的,其信息生成速度之快、規(guī)模之大。社會(huì)化問(wèn)答平臺(tái)通常會(huì)通過(guò)回答的點(diǎn)贊數(shù)、反對(duì)數(shù)等指標(biāo)對(duì)知識(shí)分享進(jìn)行排序?yàn)橛脩?hù)篩選出高質(zhì)量回答,這在一定程度上減輕了因信息過(guò)載和認(rèn)知成本等原因給用戶(hù)帶來(lái)的信息壓力[2]。但在網(wǎng)絡(luò)環(huán)境下,由于“馬太效應(yīng)”的存在,社區(qū)意見(jiàn)領(lǐng)袖對(duì)問(wèn)題簡(jiǎn)單的點(diǎn)評(píng)可能會(huì)引來(lái)用戶(hù)高點(diǎn)贊數(shù),而普通用戶(hù)的回答則無(wú)法獲得足夠的投票,很多高質(zhì)量的回答會(huì)因此被湮沒(méi)。對(duì)于社會(huì)化問(wèn)答社區(qū)而言,為了自身的良性發(fā)展需要有效地管理社區(qū)中海量的提問(wèn)和回答并為社區(qū)用戶(hù)提供高質(zhì)量的信息服務(wù)以促進(jìn)知識(shí)的傳播。而知識(shí)分享者則需要了解影響信息消費(fèi)者對(duì)其知識(shí)分享感知有用性的影響因素以便更好地完善回答,提高自己在社區(qū)中的聲望和影響力,從而滿(mǎn)足自己被他人尊重、自我實(shí)現(xiàn)的需求[3]?;诖耍瑢?duì)社會(huì)化問(wèn)答知識(shí)分享用戶(hù)感知有用性的影響因素的研究具備深入探討的現(xiàn)實(shí)意義。知乎是國(guó)內(nèi)社會(huì)化問(wèn)答社區(qū)的典型代表。本文以知乎為研究對(duì)象,通過(guò)Python編寫(xiě)爬蟲(chóng)爬取知乎社區(qū)提問(wèn)回答界面的知識(shí)分享數(shù)據(jù),并以信息接受模型為理論基礎(chǔ),利用文本分析和負(fù)二項(xiàng)回歸模型對(duì)該研究問(wèn)題進(jìn)行實(shí)證分析。通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的討論,可促進(jìn)回答者貢獻(xiàn)高質(zhì)量回答并對(duì)社會(huì)化問(wèn)答社區(qū)進(jìn)行高質(zhì)量的信息服務(wù)提供可行性建議。
1 相關(guān)研究評(píng)述
1.1 知識(shí)分享用戶(hù)感知有用性
孫曉寧等[4]借助“百度知道”用戶(hù)對(duì)答案質(zhì)量感知的問(wèn)卷,綜合采用專(zhuān)家訪談、探索性因子分析和驗(yàn)證性因子分析的方法,構(gòu)建了社會(huì)化問(wèn)答系統(tǒng)答案質(zhì)量評(píng)價(jià)模型。Zhu等[5]結(jié)合專(zhuān)家咨詢(xún)、用戶(hù)調(diào)查和比較分析3種方法總結(jié)出質(zhì)量評(píng)估模型。John等[6]以雅虎回答為研究對(duì)象,運(yùn)用Logistic回歸分析方法構(gòu)建了包含社會(huì)特征、文本特征以及內(nèi)容評(píng)價(jià)特征為指標(biāo)的質(zhì)量框架,用以預(yù)測(cè)高質(zhì)量的回答。綜上所述,已有的研究大多集中在構(gòu)建知識(shí)分享質(zhì)量評(píng)價(jià)模型上。通過(guò)收集到的一手資料進(jìn)行探索性分析,試圖從新切入點(diǎn)提出新的評(píng)價(jià)指標(biāo)對(duì)已有評(píng)價(jià)體系進(jìn)行補(bǔ)充。也有研究通過(guò)搜集網(wǎng)站用戶(hù)行為數(shù)據(jù),構(gòu)建評(píng)價(jià)信息質(zhì)量的特征集,利用機(jī)器學(xué)習(xí)算法,訓(xùn)練自動(dòng)評(píng)價(jià)信息質(zhì)量的模型[7-9]。姜雯、許鑫[10]從國(guó)內(nèi)外的相關(guān)研究出發(fā),分別從人工評(píng)價(jià)和機(jī)器學(xué)習(xí)自動(dòng)化的角度對(duì)在線問(wèn)答社區(qū)信息質(zhì)量評(píng)價(jià)的影響因素進(jìn)行了研究綜述?;诖?,本文在前述研究基礎(chǔ)之上,針對(duì)知乎社會(huì)化的特點(diǎn),提煉知識(shí)分享用戶(hù)感知有用性的影響因素作為理論模型的假設(shè)條件,力圖豐富社會(huì)化問(wèn)答社區(qū)知識(shí)分享相關(guān)方面的理論研究。
1.2 信息接受模型
信息接受模型(Information Adoption Model)是Sussman和Siegal[11]在技術(shù)接受模型(TAM)的基礎(chǔ)之上根據(jù)精細(xì)加工可能性理論(ELM)[12]提出的。精細(xì)加工可能性理論將信息的說(shuō)服過(guò)程分為兩部分:中心路徑和邊緣路徑。中心路徑把個(gè)體態(tài)度的改變看做是個(gè)體認(rèn)真思考和綜合信息的結(jié)果,邊緣路徑是指?jìng)€(gè)體對(duì)客體態(tài)度的改變是根據(jù)信息的某些關(guān)聯(lián)線索決定的。如圖1所示,信息接受模型表明影響用戶(hù)感知信息有用性的因素為信息內(nèi)容質(zhì)量和信息源可靠性,其中信息內(nèi)容質(zhì)量是中心路徑,信息源可靠性是邊緣路徑。
對(duì)于社會(huì)化問(wèn)答社區(qū)而言,信息質(zhì)量表現(xiàn)為用戶(hù)的知識(shí)分享質(zhì)量。信息質(zhì)量的判斷受主觀和環(huán)境的影響,但信息內(nèi)容作為一種客觀的存在,對(duì)其效用的評(píng)價(jià)也是客觀的。因此,信息質(zhì)量是可測(cè)量的[13]。Kim等[14-15]從內(nèi)容、認(rèn)知、社會(huì)情感、參考資源和效用等角度衡量信息質(zhì)量。本研究從語(yǔ)法和語(yǔ)義兩個(gè)層面對(duì)回答數(shù)據(jù)進(jìn)行文本分析以衡量回答的質(zhì)量。信息源可靠性是指知識(shí)分享者被用戶(hù)認(rèn)為是可相信的、有能力的、值得信賴(lài)的程度[16]。社會(huì)化問(wèn)答社區(qū)中的信息具有不對(duì)稱(chēng)性,用戶(hù)不會(huì)完全、真實(shí)地揭示自身信息。因此,用戶(hù)無(wú)法對(duì)其現(xiàn)實(shí)身份進(jìn)行識(shí)別進(jìn)而評(píng)價(jià)其可靠性。知乎為每位用戶(hù)設(shè)置了個(gè)人主頁(yè),我們可以通過(guò)用戶(hù)回答的數(shù)量、質(zhì)量、獲得的點(diǎn)贊數(shù)來(lái)判定其知識(shí)水平和影響力。感知有用性在不同場(chǎng)景下,其含義有所不同。本文將知識(shí)分享有用性定義為社會(huì)化問(wèn)答社區(qū)用戶(hù)感知知識(shí)分享對(duì)其知識(shí)搜索的有用程度。知乎社區(qū)針對(duì)知識(shí)分享進(jìn)行了有用性設(shè)置,比如投票機(jī)制,可以通過(guò)贊同數(shù)量對(duì)知識(shí)分享的有用性進(jìn)行測(cè)量。在社會(huì)化問(wèn)答社區(qū)中,信息采納是主體有目的地選擇、評(píng)價(jià)、接受和利用信息的過(guò)程,并且該過(guò)程最終會(huì)影響主體的后續(xù)行為[17]。相比于傳統(tǒng)問(wèn)答平臺(tái)(如百度知道)設(shè)置答案采納的功能,社會(huì)化問(wèn)答社區(qū)中的信息采納是一種隱式行為。
2 研究模型和假設(shè)
結(jié)合本研究的情景,本文以信息接受模型為基礎(chǔ),研究社會(huì)化問(wèn)答知識(shí)分享用戶(hù)感知有用性的影響因素。本研究的模型如圖2所示。
2.1 回答特征
2.1.1 外部引用數(shù)量
外部引用是指回答者在回答問(wèn)題時(shí),在文本中添加的外部鏈接、圖片或圖表。一方面,回答者在闡述自身觀點(diǎn)
時(shí),引用外部參考文獻(xiàn)來(lái)證明其正確性和可信度,這有助于提高瀏覽者對(duì)其分享的認(rèn)同度。另一方面,圖片或圖表將復(fù)雜的語(yǔ)言論述簡(jiǎn)化,使用文本和外部引用相結(jié)合的方式便于瀏覽者理解。Tian等[18]、Shah等[19]均將是否有外部鏈接、圖片或引用等指標(biāo)納入機(jī)器學(xué)習(xí)自動(dòng)化評(píng)價(jià)問(wèn)答社區(qū)答案質(zhì)量的研究體系,因此本文提出如下假設(shè):
H1:回答引用數(shù)量與知識(shí)分享用戶(hù)感知有用性之間正向相關(guān)。
2.1.2 回答及時(shí)性
回答及時(shí)性是指回答發(fā)布與提問(wèn)之間的間隔時(shí)間,間隔越小表示其知識(shí)分享越及時(shí)。蔣楠等[20]認(rèn)為在社會(huì)化問(wèn)答服務(wù)平臺(tái)中,及時(shí)性是提問(wèn)者做出滿(mǎn)意答案判定的指標(biāo)之一。在社會(huì)化問(wèn)答平臺(tái)中,知識(shí)分享具有時(shí)效性。隨著時(shí)間的推移,問(wèn)題和話題的熱度會(huì)逐漸消退[21]。因此,回答發(fā)布的時(shí)間越早,相比于同問(wèn)題下發(fā)布時(shí)間較晚的回答具有更大的曝光度,更有可能獲得更多的點(diǎn)贊數(shù)。因此本文提出如下假設(shè):
H2:回答及時(shí)性與知識(shí)分享用戶(hù)感知有用性之間負(fù)向相關(guān)。
2.2 回答質(zhì)量
2.2.1 回答中心度
回答中心度是指一個(gè)問(wèn)題下,某回答處于所有回答中心的程度,中心度越高,則該回答為問(wèn)題答案的可能性越大[22]。金家華[23]認(rèn)為回答文本的中心度是評(píng)價(jià)信息質(zhì)量的重要指標(biāo),且文本中心度正向影響用戶(hù)的信息采納行為。知乎的一個(gè)問(wèn)題下會(huì)有多個(gè)回答者提供不同的回答。用戶(hù)在瀏覽眾多回答時(shí),如果某回答較其他回答的中心度越高,用戶(hù)認(rèn)為該回答有用性越高。因此文本提出如下假設(shè):
H3:回答中心度與知識(shí)分享用戶(hù)感知有用性之間正向相關(guān)。
2.2.2 情感支持
Hwang等[24]認(rèn)為患者在醫(yī)療社區(qū)中只能通過(guò)文字信息進(jìn)行互動(dòng),因此在線醫(yī)療社區(qū)為患者提供了兩種社會(huì)支持即信息支持和情感支持。在此基礎(chǔ)上,金家華[23]的研究發(fā)現(xiàn)情感支持對(duì)用戶(hù)信息采納有正向影響。Joyce等[25]的研究發(fā)現(xiàn),帶有正面情感的信息有助于增強(qiáng)用戶(hù)的認(rèn)同。知乎的關(guān)注功能將關(guān)心同樣或類(lèi)似問(wèn)題的人聚集在一起進(jìn)行交流,相互幫助,這在一定程度上體現(xiàn)了情感支持。因此本文提出如下假設(shè):
H4:情感支持與知識(shí)分享用戶(hù)感知有用性之間正向相關(guān)。
2.2.3 語(yǔ)言多樣性
以往的研究認(rèn)為,語(yǔ)言貧瘠會(huì)負(fù)向影響聽(tīng)者對(duì)說(shuō)話者的語(yǔ)言、知識(shí)、溝通能力甚至其情緒狀態(tài)和社會(huì)地位的判斷。在虛擬社區(qū)中,具有良好的書(shū)面格式和語(yǔ)言的多樣性的回答能提高回答者的可信度[26]。在社會(huì)化問(wèn)答社區(qū)中,回答者的語(yǔ)言風(fēng)格在很大程度上影響其發(fā)布信息的認(rèn)同度。語(yǔ)言多樣的回答往往比乏味重復(fù)的回答更具有說(shuō)服力。乏味無(wú)力的語(yǔ)言往往會(huì)負(fù)面影響瀏覽者對(duì)回答的感知[27]。因此本文提出如下假設(shè):
H5:語(yǔ)言多樣性與知識(shí)分享用戶(hù)感知有用性之間正向相關(guān)。
2.3 回答者特征
2.3.1 回答者中心度
社會(huì)化問(wèn)答社區(qū)不同于傳統(tǒng)問(wèn)答社區(qū)之處在于其構(gòu)建了用戶(hù)之間的社會(huì)網(wǎng)絡(luò)關(guān)系。社會(huì)網(wǎng)絡(luò)中心度是衡量個(gè)體在社會(huì)網(wǎng)絡(luò)中影響力的重要指標(biāo),并在一定程度上反映了個(gè)人的社會(huì)資本[28]。相關(guān)研究表明,個(gè)體節(jié)點(diǎn)的網(wǎng)絡(luò)中心度與其信任感之間具有相當(dāng)強(qiáng)的正向相關(guān)性,這也是高中心度節(jié)點(diǎn)社會(huì)資本的一種體現(xiàn)[29]。社會(huì)網(wǎng)絡(luò)中心度分為點(diǎn)入度和點(diǎn)出度。殷國(guó)鵬[30]的研究發(fā)現(xiàn)評(píng)論者內(nèi)向、外向中心度會(huì)直接影響其發(fā)表評(píng)論所獲的有用性評(píng)價(jià)。同樣地,知乎社區(qū)也提供了關(guān)注功能,將人與人組織起來(lái)形成龐大的人際網(wǎng)絡(luò)。因此本文提出如下假設(shè):
H6.1:回答者的內(nèi)向網(wǎng)絡(luò)中心度與知識(shí)分享用戶(hù)感知有用性之間正向相關(guān);
H6.2:回答者的外向網(wǎng)絡(luò)中心度與知識(shí)分享用戶(hù)感知有用性之間正向相關(guān)。
2.3.2 回答者可信度
回答者的可信度是其在社會(huì)網(wǎng)絡(luò)中建立信任和增加影響力的重要因素[27]。回答者的可信度一方面可以通過(guò)用戶(hù)的身份背景來(lái)確認(rèn);另一方面也可以通過(guò)用戶(hù)的知識(shí)分享專(zhuān)業(yè)性來(lái)判斷。知乎社區(qū)提供的投票機(jī)制和聲望體系在一定程度上為識(shí)別回答者的可信度提供了參考。Grewal等[31]的研究表明當(dāng)信息源可信性比較低時(shí)信息接受程度較低。Lim等[32]認(rèn)為信息源可信性同樣可以被應(yīng)用到在線環(huán)境中。在社會(huì)化問(wèn)答社區(qū)中,回答者的可信度越高,瀏覽者認(rèn)為其回答有用的可能性越大。因此本文提出如下假設(shè):
H7:回者的可信度與知識(shí)分享用戶(hù)感知有用性之間正相關(guān)。
3 研究設(shè)計(jì)
3.1 數(shù)據(jù)收集
本研究使用Python編寫(xiě)爬蟲(chóng),以知乎首頁(yè)熱門(mén)收藏夾為爬取入口,共爬取了知乎平臺(tái)上2 103個(gè)問(wèn)題下共97 750條回答數(shù)據(jù)及其相關(guān)信息。每條記錄包括回答內(nèi)容、回答發(fā)布時(shí)間、回答者昵稱(chēng)、回答者所獲贊同數(shù)、回答者回答問(wèn)題數(shù)、回答者被關(guān)注數(shù)、回答者關(guān)注他人數(shù)、回答所對(duì)應(yīng)的題目、問(wèn)題發(fā)布時(shí)間等指標(biāo)。并編寫(xiě)Python程序?qū)?shù)據(jù)進(jìn)行清洗,將回答者回答問(wèn)題數(shù)為0、回答者所獲總點(diǎn)贊數(shù)小于回答者回答問(wèn)題所獲點(diǎn)贊數(shù)等錯(cuò)誤、不一致數(shù)據(jù)刪除。由于本研究涉及對(duì)答案內(nèi)部特征的文本分析,因此將回答長(zhǎng)度(中英文及數(shù)字)小于10的樣本數(shù)據(jù)刪除,實(shí)際用于實(shí)證分析的數(shù)據(jù)共71 495條。
3.2 變量測(cè)量
為了驗(yàn)證本研究所提假設(shè),設(shè)計(jì)了如表1所示的變量。其中因變量為用戶(hù)感知回答有用性點(diǎn)贊數(shù)。自變量包括回答特征、回答質(zhì)量以及回答者特征共3個(gè)部分。
3.2.1 回答特征
回答特征包括回答引用數(shù)(ansCita)和回答及時(shí)性(ansTime)兩個(gè)變量。其中回答引用數(shù)使用回答中包含的外部鏈接數(shù)量和圖片數(shù)量之和衡量。回答及時(shí)性使用回答發(fā)布與提問(wèn)之間的間隔天數(shù)衡量。
3.2.2 回答質(zhì)量
3.2.3 回答者特征
回答者特征包括內(nèi)向網(wǎng)絡(luò)中心度(inNetCen)、外向網(wǎng)絡(luò)中心度(outNetCen)和可信度(reliability)。其中內(nèi)向網(wǎng)絡(luò)中心度使用回答者被他人關(guān)注的數(shù)量衡量。外向網(wǎng)絡(luò)中心度使用回答者關(guān)注他人的數(shù)量衡量。本研究使用回答者所獲點(diǎn)贊數(shù)量與回答數(shù)量之比來(lái)衡量回答者的可信度,見(jiàn)公式(9)。
3.3 分析方法
為了研究回答特征、回答質(zhì)量和回答者特征對(duì)回答用戶(hù)感知有用性的影響,本文構(gòu)建如下模型:
本研究的因變量為用戶(hù)的回答在某段時(shí)間內(nèi)所獲得的點(diǎn)贊數(shù),是一個(gè)非負(fù)的整數(shù),因此不滿(mǎn)足線性回歸因變量為連續(xù)分布的假設(shè)。由于該變量具有獨(dú)立且非負(fù)的性質(zhì),適用于計(jì)數(shù)回歸模型的假設(shè)條件。泊松回歸和負(fù)二項(xiàng)回歸被廣泛應(yīng)用于此類(lèi)問(wèn)題中。其中泊松回歸的前提假設(shè)是樣本的均值和方差相等,而負(fù)二項(xiàng)回歸則用于方差與均值不等的情況,由于本研究因變量的方差遠(yuǎn)遠(yuǎn)大于均值,數(shù)據(jù)過(guò)度離散,此種情況下采用泊松回歸模型擬合效果不理想,因而采用負(fù)二項(xiàng)回歸模型[33]。負(fù)二項(xiàng)回歸的概率密度函數(shù)為:
4 數(shù)據(jù)分析與結(jié)果
4.1 描述性統(tǒng)計(jì)分析
數(shù)據(jù)樣本的描述性統(tǒng)計(jì)詳如表2所示,回答有用性數(shù)據(jù)分布分散,對(duì)其進(jìn)行頻數(shù)統(tǒng)計(jì)發(fā)現(xiàn)其呈現(xiàn)右偏分布(偏度為17.15)。自變量的分布也較為分散。其中回答內(nèi)容中引用數(shù)量均值為2個(gè)左右,說(shuō)明絕大部分回答者習(xí)慣于純文字表達(dá)自己的觀點(diǎn),很少使用超鏈接或圖片;回答者的內(nèi)向網(wǎng)絡(luò)中心度均值約為12 648,外向網(wǎng)絡(luò)中心度的均值約為182,回答者的內(nèi)向中心度要遠(yuǎn)遠(yuǎn)高于外向中心度。說(shuō)明在知乎社區(qū)中,擁有大量“粉絲”數(shù)的用戶(hù)是知識(shí)分享的活躍用戶(hù)。
各自變量間的相關(guān)系數(shù)如表3所示,變量lingDiv和ansCen相關(guān)系數(shù)絕對(duì)值達(dá)到了0.53,其余自變量間的相關(guān)系數(shù)絕對(duì)值約小于等于0.3。為了進(jìn)一步驗(yàn)證自變量間是否存在共線性的問(wèn)題,本研究繼續(xù)對(duì)相關(guān)系數(shù)矩陣進(jìn)行秩計(jì)算,計(jì)算結(jié)果秩為8,說(shuō)明該相關(guān)系數(shù)矩陣為滿(mǎn)秩矩陣,自變量之間不存在嚴(yán)重的共線性問(wèn)題[34]。
4.2 回歸分析結(jié)果與討論
為了更好地體現(xiàn)回答特征、回答質(zhì)量以及回答者特征變量對(duì)回答感知有用性的影響,本研究共構(gòu)建了3個(gè)模型。其中模型1只包含回答特征變量的負(fù)二項(xiàng)回歸模型,模型2包含回答特征和回答質(zhì)量變量的負(fù)二項(xiàng)回歸模型,模型3是全模型。模型回歸結(jié)果如表4所示,發(fā)現(xiàn)模型3的對(duì)數(shù)似然值的絕對(duì)值比模型1和模型2都要小,表明加入回答
質(zhì)量和回答者特征變量提高了模型的擬合優(yōu)度。模型3相對(duì)于模型2的對(duì)數(shù)似然值的絕對(duì)值減小更明顯,說(shuō)明在社會(huì)化問(wèn)答社區(qū)中,用戶(hù)對(duì)回答感知有用性的影響因素主要來(lái)源于信息接受模型的邊緣路徑——回答者特征。此外,本研究將模型3的所有變量分別進(jìn)行了負(fù)二項(xiàng)回歸分析和泊松回歸分析,并對(duì)分析結(jié)果進(jìn)行了AIC、BIC模型擬合優(yōu)度檢驗(yàn)如表5所示。檢驗(yàn)結(jié)果表明本研究采用的負(fù)二項(xiàng)回歸模型比泊松回歸模型擬合效果更好。
4.2.1 回答特征
回答引用數(shù)量(ansCita)的系數(shù)為正且P值顯著(P<0.001),表明回答引用數(shù)量對(duì)用戶(hù)感知回答有用性有正向影響,H1假設(shè)得到支持。在回答中添加引用使得內(nèi)容更具有說(shuō)服力,外部鏈接給瀏覽者提供了了解知識(shí)的其他途徑;文字與圖、表相結(jié)合的表達(dá)方式更加吸引瀏覽者進(jìn)行深入閱讀。這從側(cè)面也反映回答者在回答問(wèn)題過(guò)程中端正、嚴(yán)謹(jǐn)?shù)膽B(tài)度。因此回答的引用數(shù)量越多,回答被他人感知有用的可能性越大?;卮鸺皶r(shí)性(ansTime)的系數(shù)為負(fù)且P值顯著(P<0.001),表明回答及時(shí)性對(duì)用戶(hù)感知回答有用性有負(fù)向影響,H2假設(shè)得到支持。問(wèn)題與回答均具有時(shí)效性。問(wèn)題在提出一段時(shí)間內(nèi)會(huì)有較大的瀏覽量和關(guān)注度,吸引更多的用戶(hù)加入討論,此時(shí)回答更容易被其他用戶(hù)所關(guān)注,進(jìn)而加大回答被認(rèn)同的可能性。因此回答發(fā)布的時(shí)間越早,相比于同問(wèn)題下發(fā)布時(shí)間較晚的回答具有更大的曝光度,更有可能獲得更多的點(diǎn)贊數(shù)。
4.2.2 回答質(zhì)量
回答中心度(ansCen)系數(shù)為正且P值顯著(P<0.001),表明回答中心度對(duì)用戶(hù)感知回答有用性有正向影響,H3假設(shè)得到支持。某一問(wèn)題下,回答者各抒己見(jiàn),發(fā)表自己的看法。如果某回答的中心度越大,說(shuō)明該回答處于所有回答的中心位置,那么該回答被其他用戶(hù)認(rèn)可的可能性越大。情感支持(emSup)系數(shù)為正且P值顯著(P<0.001),H4假設(shè)得到支持。回答者在回答問(wèn)題時(shí)不僅針對(duì)問(wèn)題給出自己專(zhuān)業(yè)客觀的解答,還會(huì)帶有個(gè)人主觀的情感色彩。贊美、肯定、鼓勵(lì)等正面情感的表露不僅會(huì)增加瀏覽者對(duì)該回答的認(rèn)同;還營(yíng)造了良好的社區(qū)知識(shí)分享氛圍,鼓勵(lì)更多人在社區(qū)中進(jìn)行提問(wèn)和回答。因此,情感支持對(duì)用戶(hù)感知回答的有用性具有正向影響。
語(yǔ)言多樣性(lingDiv)系數(shù)為負(fù)且P值顯著(P<0.001),表明語(yǔ)言多樣性對(duì)用戶(hù)感知回答有用性有負(fù)向影響,與假設(shè)H5相悖,假設(shè)H5沒(méi)有得到支持。語(yǔ)言多樣性是回答者回答問(wèn)題時(shí)的語(yǔ)言表現(xiàn)力。用戶(hù)在問(wèn)答社區(qū)中進(jìn)行信息搜尋時(shí),有可能更關(guān)注于回答是否滿(mǎn)足了自身的信息需求。如果回答對(duì)用戶(hù)解決自身問(wèn)題沒(méi)有幫助,即使回答本身論述精彩,用戶(hù)也不會(huì)認(rèn)同其有用性。此外,施國(guó)良等[35]研究發(fā)現(xiàn)知乎回答長(zhǎng)度與回答有用性之間正相關(guān),本研究也利用樣本數(shù)據(jù)進(jìn)一步探究了文本長(zhǎng)度與回答有用性之間的關(guān)系。如表6所示,回答長(zhǎng)度正向影響回答有用性。本研究還初步探究了語(yǔ)言多樣性與回答長(zhǎng)度之間的關(guān)系。如圖3所示,當(dāng)回答長(zhǎng)度較短(小于500字)時(shí),語(yǔ)言多樣性從0.4~1.0的連續(xù)分布,這可能由于回答長(zhǎng)度較短,語(yǔ)言多樣性隨機(jī)性較大造成的。當(dāng)回答長(zhǎng)度逐漸增長(zhǎng)(500~6 500字)時(shí),語(yǔ)言多樣性呈現(xiàn)從0.4到某一具體值(小于1.0)的連續(xù)分布,且該具體值與回答長(zhǎng)度成反比關(guān)系。當(dāng)回答長(zhǎng)度較長(zhǎng)(大于6 500字)時(shí),回答語(yǔ)言多樣性趨于穩(wěn)定,分布在0.4數(shù)值附近。因此,隨著回答長(zhǎng)度的增長(zhǎng),回答的平均語(yǔ)言多樣性降低且最終趨于平穩(wěn)。回答長(zhǎng)度越長(zhǎng)意味著回答所包含的信息量越多,回答越容易得到用戶(hù)的認(rèn)同。同時(shí)回答越長(zhǎng),回答的語(yǔ)言多樣性會(huì)降低。因此,回答的語(yǔ)言多樣性可能負(fù)向影響回答有用性。
4.2.3 回答者特征
回答者內(nèi)向網(wǎng)絡(luò)中心度(inNetCen)的系數(shù)為正且P值顯著(P<0.001),表明回答者內(nèi)向網(wǎng)絡(luò)中心度對(duì)用戶(hù)感知回答有用性有正向影響,H6.1假設(shè)得到支持?;卮鹫咄庀蚓W(wǎng)絡(luò)中心度(outNetCen)的系數(shù)為正且P值顯著(P<0.001),表明回答者外向網(wǎng)絡(luò)中心度對(duì)用戶(hù)感知回答有用性有正向影響,H6.2假設(shè)得到支持。其中內(nèi)向網(wǎng)絡(luò)中心度反映個(gè)體被其他節(jié)點(diǎn)個(gè)體傳播的能力,而外向網(wǎng)絡(luò)中心度反映個(gè)體傳播其他節(jié)點(diǎn)個(gè)體的能力[36]。網(wǎng)絡(luò)中心度是衡量個(gè)體在社會(huì)網(wǎng)絡(luò)中影響力的關(guān)鍵指標(biāo),本研究很好地將社會(huì)網(wǎng)絡(luò)理論使用在社會(huì)化問(wèn)答社區(qū)的研究中。知乎社區(qū)提供關(guān)注功能將具有共同興趣愛(ài)好、共同價(jià)值觀的用戶(hù)緊密地聯(lián)系在一起,促使用戶(hù)之間建立起信任關(guān)系。用戶(hù)對(duì)其所關(guān)注回答者的回答相較于其未關(guān)注回答者的回答具有更強(qiáng)烈的認(rèn)同感。因此,回答者的中心度越大,回答者的影響力就越大,用戶(hù)感知其回答有用性越大?;卮鹫呖尚哦龋╮eliability)的系數(shù)為正且P值顯著(P<0.001),表明回答者可信度對(duì)用戶(hù)感知回答有用性有正向影響,H7假設(shè)得到支持。可信度是對(duì)回答者歷史回答質(zhì)量的衡量。在虛擬社區(qū)中,用戶(hù)往往無(wú)法得知回答者的真實(shí)身份信息,即使知乎提供了用戶(hù)自我介紹信息,其真實(shí)性也無(wú)從考量。用戶(hù)只能通過(guò)回答者歷史回答數(shù)量、其所獲點(diǎn)贊數(shù)等信息對(duì)其專(zhuān)業(yè)性、可信度進(jìn)行感知。當(dāng)用戶(hù)感知該回答者是可信的,往往會(huì)增加對(duì)回答者的認(rèn)同感。因此回答者可信度越高,用戶(hù)感知其回答有用性可能越大。
對(duì)本研究假設(shè)及驗(yàn)證結(jié)果總結(jié)如表7所示。
5 結(jié) 論
本研究以信息接受模型為理論基礎(chǔ),從回答特征、回答質(zhì)量和回答者特征3個(gè)方面對(duì)社會(huì)化問(wèn)答社區(qū)知識(shí)分享用戶(hù)感知有用性進(jìn)行研究,并以知乎71 495條回答作為研究對(duì)象,利用負(fù)二項(xiàng)回歸模型進(jìn)行分析。分析結(jié)果表明,回答者的特征對(duì)用戶(hù)感知回答有用性的影響要大于回答質(zhì)量和回答特征?;卮鹫咴谏鐓^(qū)中的社會(huì)網(wǎng)絡(luò)關(guān)系,回答者的專(zhuān)業(yè)性、可信度積極影響用戶(hù)對(duì)其回答有用性的感知?;卮鸬募皶r(shí)性和回答的表現(xiàn)方式(圖文結(jié)合)等特征也積極地影響用戶(hù)對(duì)其回答有用性的感知。同時(shí),回答多以積極向上、正面情感的語(yǔ)言表達(dá)更容易獲得用戶(hù)對(duì)回答的認(rèn)可。一個(gè)問(wèn)題下,回答處于所有回答的中心位置,回答越容易獲得用戶(hù)的點(diǎn)贊?;卮鸬恼Z(yǔ)言多樣性對(duì)回答有用性有負(fù)向影響,回答長(zhǎng)度對(duì)其有正向影響。隨著回答長(zhǎng)度的增加,其語(yǔ)言多樣性分布范圍縮小趨于定值。
本研究結(jié)論豐富了社會(huì)化問(wèn)答社區(qū)知識(shí)分享相關(guān)方面的理論研究,為在線社區(qū)管理者與用戶(hù)具有借鑒作用,具體如下:
1)在回答界面應(yīng)完善回答者的曝光度。目前來(lái)看,知乎的回答界面只顯示了回答者的昵稱(chēng),個(gè)人簡(jiǎn)介以及回答數(shù)、文章數(shù)、關(guān)注者數(shù)。一般情況下,用戶(hù)在瀏覽問(wèn)題界面時(shí)不太會(huì)點(diǎn)開(kāi)回答者頭像跳轉(zhuǎn)到其個(gè)人主頁(yè)界面。為解決這個(gè)問(wèn)題,本文建議將用戶(hù)個(gè)人成就數(shù)據(jù)顯示出來(lái),以增加瀏覽者對(duì)回答者的了解程度。
2)完善回答排序和回答折疊算法,將回答外部特征、回答內(nèi)部特征和回答者特征等指標(biāo)納入到算法中,對(duì)其進(jìn)行優(yōu)化。從而能夠提供更科學(xué)地回答排序,為提問(wèn)者提供更精準(zhǔn)的信息搜尋。
3)用戶(hù)在為提問(wèn)者解決問(wèn)題時(shí),不僅要保證回答的正確性,還要使用通俗易懂,簡(jiǎn)單明了的方式表達(dá)自己的觀點(diǎn)。同時(shí)要給予提問(wèn)者關(guān)懷和鼓勵(lì),為提問(wèn)者提供信息支持的同時(shí)給予情感支持。
本研究未來(lái)將側(cè)重解決如下問(wèn)題:由于本研究數(shù)據(jù)采集入口為知乎首頁(yè)熱門(mén)收藏夾下的問(wèn)題及其回答,因此收集到的回答基本都有點(diǎn)贊數(shù)。在知乎社區(qū)中存在著大量0點(diǎn)贊數(shù)的回答,這些回答并不是沒(méi)有價(jià)值的。因此下一步可以將0點(diǎn)贊數(shù)的回答加入到數(shù)據(jù)分析樣本集,進(jìn)行更加系統(tǒng)和完整的研究。
參考文獻(xiàn)
[1]張煜軒.基于外部線索的社會(huì)化問(wèn)答平臺(tái)答案信息質(zhì)量感知研究[D].武漢:華中師范大學(xué),2016.
[2]Cao Qing,Duan Wenjing,Gan Qiwei.Exploring Determinants of Voting for the“Helpfulness”of Online User Reviews:A Text Mining Approach[J].Decision Support Systems,2011,50(2):511-521.
[3]寧菁菁.知乎網(wǎng)用戶(hù)知識(shí)共享研究[D].北京:北京郵電大學(xué),2014.
[4]孫曉寧,趙宇翔,朱慶華.基于SQA系統(tǒng)的社會(huì)化搜索答案質(zhì)量評(píng)價(jià)指標(biāo)構(gòu)建[J].中國(guó)圖書(shū)館學(xué)報(bào),2015,41(4):65-82.
[5]Zhu Zhemin,Bernhard D,Gurevych I.A Multi-Dimensional Model for Assessing the Quality of Answers in Social Q&A; Sites[EB/OL].http://tuprints.ulb.tu-darmstadt.de/1940/1/TR_dimension_model.pdf,2017-07-20.
[6]John B M,Chua A Y K,Goh D H L.What Makes a High-Quality User-Generated Answer?[J].IEEE Internet Computing,2011,15(1):66-71.
[7]Arai K,Handayani A N.Predicting Quality of Answer in Collaborative Q&A; Community[J].International Journal of Advanced Research in Artificial Intelligence,2013,2(3):21-25.
[8]孔維澤,劉奕群,張敏,等.問(wèn)答社區(qū)中回答質(zhì)量的評(píng)價(jià)方法研究[J].中文信息學(xué)報(bào),2011,25(1):3-8.
[9]來(lái)社安,蔡中民.基于相似度的問(wèn)答社區(qū)問(wèn)答質(zhì)量評(píng)價(jià)方法[J].計(jì)算機(jī)應(yīng)用與軟件,2013,30(2):266-269.
[10]姜雯,許鑫.在線問(wèn)答社區(qū)信息質(zhì)量評(píng)價(jià)研究綜述[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2014,(6):41-50.
[11]Sussman S W,Siegal W S.Informational Influence in Organizations:An Integrated Approach to Knowledge Adoption[J],Information Systems Research,2003,14(1):47-65.
[12]Petty R E,Cacioppo J T.The Elaboration Likelihood Model of Persuasion[J].Advances in Experimental Social Psychology,1986,19:123-205.
[13]李晶,漆賢軍,陳明紅.信息質(zhì)量感知對(duì)信息獲取與信息采納的影響研究[J].情報(bào)科學(xué),2015,33(3):123-129.
[14]Kim S,Oh J S,Oh S.Best-Answer Selection Criteria in a Social Q&A; Site from the User-Oriented Relevance Perspective[C].In:Proceedings of the 70th Annual Meeting of American Society for Information Science and Technology(ASIST),2007,44(1):1-15.
[15]Kim S,Oh S.Users Relevance Criteria for Evaluating Answers in a Social Q&A; Site[J].Journal of the American Society for Information Science & Technology,2009,60(4):716-727.
[16]Petty R E,Cacioppo J T.Communication and Persuasion:Central and Peripheral Routes to Attitude Change[M].Springer,1986.
[17]宋雪雁,王萍.信息采納行為概念及影響因素研究[J].情報(bào)科學(xué),2010,28(5):760-762,767.
[18]Tian Q,Zhang P,Li B.Towards Predicting the Best Answers in Community-Based Question-Answering Services[C].In:Proceedings of the 7th International AAAI Conference on Weblogs and Social Media,2013.
[19]Shah C,Pomerantz J.Evaluating and Predicting Answer Quality in Community Q&A;[C].In:Proceedings of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM,2010:411-418.
[20]蔣楠,王鵬程.社會(huì)化問(wèn)答服務(wù)中用戶(hù)需求與信息內(nèi)容的相關(guān)性評(píng)價(jià)研究——以“百度知道”為例[J].信息資源管理學(xué)報(bào),2012,2(3):35-45.
[21]李綱,陳璟浩.突發(fā)事件情境下網(wǎng)絡(luò)問(wèn)答社區(qū)用戶(hù)構(gòu)成和行為分析——基于問(wèn)題膠囊事件的實(shí)證研究[J].圖書(shū)情報(bào)工作,2013,57(24):95-100.
[22]Radev D R,Jing H,Stys' M,et al.Centroid-Based Summarization of Multiple Documents[J].Information Processing & Management,2004,40(6):919-938.
[23]金家華.社會(huì)化問(wèn)答社區(qū)中用戶(hù)知識(shí)行為的影響因素研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2015.
[24]Hwang K O,Ottenbacher A J,Green A P,et al.Social Support in an Internet Weight Loss Community[J].International Journal of Medical Informatics,2010,79(1):5-13.
[25]Joyce E,Kraut R.Predicting Continued Participation in Newsgroups[J].Journal of Computer-Mediated Communication,2006,11(3),723-747.
[26]Huffaker D.Dimensions of Leadership and Social Influence in Online Communities[J].Human Communication Research,2010,36:593-617.
[27]王秀麗.網(wǎng)絡(luò)社區(qū)意見(jiàn)領(lǐng)袖影響機(jī)制研究——以社會(huì)化問(wèn)答社區(qū)“知乎”為例[J].國(guó)際新聞界,2014,36(9):47-57.
[28]張榮華.知識(shí)問(wèn)答社區(qū)用戶(hù)的知識(shí)共享意愿研究[D].南京:南京大學(xué),2014.
[29]Wang G,Liu X,F(xiàn)an W G.A Knowledge Adoption Model Based Framework for Finding Helpful User-Generated Contents in Online Communities[C].In:Proceedings of the 32th International Conference on Information Systems,2011,Shanghai,China.
[30]殷國(guó)鵬.消費(fèi)者認(rèn)為怎樣的在線評(píng)論更有用?——社會(huì)性因素的影響效應(yīng)[J].管理世界,2012,(12):115-124.
[31]Grewal D,Gotlieb J,Marmorstein H.The Moderating Effects of Message Framing and Source Credibility on the Price-Perceived Risk Relationship[J].Journal of Consumer Research,1994,21(1):145-153.
[32]Lim K H,Sia C L,Lee M K.O,et al.How do I Trust You Online,and If so,Will I Buy?An Empirical Study of Two Trust-Building Strategies[J].Journal of Management Information Systems,2006,23(2):233-266.
[33]陳莉.負(fù)二項(xiàng)回歸模型在過(guò)度離散車(chē)險(xiǎn)數(shù)據(jù)中的應(yīng)用[D].貴陽(yáng):貴州民族大學(xué),2016.
[34]如何用R進(jìn)行多重共線性檢驗(yàn)與處理?[EB/OL].http://bbs.pinggu.org/thread-1383561-1-1.html,2017-11-02.
[35]施國(guó)良,陳旭,杜璐鋒.社會(huì)化問(wèn)答網(wǎng)站答案認(rèn)可度的影響因素研究——以知乎為例[J].現(xiàn)代情報(bào),2016,36 (6):41-45.
[36]劉佩,林如鵬.網(wǎng)絡(luò)問(wèn)答社區(qū)“知乎”的知識(shí)分享與傳播行為研究[J].圖書(shū)情報(bào)知識(shí),2015,(6):109-119.
(責(zé)任編輯:郭沫含)