健康知識付費(fèi)產(chǎn)品描述的文本特征對購買量的影響*

2023-03-12 09:14:26張薇薇

圖書館論壇 2023年3期

張薇薇，朱玲

0 引言

我國居民健康意識逐步增強(qiáng)、重大慢性病過早死亡率逐年下降，但慢病防控工作仍面臨巨大挑戰(zhàn)[1]。隨著網(wǎng)絡(luò)用戶健康素養(yǎng)的提高，各種專業(yè)健康信息服務(wù)平臺，如好大夫在線、丁香醫(yī)生等，逐漸成為醫(yī)療專業(yè)人員提供健康醫(yī)療服務(wù)、分享專業(yè)知識的有效工具，也是普通用戶了解疾病、尋求治療和提升健康水平的重要途徑。為了應(yīng)對持續(xù)知識貢獻(xiàn)不足和分享質(zhì)量下降的問題，在線知識付費(fèi)產(chǎn)品應(yīng)運(yùn)而生，一方面有助于用戶獲取高質(zhì)量知識，另一方面也激勵和促進(jìn)了專業(yè)知識貢獻(xiàn)，提升了互聯(lián)網(wǎng)知識交流的效果。隨著知識付費(fèi)產(chǎn)業(yè)規(guī)模逐漸擴(kuò)大，用戶更具有選擇權(quán)，知識生產(chǎn)者吸引用戶購買產(chǎn)品的難度逐漸加大[2]。因此，探索在線知識產(chǎn)品購買量影響因素的相關(guān)研究成為學(xué)術(shù)界和知識付費(fèi)產(chǎn)業(yè)的熱點(diǎn)話題。

隨著人們對醫(yī)療服務(wù)質(zhì)量要求的提升，越來越多的用戶付費(fèi)購買更有針對性和更詳細(xì)的健康信息[3]。在線付費(fèi)閱讀起源于網(wǎng)絡(luò)文學(xué)產(chǎn)業(yè)[4]，互聯(lián)網(wǎng)健康產(chǎn)業(yè)效仿健康知識付費(fèi)閱讀模式，以吸引更多高質(zhì)量的科普文章。例如，好大夫在線開設(shè)有健康知識免費(fèi)與付費(fèi)閱讀板塊，為患者和普通用戶提供圖文、語音、視頻等形式的科普知識，累計已達(dá)百余萬篇。然而，這其中所含的付費(fèi)知識產(chǎn)品比例非常低，絕大多數(shù)是可供用戶免費(fèi)閱讀的文章，后者的知識含量和內(nèi)容質(zhì)量通常遠(yuǎn)不如前者。雖然偶爾會出現(xiàn)一些具有較高購買量的熱點(diǎn)文章，但是總體而言，目前健康知識付費(fèi)產(chǎn)品的購買量仍然普遍較低，影響和阻礙了專業(yè)人員創(chuàng)作高質(zhì)量知識產(chǎn)品的積極性。

知識付費(fèi)產(chǎn)品描述是指能夠提示產(chǎn)品內(nèi)容特征的有關(guān)文本，包括產(chǎn)品簡介、內(nèi)容描述、標(biāo)題、引言、知識主題等。由于信息不完全、收益難以定義和量化，知識付費(fèi)產(chǎn)品的潛在用戶有必要通過產(chǎn)品描述等內(nèi)容質(zhì)量信號來衡量其價值[5]。知識付費(fèi)產(chǎn)品描述在知識產(chǎn)品化以及說服用戶購買的過程中扮演重要角色[6]，具有傳遞商品信息并激起購買欲的重要作用[7]，對于產(chǎn)品的不同描述會顯著影響用戶的支付意愿[8]。而健康知識產(chǎn)品描述作為醫(yī)療專業(yè)人員和普通用戶之間溝通的第一道橋梁，具有提示健康知識內(nèi)容、吸引用戶購買的作用。因此，有必要深入挖掘健康知識付費(fèi)產(chǎn)品描述的內(nèi)容特征及其對用戶知識付費(fèi)行為的影響機(jī)理?，F(xiàn)有文獻(xiàn)主要從知識生產(chǎn)者、知識消費(fèi)者等視角對產(chǎn)品購買量進(jìn)行研究，忽視了知識產(chǎn)品內(nèi)容，尤其是產(chǎn)品描述的文本特征對用戶購買量的影響。

本文以國內(nèi)最大的互聯(lián)網(wǎng)醫(yī)療平臺“好大夫在線”付費(fèi)閱讀知識產(chǎn)品為例，采用內(nèi)容分析法對抽樣采集的付費(fèi)健康知識樣本從產(chǎn)品描述的內(nèi)容視角進(jìn)行多維度特征提取、編碼和測度，探索健康知識產(chǎn)品描述的文本特征及其對用戶購買量的影響。本研究一方面有助于提高健康知識產(chǎn)品創(chuàng)作質(zhì)量，另一方面也有助于理解普通用戶對健康知識產(chǎn)品的選擇與采納過程，可為知識貢獻(xiàn)者和健康醫(yī)療服務(wù)平臺提高用戶購買量提供參考。

1 文獻(xiàn)綜述

1.1 健康知識產(chǎn)品描述的文本特征研究

海量互聯(lián)網(wǎng)健康信息正在爭奪用戶注意力，創(chuàng)建有吸引力的標(biāo)題變得尤為重要[9]。公眾閱讀信息時會策略性地使用標(biāo)題所表達(dá)的信息，以便在閱讀文本之前就構(gòu)建出其余文本的整體含義或重要主題[10]。標(biāo)題在影響讀者記憶和信息重用方面起到重要作用[11]，能夠?yàn)樽x者提供理解整個故事所需的知識，并保留在讀者記憶中[12]。已有研究表明，標(biāo)題特征會對用戶的被吸引程度、注視時長等產(chǎn)生影響。例如，標(biāo)題長度[13]、句式[14]、位置[15]會影響文本閱讀量、點(diǎn)贊數(shù)；較大的字體[16]、高信譽(yù)來源[17]會增加用戶對標(biāo)題的注視時長。

而健康知識的文本可讀性既是決定患者閱讀和理解文本難易程度的指標(biāo)，也是影響患者對健康信息利用能力的主要因素[18]。相關(guān)研究主要包含兩個方面：一是文本信息可讀性評估公式的研究[19-20]；二是研究文本可讀性概念、公式的應(yīng)用和影響[21]。隨著互聯(lián)網(wǎng)健康產(chǎn)業(yè)的發(fā)展，用戶的健康信息需求也受到關(guān)注。例如，對不同疾病[22]、不同人群[23]的健康信息使用情況進(jìn)行研究，探索和挖掘用戶感興趣的主題類型，或者揭示用戶關(guān)注度較高的健康知識主題[24]。

綜上可知，網(wǎng)絡(luò)健康知識產(chǎn)品描述的文本特征研究主要集中在標(biāo)題、語氣、文本可讀性以及健康信息需求的主題挖掘等方面。相較于其他類型的產(chǎn)品，付費(fèi)健康知識產(chǎn)品描述的相關(guān)研究還非常少，有關(guān)其文本特征提取、分類、編碼和應(yīng)用的研究更是缺乏。

1.2 知識付費(fèi)產(chǎn)品購買量的影響因素研究

付費(fèi)知識具有經(jīng)濟(jì)學(xué)意義上的產(chǎn)品價值屬性，知識消費(fèi)者對知識付費(fèi)產(chǎn)品的購買量受多種因素影響。現(xiàn)有文獻(xiàn)對于知識付費(fèi)產(chǎn)品的研究主要集中在知識生產(chǎn)者的分享動機(jī)和知識消費(fèi)者的付費(fèi)動機(jī)兩個方面[5]，一些研究直接采用用戶購買的知識產(chǎn)品數(shù)量來衡量知識付費(fèi)行為[2]。而聚焦于用戶知識付費(fèi)行為方面的研究表明，影響因素來自用戶自身、價格效用、內(nèi)容質(zhì)量、技術(shù)平臺、外部社會環(huán)境等多個方面[2，25]。

在內(nèi)容質(zhì)量上，其是影響用戶在線知識付費(fèi)的關(guān)鍵[26]，對知識內(nèi)容的把控也是提升用戶繼續(xù)付費(fèi)意愿的關(guān)鍵因素[27]；用戶付費(fèi)態(tài)度受到感知質(zhì)量和體驗(yàn)的直接影響，而付費(fèi)態(tài)度會直接影響付費(fèi)意愿[28]。在知識生產(chǎn)者上，知識生產(chǎn)者聲譽(yù)會通過預(yù)期收益間接影響消費(fèi)者的付費(fèi)意愿[29]，并在知識產(chǎn)品描述的語言風(fēng)格與產(chǎn)品銷量間具有顯著的調(diào)節(jié)作用[6]；“得到”付費(fèi)課程的實(shí)證研究表明，對購買量影響最大的是教師知名度，而粉絲吸聚仍是知識產(chǎn)品變現(xiàn)的首要邏輯[30]；而網(wǎng)絡(luò)信息也能為用戶購買決策提供支持[3]。在知識消費(fèi)者上，價格對用戶購買決策具有負(fù)向影響[3]，但當(dāng)產(chǎn)品評論數(shù)量足夠多時，價格對銷量的負(fù)向影響減弱[5]；而也有研究發(fā)現(xiàn)感知成本對用戶持續(xù)付費(fèi)意愿的影響并不顯著[31]。在知識付費(fèi)產(chǎn)品特征上，其對用戶購買量的影響不容忽視，加強(qiáng)內(nèi)容設(shè)計是知識付費(fèi)發(fā)展的重中之重[30]；知識產(chǎn)品特征描述是知識產(chǎn)品化過程的關(guān)鍵環(huán)節(jié)，也是內(nèi)容線索的重要組成，影響消費(fèi)者購買決策[6]。在產(chǎn)品類型上，其對用戶知識付費(fèi)行為具有調(diào)節(jié)作用。知識產(chǎn)品有實(shí)用型和娛樂型之分，知識生產(chǎn)者聲譽(yù)和經(jīng)驗(yàn)對實(shí)用型知識產(chǎn)品購買量的影響較娛樂型知識產(chǎn)品弱[2]，這意味著，雖然實(shí)用型知識產(chǎn)品的購買量會受到生產(chǎn)者聲譽(yù)等情境因素的影響，但相比于知識內(nèi)容本身，其影響較弱。付費(fèi)醫(yī)療健康知識屬于典型的實(shí)用型產(chǎn)品，因此普通用戶更加關(guān)心知識產(chǎn)品的內(nèi)容。

綜上所述，知識付費(fèi)產(chǎn)品購買量受到內(nèi)容質(zhì)量、產(chǎn)品特征、知識生產(chǎn)者、知識消費(fèi)者、產(chǎn)品類型等多種因素的影響。以往研究較多集中于知識生產(chǎn)者和知識消費(fèi)者因素，近期學(xué)者開始關(guān)注產(chǎn)品特征、產(chǎn)品類型，尤其是知識付費(fèi)產(chǎn)品描述的內(nèi)容特征與線索等對用戶購買量的影響。就研究情境而言，現(xiàn)有文獻(xiàn)多聚焦于知識問答社區(qū)，鮮見關(guān)于互聯(lián)網(wǎng)醫(yī)療健康服務(wù)平臺知識付費(fèi)產(chǎn)品購買量的相關(guān)研究。

2 研究設(shè)計

2.1 研究方法

本研究旨在探索健康知識付費(fèi)產(chǎn)品描述的文本內(nèi)容特征對用戶購買量的影響，因此如何抽取關(guān)鍵文本特征作為內(nèi)容線索和影響因素，并進(jìn)行量化分析至關(guān)重要。內(nèi)容分析法是一種以研究大眾傳播的信息內(nèi)容為主的社會科學(xué)研究方法[32]，也是一種基于定性研究的量化分析方法，利用推理和比較對研究對象的內(nèi)容特征進(jìn)行分析[33]。本文的研究對象是產(chǎn)品描述信息的內(nèi)容特征，既包括顯性的信息內(nèi)容，也包括潛在、隱含的信息內(nèi)容。同時，健康知識產(chǎn)品描述的文本單元數(shù)據(jù)量較小(僅含標(biāo)題和引言)，結(jié)構(gòu)化程度低，缺乏內(nèi)容元數(shù)據(jù)[34]。經(jīng)過系統(tǒng)比較，內(nèi)容分析法既能夠從定性分析的視角對健康知識付費(fèi)產(chǎn)品描述的文本內(nèi)容進(jìn)行特征提取和編碼分析，又能夠?qū)幋a結(jié)果進(jìn)行客觀定量的統(tǒng)計分析，可以科學(xué)有效地探索本文提出的研究問題。

經(jīng)過內(nèi)容分析后，所提取的文本特征因素皆為分類變量，需要考察多個特征因素對用戶購買量(因變量)的影響以及它們之間的交互作用。因而，在后續(xù)的統(tǒng)計分析中傾向于采用多因素方差分析法。以方差分析模型為代表的多因素分析方法效率高、適用范圍廣，適用條件有樣本獨(dú)立性、隨機(jī)誤差正態(tài)分布以及方差齊性[35]。本研究將采用內(nèi)容分析法對健康知識產(chǎn)品描述信息的文本特征進(jìn)行提取和編碼，然后采用多因素方差分析法對編碼結(jié)果進(jìn)行統(tǒng)計分析。

2.2 數(shù)據(jù)采集與樣本篩選

一般而言，內(nèi)容分析法的研究過程可分為4個階段：提出問題、抽取樣本、選擇分析單元、建立分析類目[36]。本研究選擇“好大夫在線”作為樣本數(shù)據(jù)源，原因包括兩個方面。一是“好大夫在線”創(chuàng)立于2006年，擁有數(shù)量眾多的專業(yè)醫(yī)生群體以及龐大的用戶群體；在我國互聯(lián)網(wǎng)醫(yī)療平臺中具有代表性，認(rèn)知度和使用比例名列各大醫(yī)療網(wǎng)站之首[3]。然而鮮見關(guān)于“好大夫在線”付費(fèi)健康知識產(chǎn)品描述方面的研究。二是“好大夫在線”開設(shè)有健康知識閱讀板塊，主要由三甲醫(yī)院的職業(yè)醫(yī)師為用戶提供圖文、語音、視頻等形式的科普知識和診療經(jīng)驗(yàn)，具有很高的權(quán)威性。其中，圖文知識板塊給予知識生產(chǎn)者創(chuàng)作產(chǎn)品描述(包括標(biāo)題和引言)、選擇付費(fèi)閱讀的功能，這為本文探索健康知識產(chǎn)品描述的文本特征及其對用戶購買量的影響提供了豐富的內(nèi)容素材和現(xiàn)實(shí)場景。

(1)數(shù)據(jù)采集。使用內(nèi)容分析法進(jìn)行資料分析時，如果難以對全部內(nèi)容進(jìn)行普查，就必須通過抽樣選擇最有利于分析、信息含量大、具有連續(xù)性、內(nèi)容體例基本一致的樣本進(jìn)行研究[36]。經(jīng)過觀察和篩選，本文選擇“健康知識”模塊中知識貢獻(xiàn)度和用戶活躍度都較高的兒科、內(nèi)科、外科、生殖科4個科室進(jìn)行抽樣調(diào)查?？紤]到本研究主題圍繞健康知識產(chǎn)品描述的文本特征，故排除了視頻和語音兩種類型，僅針對“圖文”形式的付費(fèi)知識進(jìn)行調(diào)研。采用Python編寫的網(wǎng)絡(luò)爬蟲軟件，對以上4個科室“圖文”類型的付費(fèi)知識產(chǎn)品記錄進(jìn)行爬取，數(shù)據(jù)采集時間為2020年9月初，合計獲取原始記錄集3，516條，包含科室、醫(yī)生姓名、醫(yī)師職稱、發(fā)布時間、標(biāo)題、可供免費(fèi)閱讀的文章內(nèi)容(以下簡稱“引言”)、付費(fèi)金額、點(diǎn)贊數(shù)、購買量等字段信息。

(2)樣本篩選。采集原始記錄數(shù)據(jù)時除了設(shè)定科室限制，并沒有其他約束條件。根據(jù)內(nèi)容分析法的樣本抽取原則[36]，原始記錄在分析之前須經(jīng)過嚴(yán)格的數(shù)據(jù)清理和樣本篩選，以控制文本特征以外其他外部因素的影響。首先，剔除廣告發(fā)布、字段信息不全的記錄；其次，為了控制圖表等非文本因素的影響，移除所有包含圖表的記錄；然后，考慮到購買量的分布情況，從剩余數(shù)據(jù)中剔除購買量嚴(yán)重偏離均值和中位數(shù)的少數(shù)極端值記錄。在多因素方差分析中，極端值的影響遠(yuǎn)大于方差齊性等問題的影響[35]；具有很高購買量的知識產(chǎn)品往往受到醫(yī)生聲譽(yù)等外部因素的影響，保留這些數(shù)據(jù)容易使分析結(jié)果產(chǎn)生偏差。此外，由于本研究將重點(diǎn)探索那些能夠吸引用戶購買的健康知識產(chǎn)品文本特征，因此購買量很低甚至為0的記錄也不符合本研究的要求。經(jīng)過篩選最終得到1，594條記錄，對后續(xù)將要開展的內(nèi)容分析而言，該數(shù)據(jù)量已足夠大。經(jīng)初步統(tǒng)計分析，發(fā)布年份、醫(yī)師職稱、付費(fèi)金額等控制因素對購買量沒有顯著影響。樣本集合中有88.7%的科普文章發(fā)布時間在近4年(2017-2020)，早期樣本量較少。其中，2017年占16.5%，2018年占40.9%，2019年占25.4%，2020年占5.9%。

2.3文本特征編碼、測量與假設(shè)

本研究綜合采用樣本數(shù)據(jù)解讀式內(nèi)容分析[37]、現(xiàn)有相關(guān)研究的推理分析[34]，歸納與演繹、定性與定量相結(jié)合等方法，開展文本特征的提取、編碼和測量工作。文獻(xiàn)調(diào)研表明，網(wǎng)絡(luò)健康知識產(chǎn)品描述的文本特征研究集中在標(biāo)題、語氣、文本可讀性以及健康信息需求的主題挖掘等方面。同時，樣本數(shù)據(jù)的定性分析顯示，付費(fèi)知識產(chǎn)品描述的文本信息主要由標(biāo)題和引言構(gòu)成。因此，本研究從標(biāo)題、引言、主題3個文本特征維度選取“標(biāo)題語氣”“引言可讀性”“引言呈現(xiàn)方式”“健康知識主題”為主要特征變量和影響因素。篩選依據(jù)有：一是基于對樣本記錄的定性分析，標(biāo)題特征主要有語氣、長度等，引言文本特征主要有可讀性、表述或呈現(xiàn)方式，而標(biāo)題和引言共同指示了樣本記錄的知識主題；二是基于對樣本數(shù)據(jù)的定量分析，經(jīng)過初步統(tǒng)計分析可知，標(biāo)題長度對購買量沒有顯著影響，故沒有納入特征因素。

編碼過程由兩位研究人員同時進(jìn)行，總共分為三輪。第一輪，隨機(jī)抽取100條數(shù)據(jù)進(jìn)行獨(dú)立編碼，讓編碼人員對編碼類目有一個初步的了解，然后將編碼結(jié)果進(jìn)行一致性判斷，將不一致部分交由第三人進(jìn)行討論，直至達(dá)成一致；第二輪、第三輪分別選擇300、1，194條數(shù)據(jù)進(jìn)行編碼，重復(fù)以上操作，直至完成所有文本編碼。

2.3.1 標(biāo)題語氣

標(biāo)題語氣分為陳述語氣、疑問語氣、感嘆語氣3種類型。陳述語氣是對健康知識客觀事實(shí)的說明，一般以句號結(jié)尾，不帶有主觀情緒；疑問語氣是對所陳述事實(shí)的疑問，多以問號結(jié)尾；感嘆語氣所表達(dá)的感情色彩會比較強(qiáng)烈，多以感嘆號結(jié)尾。不同標(biāo)題語氣可能會對健康知識購買量產(chǎn)生一定的影響。標(biāo)題制作時善用修辭、妙用語氣詞，有助于吸引讀者目光、滿足讀者的信息需求[38]。語氣是文本敘述的情緒，會影響社會輿論和大眾情緒。社交媒體發(fā)布信息的語氣會影響公民的參與行為[39]，媒體報道的語氣對選民感知有實(shí)質(zhì)性影響[40]。因此，本文提出以下假設(shè)：

H1：健康知識產(chǎn)品描述的標(biāo)題語氣對用戶購買量有顯著影響。

2.3.2 引言可讀性

由于中英文語言差異，英語文獻(xiàn)可讀性測評工具漢化后應(yīng)用于中文語料分析存在局限性。而國內(nèi)漢語可讀性計算公式多針對語言教學(xué)文本開發(fā)，不能直接用于健康文本的評估[41]。有學(xué)者設(shè)計了針對特定主題的健康文本可讀性測評工具，但是公式過于復(fù)雜，實(shí)用價值不高。某些研究采用平均詞語數(shù)目來測量醫(yī)生回復(fù)文本的可讀性[42]，雖然簡單易用，卻不能反映健康文本的特殊性。為此，本文采用秦琴等[20]改編過的中文健康信息可讀性計算公式測量引言可讀性。該公式既體現(xiàn)了普通文本可讀性特征(如平均句長)，又反映了健康醫(yī)學(xué)文本的特殊性(包含醫(yī)學(xué)專業(yè)術(shù)語占比)，內(nèi)容如下：

R表示健康知識的可讀性值，X1表示總字?jǐn)?shù)，X2表示平均句長(即總字?jǐn)?shù)/總句數(shù))，X3表示醫(yī)學(xué)專業(yè)術(shù)語占比。通過Excel分別統(tǒng)計每條數(shù)據(jù)的總字?jǐn)?shù)X1、總句數(shù)，并計算平均句長X2；對于醫(yī)學(xué)專業(yè)術(shù)語占比X3的計算，仍然借鑒文獻(xiàn)[20]的做法。首先，對每條引言文本進(jìn)行分詞處理，并統(tǒng)計語詞總數(shù)；其次，依據(jù)LetPub專業(yè)科學(xué)術(shù)語在線詞典提供的醫(yī)學(xué)術(shù)語，將分詞結(jié)果與醫(yī)學(xué)術(shù)語詞典進(jìn)行比對，統(tǒng)計出每條引言文本中醫(yī)學(xué)專業(yè)術(shù)語的數(shù)量；最后，計算醫(yī)學(xué)專業(yè)術(shù)語在各引言文本語詞總數(shù)中的比例，即得到X3。根據(jù)以上數(shù)據(jù)分析結(jié)果，得出引言可讀性值的分布情況，結(jié)合文獻(xiàn)[20]中對食品安全健康教育材料可讀性的分布情況，將處于(0，1]，(1，2]，(2，3]，(3，4]，(4，5]，(5，6]，(6，7]，(7，12]文本可讀性水平的R值分別編碼為1、2、3、4、5、6、7、8。

已有研究表明，從視覺角度提高文本可讀性能減輕用戶認(rèn)知負(fù)荷，促進(jìn)健康信息利用效率，優(yōu)化用戶健康信息搜尋體驗(yàn)[43]。文獻(xiàn)[7]研究發(fā)現(xiàn)，電影簡介的文本可讀性對首周票房影響較大。而基于“好大夫在線”患者數(shù)據(jù)的實(shí)證檢驗(yàn)顯示，醫(yī)生回復(fù)文本的可讀性對定向就診意向有正向影響[42]。因此，本文提出關(guān)于引言文本可讀性與用戶購買量的假設(shè)：

H2：健康知識產(chǎn)品描述的引言可讀性對用戶購買量有顯著影響。

2.3.3 引言呈現(xiàn)方式

經(jīng)過三輪編碼和討論，最終確定引言呈現(xiàn)方式的5種基本類型：統(tǒng)計數(shù)據(jù)、概念引入、問題解答、病例引入、總體概括(具體含義如表1所示)。此外，經(jīng)過對樣本數(shù)據(jù)的分析，發(fā)現(xiàn)很多引言文本是復(fù)合型的，即同時包含2種或2種以上的類型，編碼示例如表2所示。付費(fèi)閱讀情境下，用戶在購買之前無法瀏覽知識內(nèi)容的全貌，只能通過產(chǎn)品描述(主要是標(biāo)題和引言)進(jìn)行選擇和判斷，因此引言呈現(xiàn)方式與表述技巧顯得尤為重要。已有研究表明，對于知識產(chǎn)品的不同描述會顯著影響用戶的支付意愿。例如，產(chǎn)品描述的詳盡性、相關(guān)性[2]，描述語言中的可信度、獨(dú)斷性、論證清晰性等[6]，皆對知識產(chǎn)品購買量有顯著正向影響。綜合以上分析，提出如下假設(shè)：

表1 單一型引言呈現(xiàn)方式的類型與示例

表2 復(fù)合型引言呈現(xiàn)方式的編碼示例

H3：健康知識產(chǎn)品描述的引言呈現(xiàn)方式對用戶購買量有顯著影響。

2.3.4 健康知識主題

本研究借鑒金碧漪等[24]對健康知識需求類別的劃分，結(jié)合樣本數(shù)據(jù)的內(nèi)容分析，將健康知識主題劃分為基礎(chǔ)病理知識、疾病治療、疾病預(yù)防、疾病管理、診斷與檢查等5類(具體編碼如表3所示)。用戶對不同主題的健康信息需求有差異，國內(nèi)外各需求類目占比差異巨大，預(yù)防信息需求將持續(xù)上升。因此，提出如下假設(shè)：

表3 健康知識的主題類別

H4：健康知識產(chǎn)品描述的主題對用戶購買量有顯著影響。

3 研究結(jié)果與分析

3.1 描述性統(tǒng)計

篩選之后樣本數(shù)據(jù)的文本特征編碼及其統(tǒng)計結(jié)果如表4所示，超過一半付費(fèi)知識標(biāo)題使用陳述語氣(56.52%)；就引言文本的可讀性分布而言，絕大多數(shù)(82.62%)處于(1，5]，其中(3，4]區(qū)間的樣本數(shù)超過四分之一；就引言呈現(xiàn)方式而言，“概念引入”“問題解答”“病例引入”“總體概括”比例較高，復(fù)合型相對較少；就健康知識主題而言，基礎(chǔ)病理知識與疾病治療的分享最多，疾病預(yù)防知識的分享最少。

表4 健康知識產(chǎn)品描述的文本特征編碼與統(tǒng)計結(jié)果

3.2 健康知識付費(fèi)產(chǎn)品描述的文本特征對用戶購買量的影響

依據(jù)上文的內(nèi)容分析結(jié)果，統(tǒng)計分析各文本特征對用戶購買量的影響。以標(biāo)題語氣、引言可讀性、引言呈現(xiàn)方式、健康知識主題作為反映健康知識貢獻(xiàn)特征的關(guān)鍵因素和自變量，以付費(fèi)知識購買量作為因變量，采用多因素方差分析法檢驗(yàn)各因素的主效應(yīng)和交互效應(yīng)(結(jié)果如表5所示)。其中，方差齊性(F=1.105，p=0.100)通過檢驗(yàn)。由表5可知，引言可讀性(F=3.299，p<0.01)、引言呈現(xiàn)方式(F=8.914，p<0.001)，以及健康知識主題和引言呈現(xiàn)方式的交互作用(F=1.485，p<0.05)對健康知識購買量均有顯著影響。

3.2.1 標(biāo)題語氣對用戶購買量的影響

觀察表4可知，標(biāo)題絕大多數(shù)采用陳述語氣和疑問語氣，較少使用感嘆語氣。而由表5可知，標(biāo)題語氣(BY；F=0.299，p=0.741)對健康知識購買量的影響不顯著，即醫(yī)生在分享健康知識時無論采用哪種語氣的標(biāo)題都對其購買量無顯著影響。此外，標(biāo)題語氣與健康知識主題的交互作用不顯著，這與紀(jì)雪梅等[44]的研究結(jié)果不同。原因可能是，后者研究的公眾評論帶有強(qiáng)烈的情感特征，易受標(biāo)題語氣、態(tài)度等情感因素影響；而本文研究的付費(fèi)知識購買更多是基于理性判斷，不易受標(biāo)題語氣等感性因素影響。

3.2.2 引言可讀性對用戶購買量的影響

由表5可知，引言可讀性(YR)對在線健康知識購買量具有顯著影響(F=3.299，p=0.002)。根據(jù)表4統(tǒng)計結(jié)果，有82.62%健康知識的引言可讀性處于(1，5]區(qū)間，而有48.18%的引言可讀性處于(2，4]區(qū)間內(nèi)。通過購買量均值差異的比較可知，購買量隨引言可讀性變化呈現(xiàn)“M型”趨勢，如圖1所示。引言可讀性處于YR4(3，4]區(qū)間的樣本購買量均值最高，達(dá)到第一個峰值。組間比較結(jié)果顯示，YR4組購買量均值顯著大于峰值左右的YR1(p=0.001)、YR2(p=0.000)、YR3(p=0.025)、YR5(p=0.001)。由此可知，引言可讀性低于YR4時，樣本購買量隨著可讀性區(qū)間增加呈現(xiàn)明顯的遞增趨勢；高于YR4時，購買量顯著遞減。其中，可讀性區(qū)間處于YR1(0，1]和YR2(1，2]時樣本的購買量差異不顯著(p=0.468)?？勺x性值超過YR5區(qū)間，購買量又呈現(xiàn)遞增趨勢，直至達(dá)到第二個峰值。此后，購買量再次遞減，尤其是可讀性達(dá)到Y(jié)R8(>7)時，購買量顯著低于YR3(p=0.032)、YR4(p=0.002)和YR6(p=0.049)。

圖1 不同可讀性區(qū)間的購買量均值比較

表5 健康知識產(chǎn)品描述的文本特征與購買量的多因素方差分析（部分)

3.2.3 引言呈現(xiàn)方式對用戶購買量的影響

由表5可知引言呈現(xiàn)方式對用戶購買量影響非常顯著(F=8.914，p<0.001)。進(jìn)一步對不同引言呈現(xiàn)方式進(jìn)行多重比較，結(jié)果如表6所示(僅列出具有顯著性的結(jié)果)。同時，繪制相應(yīng)的比較圖以更直觀地顯示不同引言呈現(xiàn)方式的購買量差異(見圖2)，其中購買量均值見右刻度線，而第一四分位、第三四分位數(shù)見左刻度線。通過圖2可知：總體而言，復(fù)合型引言比單一型引言更能吸引用戶購買。

就單一型引言來說(見表6及圖2)，“病例引入”(YC4)類引言的購買量要顯著高于其他類型的引言，并且其與“總體概括”類引言的購買量均值差異最大。此外，“統(tǒng)計數(shù)據(jù)”“概念引入”“問題解答”三類引言的購買量無顯著差異。

圖2 不同引言呈現(xiàn)方式的購買量比較（部分)

表6 引言呈現(xiàn)方式之間的多重比較

而對于復(fù)合型引言，采用“病例引入+概念引入”(YC4YC2)與“病例引入+總體概括”(YC4YC5)引言的健康知識購買量均要顯著高于其他復(fù)合引言。此外，“概念引入+問題解答”(YC2YC3)引言的健康知識購買量要大于“概念引入+總體概括”(YC2YC5)引言。概言之，健康知識付費(fèi)用戶對于以“病例引入”開頭的復(fù)合引言的接受度更高，也更愿意購買此類健康知識。

3.2.4 健康知識主題對用戶購買量的影響

由表4可知，健康知識付費(fèi)產(chǎn)品的主題類型，以疾病治療(40.53%)、基礎(chǔ)病理知識(25.47%)和疾病管理(15.93%)為主，疾病預(yù)防(5.46%)涉及較少。進(jìn)一步探究健康知識主題類型對用戶付費(fèi)行為影響的主效應(yīng)和交互效應(yīng)(見表5)，發(fā)現(xiàn)不同主題類型對健康知識產(chǎn)品購買量影響的主效應(yīng)雖然不顯著(F=0.642，p=0.633)，但和引言呈現(xiàn)方式的交互效應(yīng)非常顯著(F=1.485，p=0.033)，而其與標(biāo)題語氣的交互效應(yīng)不顯著，具體原因如上文所述。

比較相同主題下不同引言呈現(xiàn)方式的均值(M)可知，當(dāng)主題類型為“S1基礎(chǔ)病理知識”，采用“總體概括+問題解答(YC5YC3)”(M=64.755)的引言呈現(xiàn)方式，則平均購買量最高，其次是“病例引入+概念引入(YC4YC2)”(M=61.277)；對“S2疾病治療”類的知識表述，“病例引入+概念引入(YC4YC2)”(M=67.537)、“病例引入+總體概括(YC4YC5)”(M=62.918)的引言呈現(xiàn)方式會取得較大的平均購買量；當(dāng)主題類型為“S3疾病預(yù)防”時，采用“病例引入+概念引入(YC4YC2)”(M=88.209)的引言呈現(xiàn)方式最佳，其次是“概念引入+問題解答(YC2YC3)”(M=68.863)；對“S4疾病管理”知識產(chǎn)品的表述，采用“病例引入+總體概括(YC4YC5)”(M=81.941)或“總體概括+問題解答(YC5YC3)”(M=78.215)的引言呈現(xiàn)方式較好；當(dāng)知識為“S5診斷與檢查”方面的內(nèi)容，“概念引入+問題解答(YC2YC3)”(M=95.167)類引言觸發(fā)的購買量最高。

考慮到樣本數(shù)量和結(jié)果的穩(wěn)健性，本文特別比較了樣本數(shù)較多的單一型引言(“統(tǒng)計數(shù)據(jù)”除外)在不同主題類型下的平均購買量。圖3的結(jié)果顯示：除了“疾病預(yù)防”，采用“病例引入(YC4)”引言呈現(xiàn)方式的樣本在各個主題上的購買量都較高，尤其是在“基礎(chǔ)病理知識”“疾病管理”“診斷與檢查”方面；采用“總體概括(YC5)”的樣本在任何主題上的平均購買量都最低，尤其是在“疾病預(yù)防”“診斷與檢查”方面；采用“概念引入(YC2)”“問題解答(YC3)”引言呈現(xiàn)方式的樣本，其購買量在“基礎(chǔ)病理知識”“疾病治療”“疾病管理”方面都很相近；但在“疾病預(yù)防”“診斷與檢查”方面，后者的購買量較高。

圖3 不同主題下單一引言呈現(xiàn)方式的平均購買量比較

3.3 結(jié)果分析與討論

(1)標(biāo)題語氣對健康知識購買量的影響不顯著，說明用戶對健康知識標(biāo)題的語氣不敏感。而在線付費(fèi)課程的相關(guān)研究表明，陳述語氣更易引發(fā)用戶的購買興趣[30，45]。其原因主要有：首先，在線付費(fèi)課程多為視頻類、音頻類知識產(chǎn)品，這與本研究的文本類知識有所區(qū)別；其次，在線付費(fèi)課程多為商業(yè)類、職場類，課程主題對用戶購買量影響顯著[30]，而本文研究結(jié)果顯示，健康知識主題對用戶購買量的主效應(yīng)并不顯著。因此推測，用戶對文本類健康知識的付費(fèi)行為相對理性、客觀，不易受標(biāo)題語氣和主題類型的直接影響。

(2)引言可讀性與用戶購買量之間呈現(xiàn)“M型”關(guān)系，可讀性值在(3，4]區(qū)間達(dá)到第一個峰值(M=58.223)，在(6，7]區(qū)間達(dá)到第二個峰值(M=54.832)。觀察中文健康信息可讀性計算公式可知，可讀性值與總字?jǐn)?shù)、平均句長、醫(yī)學(xué)專業(yè)術(shù)語占比均呈正相關(guān)關(guān)系，即當(dāng)總字?jǐn)?shù)、平均句長不變時，醫(yī)學(xué)專業(yè)術(shù)語占比越高，可讀性值越高，文本易理解性水平越低，普通用戶越難以理解，反之亦然。第一個峰值的樣本量較大，顯著性水平高，具有很好的統(tǒng)計可靠性。因此可以推斷，付費(fèi)健康知識的引言文本保持適度的可讀性會有更高的購買量，可讀性值過低會被認(rèn)為缺乏專業(yè)性和科學(xué)性，而可讀性值過高會導(dǎo)致普通用戶閱讀困難。對于第二個峰值，可以作以下推測：普通用戶對于可讀性值處于(6，7]區(qū)間的健康知識有一定難度，從而整體上樣本量較少；但是對于某些長期形成、不易根治的疾病(如慢性病)，患者或其家屬在治療過程中積累了一定的知識儲備，對專業(yè)術(shù)語比例較高的知識文本仍有較好的理解力，在知識付費(fèi)中也更加注重知識的專業(yè)性和科學(xué)性，從而形成了第二個購買量峰值。

(3)用戶對引言呈現(xiàn)方式有明顯偏好。在單一型引言呈現(xiàn)方式中，“病例引入”類最能吸引用戶做出購買決策，而“總體概括”類的購買量顯著低于其他類型。由此可見，用具體病例引入的呈現(xiàn)方式更能激發(fā)用戶對健康知識的深度關(guān)注和付費(fèi)意愿。相關(guān)研究也發(fā)現(xiàn)，故事型信息對接受者情感反應(yīng)的影響更顯著[46]，可以增強(qiáng)信息的趣味性和情感價值，吸引用戶的注意并做出選擇[47]。“總體概括”類引言的購買量最低，可以推測用戶在健康知識付費(fèi)決策中比較關(guān)注知識的含金量，而相對概括、抽象、知識含量低的“總體概括”類引言對用戶吸引力較弱，相應(yīng)的付費(fèi)意愿也最低。類似地，“問題解答”“概念引入”兩類引言的知識含量比“總體概括”高，因而購買量顯著高于“總體概括”類引言。從圖2可知，單獨(dú)使用“總體概括”引言呈現(xiàn)方式時，購買量很低；若與其他呈現(xiàn)方式搭配，則能大幅提升用戶購買意愿。例如，“病例引入+總體概括”“概念引入+總體概括”“總體概括+問題解答”的購買量均顯著高于“總體概括”。由此可見，貢獻(xiàn)者在編制付費(fèi)健康知識的引言時，不能僅僅展示內(nèi)容框架，還要給出其他有價值的信息，如病例、概念、解答，方可吸引用戶購買。

(4)健康知識主題分布不均衡，且與引言呈現(xiàn)方式的交互效應(yīng)顯著?！凹膊≈委煛迸c“基礎(chǔ)病理知識”類的樣本數(shù)比例最高，“疾病預(yù)防”類的比例最低。不同主題之間樣本量差異較大，可能與知識生產(chǎn)者多為有臨床經(jīng)驗(yàn)的醫(yī)療職業(yè)人員有關(guān)，他們在基礎(chǔ)病理、疾病治療方面積累了豐富的經(jīng)驗(yàn)知識和大量的病例報告。隨著人們對亞健康問題關(guān)注的增強(qiáng)，同時伴隨著公眾健康素養(yǎng)的提高，會有更多用戶對“疾病預(yù)防”“疾病管理”方面的知識付費(fèi)產(chǎn)品感興趣，因此健康服務(wù)平臺應(yīng)當(dāng)采取激勵措施提高這方面的知識貢獻(xiàn)量。如前文所述，健康知識主題單獨(dú)對購買量無顯著影響，而與引言呈現(xiàn)方式結(jié)合時卻有顯著效應(yīng)。貢獻(xiàn)基礎(chǔ)病理知識時，可采用“總體概括+問題解答”的引言呈現(xiàn)方式，以問答形式，對臨床患者詢問較多的問題進(jìn)行列舉和解答。對于疾病治療知識，“病例引入+概念引入”與“病例引入+總體概括”的引言都是較好的呈現(xiàn)方式，先引入病例激發(fā)用戶興趣，再解釋疾病名稱或給出下文要闡釋的問題綱要。對于疾病預(yù)防知識，如果采用單一引言，那么“問題解答”類表述方式更能吸引用戶購買；如果采用復(fù)合引言，那么“病例引入+概念引入”的表達(dá)方式會取得更好的效果，即先介紹具體病例，再由病例引出疾病概念，進(jìn)而闡釋如何預(yù)防。對于疾病管理知識，“病例引入+總體概括”或“總體概括+問題解答”的引言皆可。對于診斷與檢查方面的知識，可以根據(jù)具體情形選擇使用“病例引入”“概念引入”“問題解答”，或者兩兩結(jié)合的方式，但需要避免單純使用“總體概括”的方式。

4 結(jié)語

本文以“好大夫在線”知識付費(fèi)閱讀產(chǎn)品為例，深入研究健康知識付費(fèi)產(chǎn)品描述的文本特征對用戶購買量的影響和作用。首先，采用內(nèi)容分析法對抽樣采集與層層篩選的1，594條健康知識付費(fèi)產(chǎn)品描述的樣本數(shù)據(jù)進(jìn)行文本特征的提取、編碼與測量，并提出若干研究假設(shè)。其次，采用多因素方差分析法檢驗(yàn)相關(guān)假設(shè)，并對數(shù)據(jù)結(jié)果進(jìn)行分析和討論。主要結(jié)論有：(1)健康知識產(chǎn)品描述的標(biāo)題語氣對用戶購買量沒有顯著影響，即用戶對健康知識標(biāo)題的語氣總體不敏感；(2)付費(fèi)健康知識產(chǎn)品描述的引言保持適度的可讀性會有更高的購買量，可讀性值過低會被認(rèn)為缺乏專業(yè)性和科學(xué)性，而可讀性值過高會因?qū)I(yè)性太強(qiáng)和可理解性低而導(dǎo)致用戶購買量減少；(3)引言呈現(xiàn)方式對用戶購買量有顯著影響，通常復(fù)合型引言比單一型引言具有更高的購買量，單一型引言中引入病例敘事更能激發(fā)用戶對健康知識的深度關(guān)注和付費(fèi)意愿。此外，引言不能僅僅展示內(nèi)容框架，還要給出病例、概念、解答等有價值的知識信息，才能吸引用戶購買；(4)健康知識主題對購買量沒有顯著影響，但與引言呈現(xiàn)方式的交互效應(yīng)顯著。針對基礎(chǔ)病理知識、疾病治療、疾病預(yù)防、疾病管理等不同主題，可以采用不同的引言呈現(xiàn)方式，以提升用戶付費(fèi)意愿和購買量。

本研究有助于豐富和完善健康知識付費(fèi)產(chǎn)品描述對用戶購買量作用機(jī)理的相關(guān)研究，進(jìn)而深化對在線健康信息用戶知識付費(fèi)行為的理解，同時為在線健康知識付費(fèi)產(chǎn)品的創(chuàng)作者、管理者和服務(wù)方提高購買量、推動健康知識交流效果提供啟示和建議?；趦?nèi)容分析法的樣本抽取原則，本文僅選取4個科室的數(shù)據(jù)，今后的研究可深入探討諸如慢病管理等縱向主題領(lǐng)域付費(fèi)知識的產(chǎn)品特征。此外，本調(diào)研圍繞付費(fèi)閱讀產(chǎn)品描述的文本特征展開，而視頻類、音頻類健康知識也很受用戶歡迎，后繼研究可對不同媒介的健康知識付費(fèi)產(chǎn)品的描述特征及其影響進(jìn)行深入探究。