• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)驅(qū)動(dòng)的高校圖書館用戶留存研究*

      2022-12-17 07:49:32陳添源詹慶東林藝山
      圖書館論壇 2022年11期
      關(guān)鍵詞:生命周期均值聚類

      胡 婧,陳添源,詹慶東,林藝山

      0 引言

      當(dāng)前“賦能存量、做優(yōu)增量、把握變量”是高校圖書館(以下簡(jiǎn)稱“高校館”)面向“十四五”規(guī)劃加強(qiáng)信息資源建設(shè)和業(yè)務(wù)創(chuàng)新的重要理念之一[1]。然而高校館在發(fā)展新用戶和開拓新服務(wù)的營(yíng)銷服務(wù)過(guò)程中,存在用戶流失現(xiàn)象[2]。提升用戶留存成為高校館重要工作,該如何在存量和增量中提高用戶留存,防止用戶流失呢?有鑒于此,構(gòu)建適宜于高校館業(yè)務(wù)實(shí)踐的用戶留存分析框架和實(shí)證方法成為亟待解決的問(wèn)題。而隨著高校館信息化建設(shè)加速,眾多業(yè)務(wù)平臺(tái)中存儲(chǔ)著大量的用戶行為數(shù)據(jù),借助大數(shù)據(jù)工具加強(qiáng)用戶行為分析,提升高校館的精準(zhǔn)服務(wù),這種研究范式日益受到關(guān)注和認(rèn)可。本文以此為出發(fā)點(diǎn),以數(shù)據(jù)驅(qū)動(dòng)模式開展用戶留存分析,從高校館的用戶行為數(shù)據(jù)中識(shí)別用戶留存行為特征,洞察用戶生命周期的每個(gè)階段或關(guān)鍵節(jié)點(diǎn)的用戶留存群體差異特征,進(jìn)而制定分群營(yíng)銷服務(wù)策略,以期為高校館提升用戶服務(wù)精準(zhǔn)化水平提供借鑒。

      1 研究述評(píng)

      1.1 用戶留存分析及其在圖書館領(lǐng)域的相關(guān)研究

      綜合相關(guān)研究[3-4],用戶留存分析起源于經(jīng)濟(jì)學(xué)和管理學(xué)領(lǐng)域,用于定量分析用戶經(jīng)過(guò)一段時(shí)間仍舊繼續(xù)使用該產(chǎn)品或服務(wù)的行為,在給定的統(tǒng)計(jì)時(shí)間窗口內(nèi),留存用戶占新增用戶的比例即為用戶留存率,它是體現(xiàn)產(chǎn)品或服務(wù)是否具備可持續(xù)發(fā)展和用戶黏性的重要指標(biāo)。傳統(tǒng)市場(chǎng)營(yíng)銷中,業(yè)務(wù)增長(zhǎng)重心在于獲取新用戶。隨著移動(dòng)互聯(lián)網(wǎng)和大數(shù)據(jù)迅猛發(fā)展,用戶對(duì)同質(zhì)產(chǎn)品和服務(wù)的選擇和獲取途徑得到極大豐富,用戶流量紅利逐漸消失,用戶增長(zhǎng)從“流量”轉(zhuǎn)變到“留量”,用戶留存率被視為用戶增長(zhǎng)的關(guān)鍵指標(biāo)[5],尤其忠誠(chéng)用戶的留存行為特征被列入傳統(tǒng)平臺(tái)邁入轉(zhuǎn)型和升級(jí)的重要參照[6]。用戶留存分析陸續(xù)被運(yùn)用于旅游網(wǎng)站[7]、學(xué)術(shù)虛擬社區(qū)[8]、移動(dòng)App[9]等領(lǐng)域,學(xué)者們不斷探索運(yùn)用各種模型或算法分析和識(shí)別用戶留存的關(guān)鍵行為特征??v觀既有研究,它們以用戶生命周期為主線,挖掘業(yè)務(wù)關(guān)鍵節(jié)點(diǎn)的用戶留存行為,推動(dòng)用戶拉新、促活和留存,提高服務(wù)營(yíng)銷收益。

      高校館用戶留存研究集中在平臺(tái)服務(wù)、閱讀推廣和移動(dòng)閱讀等。平臺(tái)服務(wù)方面,劉薇[10]調(diào)研廣州大學(xué)城13所高校館微信公眾號(hào)的用戶運(yùn)營(yíng)情況,探討提高用戶獲取、留存和活躍度的公眾號(hào)運(yùn)營(yíng)策略。閱讀推廣方面,任運(yùn)月等[11]以閱讀推廣活動(dòng)的用戶“拉新”“留存”“促活”作為目標(biāo)維度,調(diào)查40所圖書館采用不同運(yùn)營(yíng)策略及其與實(shí)現(xiàn)目標(biāo)的關(guān)系;戴和忠等[12]提出基于用戶閱讀行為的圖書質(zhì)量評(píng)測(cè)算法,將用戶留存數(shù)據(jù)作為重要指標(biāo)。移動(dòng)閱讀方面,鄭德俊等[13]、明均仁等[14]基于扎根理論設(shè)計(jì)用戶訪談,通過(guò)結(jié)構(gòu)方程模型分析影響“微信讀書”“超星移動(dòng)圖書館”這兩個(gè)移動(dòng)閱讀平臺(tái)用戶流失的主要因素,探討提升用戶留存率、預(yù)防用戶流失的對(duì)策;朱雅彬[15]在用戶調(diào)研基礎(chǔ)上,通過(guò)SVM算法識(shí)別移動(dòng)圖書館用戶流失特征,提出用戶留存對(duì)策。

      綜上所述,用戶留存作為衡量服務(wù)質(zhì)量和需求匹配度的核心指標(biāo),研究范式走向系統(tǒng)化,從單純統(tǒng)計(jì)分析發(fā)展到數(shù)據(jù)挖掘、模型深度運(yùn)用。它聚焦了用戶生命周期的產(chǎn)品認(rèn)知、用戶促活、留存與轉(zhuǎn)化等,這種以數(shù)據(jù)驅(qū)動(dòng)結(jié)合業(yè)務(wù)場(chǎng)景和用戶行為特征來(lái)洞察用戶留存關(guān)鍵影響因素的研究模式契合圖書館提高精準(zhǔn)服務(wù)水平的現(xiàn)實(shí)需要與轉(zhuǎn)型探索,可以為開展精準(zhǔn)化服務(wù)帶來(lái)基于數(shù)據(jù)驅(qū)動(dòng)的輔助決策。但是,高校館用戶留存研究還停留在引入相關(guān)概念對(duì)服務(wù)方式展開定性分析;定量實(shí)證方面,更多是基于主觀意識(shí)層面的訪談和調(diào)研;僅有的基于用戶行為分析也只是將用戶留存作為評(píng)測(cè)圖書質(zhì)量的一個(gè)指標(biāo)。此外,多從用戶流失角度出發(fā),反向探討提高用戶留存的策略,鮮有從用戶留存分析角度展開,也未有文獻(xiàn)利用數(shù)據(jù)尋找影響用戶留存的核心要素和分群開展精準(zhǔn)營(yíng)銷的方法。鑒于此,本研究嘗試以高校館的戰(zhàn)略目標(biāo)和業(yè)務(wù)服務(wù)場(chǎng)景為出發(fā)點(diǎn),以數(shù)據(jù)驅(qū)動(dòng)用戶增長(zhǎng)的研究視角構(gòu)建圖書館業(yè)務(wù)情境下的用戶留存分析框架,并選取具備全量數(shù)據(jù)特征的典型業(yè)務(wù)實(shí)踐作為實(shí)證研究對(duì)象,探索基于用戶行為數(shù)據(jù)的留存行為特征識(shí)別和用戶分群,為高校館在資源與服務(wù)定位、用戶維系和創(chuàng)新服務(wù)等方面提供精準(zhǔn)化服務(wù)的決策輔助。

      1.2 用戶生命周期與同期群分析

      用戶留存貫穿于用戶與產(chǎn)品或服務(wù)交互的全過(guò)程。在用戶生命周期的不同階段均有用戶留存的關(guān)鍵行為特征。為識(shí)別和區(qū)分不同生命周期階段的用戶留存,典型分析框架采用同期群分析算法(Cohort Analysis)[16],以具有某種共同的行為特征、同處于某一相同時(shí)期兩個(gè)維度進(jìn)行用戶識(shí)別,具備這兩個(gè)特征的用戶稱為一個(gè)同期群。

      確定時(shí)間劃分標(biāo)準(zhǔn)是同期群分析的關(guān)鍵,各領(lǐng)域根據(jù)用戶在服務(wù)場(chǎng)景中的交互特征確立分期時(shí)間標(biāo)準(zhǔn),如互聯(lián)網(wǎng)營(yíng)銷用戶留存時(shí)間劃分通常有次日留存、7日留存和五周留存3類[17]。然而在大數(shù)據(jù)環(huán)境下,區(qū)分不同用戶的需求和行為特征更多是通過(guò)消費(fèi)者的具體行為和建立新的以用戶生命周期為基礎(chǔ)的模型來(lái)完成分析。以行為數(shù)據(jù)變動(dòng)并動(dòng)態(tài)修正的NES模型[18]認(rèn)為,可以通過(guò)用戶產(chǎn)品使用周期,將用戶類型分為新用戶N(New Customer)、主力用戶E(Existing Customer)和睡眠用戶S(Sleep Customer)等時(shí)長(zhǎng)區(qū)間。其中睡眠用戶可動(dòng)態(tài)分級(jí)為瞌睡用戶S1、半睡用戶S2及沉睡用戶S3等時(shí)長(zhǎng)。故此,基于高校館用戶服務(wù)的實(shí)際業(yè)務(wù)場(chǎng)景,本文將同期群分析與NES模型的大數(shù)據(jù)營(yíng)銷模式相結(jié)合,基于數(shù)據(jù)驅(qū)動(dòng)識(shí)別和劃分不同的用戶留存區(qū)間值。

      1.3 基于RFM模型的用戶留存分群

      開展用戶留存分析的最終目標(biāo)是實(shí)現(xiàn)分群的精準(zhǔn)化營(yíng)銷,提升服務(wù)效益。精準(zhǔn)化營(yíng)銷的前提是基于數(shù)據(jù)挖掘的用戶細(xì)分。因此,基于數(shù)據(jù)驅(qū)動(dòng)的用戶留存分析需要在用戶行為數(shù)據(jù)集分析的基礎(chǔ)上建立用戶留存分群標(biāo)準(zhǔn),結(jié)合業(yè)務(wù)場(chǎng)景進(jìn)一步描述和分析影響用戶留存的行為指標(biāo)體系。在用戶細(xì)分研究領(lǐng)域,RFM模型是經(jīng)典的基于數(shù)據(jù)分析的用戶分群模型,通過(guò)R(Recency,最近一次消費(fèi))、F(Frequency,消費(fèi)頻率)、M(Monetary,消費(fèi)金額)3個(gè)指標(biāo)的組合來(lái)劃分用戶群體,是衡量用戶價(jià)值的重要工具[19]。該模型廣泛應(yīng)用于客戶關(guān)系管理分析,并在使用過(guò)程中衍生出眾多改進(jìn)的RFM模型。在圖書館領(lǐng)域,對(duì)RFM模型的改進(jìn)主要用于熱門圖書評(píng)價(jià)[20]、圖書館用戶畫像[21]等研究。為有效描述圖書館各項(xiàng)業(yè)務(wù)的用戶留存關(guān)鍵行為要素,本研究將以RFM模型為指標(biāo)體系基礎(chǔ),結(jié)合用戶生命周期和服務(wù)復(fù)用周期等行為特征進(jìn)行指標(biāo)重構(gòu),從而全面描述圖書館服務(wù)的用戶留存行為標(biāo)簽體系。

      2 研究設(shè)計(jì)

      2.1 實(shí)證分析思路和框架設(shè)計(jì)

      在確立同期群分析的區(qū)間劃分之后,根據(jù)高校館業(yè)務(wù)場(chǎng)景和可獲取的用戶行為特征構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的用戶留存分析框架,見圖1。在該分析框架中,以高校館提升各項(xiàng)服務(wù)的用戶留存率為戰(zhàn)略目標(biāo),根據(jù)業(yè)務(wù)服務(wù)目標(biāo)自上而下分解用戶留存行為的核心指標(biāo),繼而對(duì)接業(yè)務(wù)系統(tǒng)平臺(tái)定義和抽取數(shù)據(jù)字段;然后,采集、清洗和存儲(chǔ)與此相關(guān)的用戶行為數(shù)據(jù),以同期群分析法劃分和確立用戶留存區(qū)間范圍,繼而以用戶價(jià)值模型為基礎(chǔ)重構(gòu)用戶留存的行為標(biāo)簽體系;采用聚類分析探究不同用戶留存群體的分群和特征差異,最后討論不同分群的留存行為特征及與其相適宜的營(yíng)銷服務(wù)策略。

      圖1 高校圖書館的用戶留存實(shí)證分析框架

      2.2 用戶留存行為指標(biāo)體系構(gòu)建

      為描述不同用戶留存階段的行為特征,從用戶維系、用戶忠誠(chéng)和用戶價(jià)值等視角出發(fā),以衡量用戶價(jià)值的RFM模型作為指標(biāo)體系基礎(chǔ),將用戶生命周期和服務(wù)復(fù)用周期融入RFM模型進(jìn)行指標(biāo)重構(gòu),組成用戶留存行為標(biāo)簽體系。指標(biāo)R為用戶最近一次使用圖書館該項(xiàng)服務(wù)的時(shí)間,指標(biāo)F為用戶在選定時(shí)間段內(nèi)使用該項(xiàng)服務(wù)的次數(shù),這兩項(xiàng)指標(biāo)的變化體現(xiàn)用戶留存行為的異動(dòng)狀況;指標(biāo)M改造為指標(biāo)C,衡量用戶使用該項(xiàng)服務(wù)付出的等待時(shí)間成本;新加入的指標(biāo)L(用戶生命周期)體現(xiàn)用戶的服務(wù)忠誠(chéng)度,表征用戶與服務(wù)之間的黏性;指標(biāo)S(服務(wù)復(fù)用周期)則體現(xiàn)用戶二次使用服務(wù)的時(shí)間間隔,是衡量用戶留存行為的關(guān)鍵指標(biāo)和開展?fàn)I銷服務(wù)的最佳時(shí)間節(jié)點(diǎn)。最終的用戶留存行為標(biāo)簽體系如圖2所示。

      圖2 高校圖書館用戶留存行為指標(biāo)的RFCLS體系

      3 實(shí)證分析

      3.1 實(shí)證對(duì)象選取和戰(zhàn)略目標(biāo)

      本文選取一站式資源檢索平臺(tái)——福建省高校數(shù)字圖書館(以下簡(jiǎn)稱“FULink”)文獻(xiàn)提供系統(tǒng)為用戶留存分析的實(shí)證對(duì)象,該平臺(tái)整合了課題組所在館的館藏?cái)?shù)字資源,通過(guò)共建共享模式向用戶提供一站式的資源檢索、瀏覽和文獻(xiàn)提供服務(wù),是用戶獲取各類學(xué)術(shù)資源的重要入口,支持用戶快速獲取館藏的各類數(shù)字資源,也提供缺藏資源的文獻(xiàn)提供服務(wù)。以此平臺(tái)開展基于數(shù)據(jù)驅(qū)動(dòng)的用戶留存分析實(shí)證研究,既是探索提升平臺(tái)使用率、用戶復(fù)用率以及服務(wù)可持續(xù)發(fā)展的重要途徑之一,也能發(fā)現(xiàn)和獲取影響平臺(tái)可持續(xù)增長(zhǎng)的關(guān)鍵因素。根據(jù)圖1的用戶留存分析框架,在平臺(tái)日志系統(tǒng)采集用戶行為的全量數(shù)據(jù),通過(guò)基于NES模型的同期群分析法和圖2所示的RFCLS行為標(biāo)簽體系識(shí)別和獲取用戶留存行為的特征數(shù)據(jù),據(jù)此分析和討論契合于不同用戶留存階段的營(yíng)銷服務(wù)策略。

      3.2 數(shù)據(jù)采集和描述性統(tǒng)計(jì)分析

      根據(jù)文獻(xiàn)提供服務(wù)的業(yè)務(wù)流程,通過(guò)Web開發(fā)者工具抓取FULink的日志頁(yè)面,對(duì)每條行為數(shù)據(jù)進(jìn)行HTML代碼解析,以用戶留存分析的數(shù)據(jù)集需求設(shè)計(jì)10個(gè)存儲(chǔ)字段。字段分為兩類:一是文獻(xiàn)申請(qǐng)用戶的行為信息,包含申請(qǐng)ID、申請(qǐng)郵箱、申請(qǐng)時(shí)間、申請(qǐng)標(biāo)題和申請(qǐng)文獻(xiàn)類型;二是文獻(xiàn)提供的響應(yīng)信息,包含響應(yīng)狀態(tài)、響應(yīng)題名、響應(yīng)成員館、響應(yīng)時(shí)間和響應(yīng)文獻(xiàn)類型。為獲取上述確立的文獻(xiàn)提供服務(wù)相關(guān)字段數(shù)據(jù)集,通過(guò)編寫爬蟲代碼,調(diào)用xml2和rvest函數(shù)包將獲取的行為數(shù)據(jù)逐條按照字段爬取,利用cbnid函數(shù)組配為數(shù)據(jù)框(DataFrame)格式,依次采集和導(dǎo)入到MySQL數(shù)據(jù)庫(kù)存儲(chǔ)。對(duì)各字段進(jìn)行缺失值、異常值、空值處理及字段類型轉(zhuǎn)換,共獲取近5年(2016-2020)38,126名用戶文獻(xiàn)申請(qǐng)共計(jì)458,035條。

      在Jupyter Notebook數(shù)據(jù)分析平臺(tái)上連接MySQL數(shù)據(jù)庫(kù)讀取用戶行為數(shù)據(jù),以用戶名為關(guān)鍵詞索引統(tǒng)計(jì)文獻(xiàn)申請(qǐng)數(shù)來(lái)看,四分位數(shù)為(1,2,8,6363),均值13大于Q3分位數(shù)8,這說(shuō)明總體差異較大,存在部分文獻(xiàn)服務(wù)需求極強(qiáng)的用戶。而從每篇文獻(xiàn)的響應(yīng)時(shí)效來(lái)看,其統(tǒng)計(jì)四分位數(shù)為(3,5,6,7474),均值12(小時(shí))遠(yuǎn)大于Q3分位數(shù)6,說(shuō)明響應(yīng)時(shí)效總體差異較大,大部分的文獻(xiàn)響應(yīng)時(shí)效有待提升。以每個(gè)自然月為觀察窗口,計(jì)算每月文獻(xiàn)提供數(shù)量和月增長(zhǎng)率并繪制增長(zhǎng)曲線,如圖3所示,文獻(xiàn)提供數(shù)量和月增長(zhǎng)率均呈季節(jié)性波動(dòng)變化且逐步下降。

      圖3 FULink文獻(xiàn)提供服務(wù)的月增長(zhǎng)率及每月文獻(xiàn)提供數(shù)量曲線圖

      3.3 用戶生命周期和服務(wù)復(fù)用周期的挖掘分析

      在用戶行為數(shù)據(jù)集通過(guò)計(jì)算增加“用戶初次使用時(shí)間”“最后一次使用時(shí)間”兩個(gè)字段,相減獲取本次實(shí)證時(shí)間統(tǒng)計(jì)窗口內(nèi)每個(gè)用戶的生命周期值。對(duì)數(shù)據(jù)集以用戶名和申請(qǐng)文獻(xiàn)日期為索引組合升序排序,對(duì)每個(gè)用戶依次統(tǒng)計(jì)其首次使用日期,新增FirstRequestDate列加入數(shù)據(jù)集。新增RetentionDays字段用于存放下一條文獻(xiàn)提供記錄的申請(qǐng)日期與FirstRequestDate字段的時(shí)間差值,并轉(zhuǎn)換為天數(shù),即為每個(gè)用戶的服務(wù)復(fù)用周期值。其均值、四分位數(shù)等數(shù)據(jù)特征見表1。

      表1 FULink文獻(xiàn)提供服務(wù)的用戶生命周期和服務(wù)復(fù)用周期的值分布(單位:天)

      從表1第二列看出,用戶生命周期均值為181天,中位數(shù)為3天,說(shuō)明部分生命周期很長(zhǎng)的忠實(shí)用戶拉高均值。生命周期值為0天的用戶占46.7%,這部分用戶沒有留存,僅使用一次服務(wù)就流失了。去除這部分用戶比例,用戶生命周期均值為339天。匯總留存用戶的生命周期值分布發(fā)現(xiàn),1-90天用戶數(shù)占比35%,遠(yuǎn)高于90-181天的12%;37%用戶的生命周期集中在0.5-2年,屬于較高質(zhì)量客戶;生命周期在2年以上有15.8%的用戶群體,他們擁有極高的用戶粘性。

      從表1第三列看出,用戶服務(wù)復(fù)用周期均值為92天,中位數(shù)為45天,說(shuō)明大部分用戶的服務(wù)復(fù)用時(shí)間間隔集中在1.5個(gè)月以內(nèi)。進(jìn)一步統(tǒng)計(jì),32.7%用戶集中在1-7天,52.5%用戶集中在17天(Q1分位數(shù)),說(shuō)明大部分的用戶在半個(gè)月左右會(huì)再次使用文獻(xiàn)提供服務(wù)。

      根據(jù)NES理論,以45天為文獻(xiàn)提供服務(wù)的復(fù)用周期單元值,結(jié)合實(shí)際使用場(chǎng)景分為新用戶、存量用戶和沉睡用戶等不同時(shí)長(zhǎng)區(qū)間,存量用戶區(qū)間還細(xì)分為主力用戶E0、瞌睡用戶S1和半沉睡用戶S2等不同周期值,其NES周期值分布情況見表2。

      表2 FULink文獻(xiàn)提供服務(wù)的用戶NES周期值分布

      3.4 同期群分析

      根據(jù)前述確立用戶留存分析的框架思路,將用戶生命周期和服務(wù)復(fù)用NES周期各區(qū)間時(shí)長(zhǎng)值相結(jié)合按時(shí)序排列,確立以(0,7,30,45,60,90,180,242,365,1462)為初始留存區(qū)間端點(diǎn),通過(guò)同期群分析計(jì)算用戶的留存區(qū)間分布情況。左側(cè)閉區(qū)間表示全為使用2次及以上的留存用戶。留存區(qū)間計(jì)算過(guò)程如下:利用Pandas的數(shù)據(jù)分箱cut函數(shù)對(duì)RetentionDays字段依次進(jìn)行(0,7,30,45,60,90,180,242,365,1462)的同期群留存區(qū)間統(tǒng)計(jì),統(tǒng)計(jì)結(jié)果如表3所示。從表3來(lái)看,文獻(xiàn)提供服務(wù)的年留存率達(dá)到35%。除周留存率和月留存率相對(duì)穩(wěn)定之外,其余區(qū)間的用戶留存率處于波動(dòng)變化中,留存率最低降到13.1%,但文獻(xiàn)申請(qǐng)均值最高增長(zhǎng)到19篇。其中,主力用戶E0區(qū)間的留存率整體較低,瞌睡用戶S1區(qū)間的留存率最高,這說(shuō)明可以在上述這些用戶留存區(qū)間節(jié)點(diǎn)上探索通過(guò)各種用戶促活手段來(lái)提升用戶留存率的途徑。

      表3 用戶留存區(qū)間的各項(xiàng)留存指標(biāo)值

      3.5 用戶留存行為的聚類分析

      3.5.1 數(shù)據(jù)獲取

      依據(jù)前述構(gòu)建的文獻(xiàn)提供服務(wù)用戶留存行為標(biāo)簽體系RFCLS,對(duì)每個(gè)指標(biāo)的用戶行為數(shù)據(jù)獲取定義如表4所示。指標(biāo)R通過(guò)統(tǒng)計(jì)其最后一次文獻(xiàn)獲取時(shí)間再與時(shí)間窗口截止日期進(jìn)行相減來(lái)獲取,指標(biāo)F利用統(tǒng)計(jì)函數(shù)sum()對(duì)各時(shí)間窗口期的每個(gè)用戶的文獻(xiàn)獲取數(shù)量進(jìn)行求和,指標(biāo)C則通過(guò)匯總計(jì)算每個(gè)用戶的平均等待時(shí)間成本來(lái)獲取,指標(biāo)L通過(guò)計(jì)算用戶首末兩次文獻(xiàn)獲取時(shí)間的差值來(lái)獲取,其中同一天多次使用視為一次。指標(biāo)S的數(shù)據(jù)獲取方法是以用戶名為索引,按照升序排序后計(jì)算服務(wù)復(fù)用的間隔天數(shù)。這5個(gè)指標(biāo)從用戶留存意愿、用戶粘性、使用頻次、用戶沉沒成本和服務(wù)復(fù)用等方面描述文獻(xiàn)提供服務(wù)的用戶留存特征。

      表4 文獻(xiàn)提供服務(wù)的用戶留存行為指標(biāo)定義

      3.5.2 聚類分析

      根據(jù)用戶留存行為指標(biāo)體系,對(duì)現(xiàn)有數(shù)據(jù)集按設(shè)計(jì)字段抽取相應(yīng)數(shù)據(jù)匯聚成每個(gè)用戶的留存行為特征集,在Jupyter Notebook平臺(tái)連接MySQL導(dǎo)入數(shù)據(jù)并展開聚類前的描述性統(tǒng)計(jì)分析,見表5。各行為指標(biāo)數(shù)值的標(biāo)準(zhǔn)方差和均值較大,呈現(xiàn)右偏態(tài)分布。通過(guò)Corr函數(shù)對(duì)上述5個(gè)行為指標(biāo)進(jìn)行相關(guān)性分析,各變量之間相關(guān)系數(shù)均<0.4,變量之間獨(dú)立,非常適宜采用Kmeans聚類分析。從表5看,個(gè)別指標(biāo)變量取值差異較大。為取消量綱不一致的影響,采用Standard Scaler函數(shù)對(duì)所有待聚類數(shù)據(jù)標(biāo)準(zhǔn)化和歸一化處理,通過(guò)縮放特征達(dá)到最終聚類結(jié)果的量綱一致。

      表5 用戶留存行為指標(biāo)變量描述性統(tǒng)計(jì)(2016.01-2019.12)

      Kmeans聚類是一種無(wú)監(jiān)督學(xué)習(xí)的算法,考慮到實(shí)證數(shù)據(jù)集存在右偏態(tài)分布,易產(chǎn)生極值離群點(diǎn)干擾。為確保實(shí)證聚類結(jié)果輔助業(yè)務(wù)決策的可行性,參照相關(guān)聚類分析,采用多次使用隨機(jī)種子確定待選的簇?cái)?shù),以Elbow肘曲線法結(jié)合輪廓系數(shù)(Silhouette Coefficient)評(píng)價(jià)方式共同確立最佳聚類[22]。采用機(jī)器學(xué)習(xí)Scikit-learn庫(kù)的Kmeans算法,初始設(shè)定聚類個(gè)數(shù)為2~9,模型運(yùn)算結(jié)果見圖4(a)。隨著K值遞增,最佳聚類數(shù)為3~9個(gè),而通過(guò)輪廓系數(shù)發(fā)現(xiàn)K=4時(shí),silhouette score為0.4。圖4(b)顯示,除第一個(gè)聚類少量樣本的輪廓系數(shù)<0,整體聚類結(jié)果的分離度較好。故此,本次實(shí)證選取聚類個(gè)數(shù)K=4。

      圖4 Kmeans聚類分析的Eblow肘方法及輪廓系數(shù)評(píng)價(jià)結(jié)果圖

      3.5.3 群體差異分析

      經(jīng)Kmeans聚類分析后,根據(jù)用戶在RFCLS五個(gè)留存行為指標(biāo)的特征差異命名4個(gè)聚類群,聚類結(jié)果的中心值見表6。在Jupyter Notebook平臺(tái)通過(guò)statsmodels庫(kù)中的anova_lm函數(shù)對(duì)4個(gè)聚類群體展開方差分析,5個(gè)用戶留存行為指標(biāo)均存在顯著差異。在同期群分析獲取的各區(qū)間段上,周留存、當(dāng)月留存、90天留存和半年留存等區(qū)間均存在顯著差異。從表6所顯示的最終聚類中心看出,聚類影響較大的指標(biāo)C、指標(biāo)F和指標(biāo)S等3個(gè)行為指標(biāo)對(duì)于聚類劃分起著顯著的分群作用。上述5個(gè)用戶留存行為指標(biāo)的分析結(jié)果可以用雷達(dá)圖(見圖5)表示出來(lái)。

      表6 文獻(xiàn)提供服務(wù)不同用戶留存群體的最終聚類中心

      圖5 FULink文獻(xiàn)提供服務(wù)用戶留存群體的行為指標(biāo)雷達(dá)圖

      4 不同用戶留存群體的特征描述及營(yíng)銷服務(wù)策略討論

      實(shí)證結(jié)果表明,F(xiàn)ULink文獻(xiàn)提供服務(wù)的文獻(xiàn)數(shù)量和月增長(zhǎng)率均呈季節(jié)性逐步下降,年用戶留存率35%,統(tǒng)計(jì)時(shí)間窗口內(nèi)的用戶生命周期為1年左右?;贜ES理論分析的服務(wù)復(fù)用周期分布規(guī)律顯示,周留存、月留存、半年留存等區(qū)間是提升用戶留存率的最佳節(jié)點(diǎn)。研究數(shù)據(jù)表明,用戶留存提高5%,服務(wù)收益就會(huì)提高25%[23]。本次實(shí)證分析顯示,用戶留存曲線的持續(xù)走低,說(shuō)明該資源服務(wù)平臺(tái)與用戶需求的匹配已出現(xiàn)不平衡,急需根據(jù)不同用戶留存群體的特征差異實(shí)施精準(zhǔn)化營(yíng)銷服務(wù)。故此,對(duì)上述4個(gè)聚類展開用戶留存群體的特征畫像描述,繼而討論與之相適宜的營(yíng)銷服務(wù)策略。

      4.1 聚類1:拉新用戶群

      此類用戶留存群體占比最大,屬于新用戶類型,RFCLS等5個(gè)指標(biāo)的聚類中心特征值較低,用戶生命周期均值為180天,32.7%用戶生命周期在半年以上。周留存率為37.8%,月留存率為34.5%,文獻(xiàn)數(shù)的均值為57篇,響應(yīng)時(shí)效均值為13小時(shí)。從用戶服務(wù)復(fù)用的時(shí)間區(qū)域分布看,間隔15天用戶占比50%,隨后就進(jìn)入睡眠狀態(tài)或者直接流失,該群體在本次實(shí)證時(shí)間窗口內(nèi)用戶留存率為10%。而通過(guò)對(duì)已獲取文獻(xiàn)的學(xué)科主題展開文本匯聚挖掘,中文文獻(xiàn)需求集中于“計(jì)算機(jī)科學(xué)、土木工程、電子商務(wù)、物流、物聯(lián)網(wǎng)、供應(yīng)鏈、復(fù)合材料”等研究領(lǐng)域,英文文獻(xiàn)需求集中于“智能控制、心理學(xué)、微生物、分析化學(xué)”等研究領(lǐng)域。

      拉新用戶群的顯著特征為快速下降的用戶留存率,應(yīng)圍繞周留存、15天留存和月留存等關(guān)鍵節(jié)點(diǎn)實(shí)施服務(wù)營(yíng)銷,加強(qiáng)核心服務(wù)功能的使用引導(dǎo)和用戶交互的及時(shí)反饋,觸發(fā)用戶完成關(guān)鍵行為,激活用戶認(rèn)可服務(wù)的核心價(jià)值。例如通過(guò)開拓用戶成長(zhǎng)的積分增長(zhǎng)體系不斷激發(fā)用戶對(duì)平臺(tái)的使用,持續(xù)滿足用戶在資源獲取服務(wù)場(chǎng)景中的使用需求,解決用戶在其他同質(zhì)平臺(tái)獲取缺藏資源的時(shí)效痛點(diǎn),推動(dòng)拉新用戶向平穩(wěn)留存群轉(zhuǎn)化。

      4.2 聚類2:選擇留存群

      此類用戶群屬于存量用戶類型,指標(biāo)L和指標(biāo)S聚類中心特征值較高,服務(wù)復(fù)用的間隔時(shí)間均在223天以后,生命周期均值為2年,可見該用戶群體的活躍度較低。文獻(xiàn)數(shù)的均值為69篇,響應(yīng)時(shí)效均值為9小時(shí)。相較于拉新用戶群,這兩個(gè)指標(biāo)均有提升,而且該群體在實(shí)證時(shí)間窗口內(nèi)用戶留存率為88%。對(duì)篇名、文獻(xiàn)類型等挖掘匯聚顯示,中外文獻(xiàn)數(shù)量比例為2∶1,期刊論文、學(xué)位論文等文獻(xiàn)類型需求較多,“人工智能、土木工程、云計(jì)算、物聯(lián)網(wǎng)、公共管理、化學(xué)化工”等研究領(lǐng)域的文獻(xiàn)居多。

      基于“留存率高、活躍度低”的留存行為特征,應(yīng)采用用戶激勵(lì)和提高互動(dòng)的促活營(yíng)銷策略提升用戶留存率。例如在各類資源服務(wù)場(chǎng)景中提供多種用戶接觸點(diǎn),強(qiáng)化核心功能指引和觸發(fā)服務(wù)復(fù)用頻次,培養(yǎng)用戶的使用習(xí)慣和平臺(tái)功能發(fā)掘的能力,輔助簽到、積分和等級(jí)成長(zhǎng)等用戶激勵(lì)機(jī)制提高活躍度,讓用戶一有資源獲取需求就立即聯(lián)想到平臺(tái),推動(dòng)用戶向平穩(wěn)留存群轉(zhuǎn)化。

      4.3 聚類3:平穩(wěn)留存群

      此類用戶群屬于忠誠(chéng)用戶類型,指標(biāo)R、指標(biāo)F和指標(biāo)L聚類中心特征值較高,用戶生命周期均值為2.6年,文獻(xiàn)數(shù)的均值為362篇,服務(wù)復(fù)用間隔時(shí)間為39天,響應(yīng)時(shí)效均值為13小時(shí),用戶活躍度最高,該分群在本次實(shí)證時(shí)間窗口內(nèi)用戶留存率為95%。對(duì)篇名、文獻(xiàn)類型等挖掘匯聚顯示,中外文獻(xiàn)數(shù)量比例為4∶1,期刊論文、學(xué)位論文、電子圖書等文獻(xiàn)類型需求最多,研究領(lǐng)域集中在“土木工程、材料科學(xué)與工程、產(chǎn)業(yè)經(jīng)濟(jì)、大數(shù)據(jù)、物聯(lián)網(wǎng)、算法模型、化學(xué)化工”等。

      上述留存行為指標(biāo)表明該群體形成了較好的價(jià)值感知和品牌忠誠(chéng)。但優(yōu)化用戶體驗(yàn)和擴(kuò)展多元化的服務(wù)場(chǎng)景,沉淀用戶儲(chǔ)值成本和滿足個(gè)性化需求,才能提升服務(wù)品牌力和用戶忠誠(chéng)度,進(jìn)而減少用戶流失。對(duì)于平穩(wěn)留存的忠誠(chéng)用戶群體,持續(xù)提升文獻(xiàn)響應(yīng)時(shí)效是第一要素,并將一站式檢索、資源整合揭示、文獻(xiàn)分析與可視化等功能深度融入其資源獲取情境之中,根據(jù)用戶訪談、問(wèn)卷調(diào)研等形式獲取新功能需求,做好功能迭代與平臺(tái)升級(jí),持續(xù)輸出服務(wù)價(jià)值才能保持用戶留存。

      4.4 聚類4:流失用戶群

      此類用戶群屬于易流失用戶類型,指標(biāo)R聚類中心特征值最大,服務(wù)復(fù)用間隔時(shí)間為33天,其中(365,1462]區(qū)間僅有30%,生命周期均值為1.1年,響應(yīng)時(shí)效均值為386小時(shí),但是文獻(xiàn)數(shù)的均值為88篇,這說(shuō)明該聚類群體的短期文獻(xiàn)獲取需求強(qiáng)烈,響應(yīng)時(shí)效均值較長(zhǎng)引起用戶流失,該群體在本次實(shí)證時(shí)間窗口內(nèi)用戶留存率為29.3%。挖掘匯聚顯示,中外文獻(xiàn)數(shù)量比例為3∶1,期刊論文和學(xué)位論文等文獻(xiàn)類型需求最多,研究領(lǐng)域集中在“化工材料、企業(yè)管理、跨境電商、知識(shí)產(chǎn)權(quán)”等。

      上述流失用戶群的留存行為特征表明該群體存在短期獲取數(shù)字資源的需求,且集中于周留存和月留存區(qū)間,文獻(xiàn)響應(yīng)時(shí)效差的比例較高。故此,可以根據(jù)該群體的學(xué)科資源需求特征制定針對(duì)性的分組用戶召回策略。例如統(tǒng)計(jì)分析響應(yīng)時(shí)效差的文獻(xiàn)學(xué)科屬性,及時(shí)擴(kuò)充相應(yīng)學(xué)科領(lǐng)域的數(shù)字資源,優(yōu)化響應(yīng)時(shí)效,在開展學(xué)科服務(wù)中側(cè)重文獻(xiàn)提供服務(wù)的場(chǎng)景復(fù)現(xiàn)和服務(wù)引導(dǎo),喚醒用戶對(duì)核心服務(wù)價(jià)值的再認(rèn)知,減緩用戶留存率下降的態(tài)勢(shì)。

      5 結(jié)語(yǔ)

      結(jié)合數(shù)據(jù)驅(qū)動(dòng)的用戶留存實(shí)證,通過(guò)用戶生命周期和服務(wù)復(fù)用特征挖掘、基于NES理論的同期群分析、RFM模型指標(biāo)重構(gòu)及K-Means聚類分析等一系列數(shù)據(jù)分析方法將高校館數(shù)字資源服務(wù)的用戶留存群體劃分為拉新用戶群、選擇留存群、平穩(wěn)留存群和流失用戶群,識(shí)別和分析了影響用戶可持續(xù)增長(zhǎng)的留存行為指標(biāo),從服務(wù)場(chǎng)景定位、平臺(tái)功能升級(jí)和用戶激勵(lì)等角度給出了相適宜的營(yíng)銷服務(wù)發(fā)展策略。構(gòu)建的用戶留存分析框架為高校館業(yè)務(wù)實(shí)踐開展差異化精準(zhǔn)服務(wù)、有針對(duì)性地分配服務(wù)資源、更精準(zhǔn)地達(dá)成戰(zhàn)略目標(biāo)提供更為精準(zhǔn)化的數(shù)據(jù)支撐和決策建議。

      本研究仍具有一定的局限性:一是雖然從后臺(tái)日志采集了文獻(xiàn)提供服務(wù)的用戶行為全量數(shù)據(jù),保證了各項(xiàng)分析和用戶留存結(jié)果的普適性。但是,由于平臺(tái)尚缺乏用戶身份的認(rèn)證管理,本次實(shí)證獲取的用戶留存行為特征較為有限。未來(lái),用戶留存分析框架仍需進(jìn)一步采集和補(bǔ)充用戶在其他高校館業(yè)務(wù)平臺(tái)中更為豐富的留存行為,從而增強(qiáng)用戶留存分析在支撐高校館精準(zhǔn)營(yíng)銷服務(wù)方面的適用性。二是本次實(shí)證獲取的用戶留存和營(yíng)銷服務(wù)策略建議,還需借助后續(xù)平臺(tái)功能拓展、用戶行為數(shù)據(jù)跟蹤、模型迭代修正和疊加增量數(shù)據(jù)等方式不斷驗(yàn)證用戶留存分析支撐高校館用戶增長(zhǎng)的合理性和有效性。

      猜你喜歡
      生命周期均值聚類
      動(dòng)物的生命周期
      全生命周期下呼吸機(jī)質(zhì)量控制
      從生命周期視角看并購(gòu)保險(xiǎn)
      民用飛機(jī)全生命周期KPI的研究與應(yīng)用
      基于DBSACN聚類算法的XML文檔聚類
      均值不等式失效時(shí)的解決方法
      均值與方差在生活中的應(yīng)用
      基于改進(jìn)的遺傳算法的模糊聚類算法
      關(guān)于均值有界變差函數(shù)的重要不等式
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      广汉市| 永州市| 长葛市| 拉萨市| 姜堰市| 安阳市| 闻喜县| 秦安县| 油尖旺区| 濮阳市| 玛曲县| 长丰县| 土默特右旗| 贺州市| 贡山| 平江县| 西安市| 巫溪县| 望奎县| 江津市| 元江| 伊通| 昭平县| 武宣县| 皋兰县| 观塘区| 河源市| SHOW| 安乡县| 桦南县| 苗栗市| 德格县| 金川县| 正定县| 连江县| 岢岚县| 沁阳市| 阳曲县| 焉耆| 梅州市| 金华市|