• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      公共圖書(shū)館智能圖書(shū)采購(gòu)探索

      2023-09-15 01:56:08
      數(shù)字通信世界 2023年8期
      關(guān)鍵詞:新書(shū)書(shū)目圖譜

      楊 瀟

      (首都圖書(shū)館,北京 100021)

      “推進(jìn)文化自信自強(qiáng),鑄就社會(huì)主義文化新輝煌”[1]是二十大報(bào)告中對(duì)文化工作的綱領(lǐng)性指導(dǎo)和對(duì)文化工作者的新要求。作為公共文化服務(wù)主陣地之一,圖書(shū)館的主要職能是為群眾提供更多、更好、更具時(shí)代特色的精神文化資源。圖書(shū)的選擇是保障這一職能發(fā)揮的基礎(chǔ),直接決定著圖書(shū)館館藏質(zhì)量和服務(wù)水平。然而,當(dāng)前國(guó)內(nèi)公共圖書(shū)館的圖書(shū)采購(gòu)多以采購(gòu)人員個(gè)人的主觀意愿和經(jīng)驗(yàn)為主要依據(jù)。將新的信息技術(shù)、采購(gòu)模式和管理模式融入采購(gòu)決策過(guò)程,已成為公共圖書(shū)館未來(lái)的建設(shè)方向。

      1 圖書(shū)智能采購(gòu)模型相關(guān)研究

      早期智能化采購(gòu)的代表性模型是拉斯氏選書(shū)模型。國(guó)內(nèi)學(xué)者結(jié)合圖書(shū)館實(shí)際情況,提出了許多改進(jìn)方案[1]。例如,王積和提出了重點(diǎn)藏書(shū)和一般藏書(shū)兩個(gè)選書(shū)模型[2],胡修琦等人將選書(shū)標(biāo)準(zhǔn)分為6項(xiàng),讀者需求劃分為三級(jí),構(gòu)建了選書(shū)模型[3]。隨著大數(shù)據(jù)時(shí)代的到來(lái),新的技術(shù)和算法被引入,圖書(shū)智能采購(gòu)決策系統(tǒng)逐漸細(xì)化和深入,并從單一算法模式研究轉(zhuǎn)向多算法結(jié)合。例如,劉鴻雁等學(xué)者提出了以消費(fèi)者均衡理論為核心的資金按類(lèi)分配模型[4],趙研科利用Apriori算法和決策樹(shù)等數(shù)據(jù)挖掘算法[5],通過(guò)對(duì)用戶(hù)歷史行為記錄的挖掘,開(kāi)發(fā)了圖書(shū)采購(gòu)輔助決策系統(tǒng)。此外,許多學(xué)者利用人工智能技術(shù),如BP神經(jīng)網(wǎng)絡(luò)智能算法[6-8]、貝葉斯網(wǎng)理論[9-10]和隨機(jī)森林[11],建立不同側(cè)重點(diǎn)的采購(gòu)模型。周志強(qiáng)等學(xué)者將BP神經(jīng)網(wǎng)絡(luò)算法和SVM算法與遺傳算法GA相結(jié)合,搭建了混合智能采購(gòu)模型[12]。

      目前,智能圖書(shū)采購(gòu)模型的研究主要集中在高校圖書(shū)館領(lǐng)域,公共圖書(shū)館的采購(gòu)模型研究相對(duì)較少。然而,高校圖書(shū)館和公共圖書(shū)館在文獻(xiàn)資源館藏建設(shè)方向、讀者構(gòu)成、服務(wù)宗旨、經(jīng)費(fèi)構(gòu)成等方面存在顯著差異。如果簡(jiǎn)單地將高校圖書(shū)館的采購(gòu)模式應(yīng)用于公共圖書(shū)館,可能會(huì)導(dǎo)致選書(shū)方向上的偏差。因此,本文選擇首都圖書(shū)館2018—2022年的中文圖書(shū)采購(gòu)數(shù)據(jù)作為實(shí)驗(yàn)基礎(chǔ)源數(shù)據(jù),探索一種新的采購(gòu)模式,以信息技術(shù)為主,主觀經(jīng)驗(yàn)為輔,對(duì)公共圖書(shū)館的智能化采購(gòu)進(jìn)行探索。

      2 構(gòu)建適應(yīng)公共圖書(shū)館中文圖書(shū)采購(gòu)模型的準(zhǔn)備

      2.1 書(shū)目數(shù)據(jù)資源信息的建立

      為了實(shí)現(xiàn)批量化智能操作,我們與供貨商和出版社進(jìn)行了多次溝通和反復(fù)修改,最終確定了書(shū)目數(shù)據(jù)提供的格式規(guī)范和著錄內(nèi)容的標(biāo)準(zhǔn)化。我們統(tǒng)一了書(shū)目模板,其中包括ISBN、題名、副題名、分卷號(hào)、分卷名、叢編項(xiàng)、頁(yè)數(shù)、尺寸、分類(lèi)號(hào)、讀者對(duì)象和圖書(shū)簡(jiǎn)介。基于此,我們結(jié)合本館的館藏資源建設(shè)方針,對(duì)供貨商提供的原始書(shū)目數(shù)據(jù)進(jìn)行初步分類(lèi)智能篩選。我們制定了流程圖(見(jiàn)圖1),以便更好地比對(duì)和分析數(shù)據(jù)信息。

      圖1 圖書(shū)采購(gòu)流程圖(前期部分)

      經(jīng)過(guò)對(duì)數(shù)據(jù)的分類(lèi)篩選,可將館配商所提供的原始書(shū)目劃分成5 個(gè)新書(shū)目表。將新書(shū)目表1導(dǎo)出,以便日后定期對(duì)高碼洋圖書(shū)采購(gòu)進(jìn)行有針對(duì)性的采訪小組內(nèi)部討論。對(duì)新書(shū)目表2則按照館藏政策進(jìn)行預(yù)訂購(gòu),導(dǎo)出預(yù)訂購(gòu)數(shù)據(jù)表,采購(gòu)人員確認(rèn)后下訂。對(duì)新書(shū)目表3中的圖書(shū)按每種1冊(cè)預(yù)訂購(gòu),導(dǎo)出數(shù)據(jù)表格由采購(gòu)人員確認(rèn)后下訂。新書(shū)目表4 作為連續(xù)出版物書(shū)目,其情況相對(duì)復(fù)雜,可分為兩種情況進(jìn)行處理(見(jiàn)圖2)。最后,將新書(shū)目4處理形成的新書(shū)目表6與新書(shū)目表5進(jìn)行匯總,形成一份書(shū)目信息表格,以便進(jìn)行下一步只能采購(gòu)演算。

      表1 程序?qū)С龅?00本推薦分?jǐn)?shù)最高的圖書(shū)

      圖2 新書(shū)目表4的處理流程圖

      2.2 圖書(shū)采購(gòu)?fù)扑]算法

      圖書(shū)采購(gòu)?fù)扑]算法是公共圖書(shū)館中的一個(gè)重要算法。由于缺乏用戶(hù)行為數(shù)據(jù),傳統(tǒng)的協(xié)同過(guò)濾推薦算法無(wú)法直接應(yīng)用于圖書(shū)館的新書(shū)采購(gòu)。因此,基于內(nèi)容的推薦算法和基于知識(shí)圖譜的推薦算法成為圖書(shū)館推薦系統(tǒng)中常用的兩種算法。基于內(nèi)容的推薦算法可以根據(jù)圖書(shū)的屬性(如書(shū)名、作者、出版社、分類(lèi)等)來(lái)計(jì)算它們之間的相似性,然后推薦與歷史購(gòu)買(mǎi)的圖書(shū)相似的新圖書(shū)?;谥R(shí)圖譜推薦算法則通過(guò)建立圖書(shū)之間的關(guān)系來(lái)推薦相應(yīng)的圖書(shū)。例如,如果歷史購(gòu)買(mǎi)中有很多計(jì)算機(jī)科學(xué)類(lèi)的圖書(shū),那么可以推薦其他與計(jì)算機(jī)科學(xué)相關(guān)的圖書(shū)。

      本文將基于內(nèi)容的推薦算法和基于知識(shí)圖譜的推薦算法相結(jié)合(見(jiàn)式(1)),可以進(jìn)一步提高推薦的準(zhǔn)確性和個(gè)性化程度。在綜合推薦分?jǐn)?shù)的計(jì)算中,可以通過(guò)調(diào)整權(quán)重因子來(lái)平衡兩種算法的影響力。例如,當(dāng)需要強(qiáng)調(diào)基于內(nèi)容的推薦算法時(shí),可以將權(quán)重因子α設(shè)定為較大的值;反之,當(dāng)需要強(qiáng)調(diào)基于知識(shí)圖譜的推薦算法時(shí),可以將權(quán)重因子α設(shè)定為較小的值。式中,表示第本新圖書(shū)的推薦分?jǐn)?shù);表示第 個(gè)新圖書(shū)與歷史采購(gòu)書(shū)目中的圖書(shū)的相似度;表示第個(gè)新圖書(shū)與歷史采購(gòu)書(shū)目中的圖書(shū)的關(guān)聯(lián)度;為調(diào)節(jié)參數(shù),用于平衡兩種算法的推薦分?jǐn)?shù)。

      3 公共圖書(shū)館中文圖書(shū)采購(gòu)智能模型的搭建

      3.1 基于內(nèi)容的推薦算法

      為了使用基于內(nèi)容的推薦算法推薦新的圖書(shū)列表,可以使用TF-IDF算法來(lái)提取每本圖書(shū)的特征向量。首先,將歷史MARC數(shù)據(jù)中的330字段和新書(shū)目中的圖書(shū)介紹內(nèi)容作為文本數(shù)據(jù),使用TF-IDF算法計(jì)算每個(gè)關(guān)鍵詞在文檔中的重要性,方法是將關(guān)鍵詞在文檔中的詞頻和逆文檔頻率相乘。然后,選取N個(gè)關(guān)鍵詞作為每本圖書(shū)的特征向量。最后,使用余弦相似度來(lái)計(jì)算每本圖書(shū)之間的相似度,余弦相似度值越大,表示兩本圖書(shū)越相似。因此,通過(guò)基于歷史書(shū)目的屬性和特征,可以從新書(shū)目中挑選出具有類(lèi)似屬性和特征的圖書(shū)。

      vectorizer = TfidfVectorizer(max_features=5000)

      book_descriptions = history_data['book_description'].fillna('')

      book_names = history_data['book_name']

      book_name_and_descriptions = book_names+ ' ' + book_descriptions

      book_features = vectorizer.fit_transform(book_

      name_and_descriptions)

      new_book_names = new_data['book_name']

      new_book_descriptions = new_data['book_description'].fillna('')

      new_book_name_and_descriptions = new_book_names + ' ' + new_book_descriptions

      new_book_features = vectorizer.transform(new_book_name_and_descriptions)

      similarity_matrix = cosine_similarity(new_book_features, book_features)

      recommendations = {}

      for i, new_book in enumerate(new_book_names):

      similarity_scores = similarity_matrix[i]

      recommendation_score = sum(similarity_scores) / len(similarity_scores)

      recommendations[new_book] = recommendation_score

      sorted_recommendations = sorted(recommendations.items(), key=lambda x: x[1], reverse=True)

      3.2 基于知識(shí)圖譜的推薦算法

      基于知識(shí)圖譜的推薦算法通過(guò)構(gòu)建一個(gè)包含每本書(shū)、其作者和出版商的圖形結(jié)構(gòu)來(lái)遴選采購(gòu)新書(shū)。與傳統(tǒng)的推薦算法不同,該算法不需要對(duì)用戶(hù)行為進(jìn)行跟蹤或收集,而是利用圖書(shū)的元數(shù)據(jù)構(gòu)建一個(gè)整體的知識(shí)圖譜。具體而言,每本圖書(shū)作為一個(gè)節(jié)點(diǎn),使用圖書(shū)的元數(shù)據(jù)作為節(jié)點(diǎn)的屬性,并通過(guò)圖書(shū)之間的關(guān)系(如作者、出版社、主題詞、分類(lèi)號(hào)等),尤其是采用相鄰歷史書(shū)籍之間的關(guān)聯(lián)來(lái)連接節(jié)點(diǎn),形成一個(gè)半結(jié)構(gòu)化的圖形數(shù)據(jù)庫(kù)。利用構(gòu)建好的知識(shí)圖譜,我們可以計(jì)算每本新書(shū)與歷史書(shū)籍之間的關(guān)聯(lián)度,從而推薦相關(guān)的圖書(shū)。例如,在推薦新書(shū)時(shí),我們可以根據(jù)新書(shū)的作者、出版商等屬性在圖譜中找到其鄰居節(jié)點(diǎn),并通過(guò)計(jì)算它們之間的邊權(quán)重來(lái)得到與新書(shū)相關(guān)的推薦書(shū)目。該算法可以幫助用戶(hù)發(fā)現(xiàn)與其喜好相關(guān)的新書(shū),同時(shí)確保用戶(hù)的隱私不受侵犯。

      graph = build_knowledge_graph(history_data)

      new_books = set(new_data['book_name'])

      recommendations2 = {}

      for book in new_books:

      if book not in graph:

      continue

      for neighbor in graph.neighbors(book):

      if neighbor != book and neighbor not in new_books:

      weight = graph[book][neighbor]['weight']

      if neighbor not in recommendations2:

      recommendations2[neighbor] = 0

      recommendations2[neighbor] += weight

      sorted_recommendations2 = sorted(recommendations2.items(), key=lambda x: x[1], reverse=True)

      def build_knowledge_graph(data):

      # 創(chuàng)建知識(shí)圖譜

      graph = nx.Graph()

      # 添加節(jié)點(diǎn)

      for _, row in data.iterrows():

      book = row['book_name']

      author = row['author']

      publisher = row['publisher']

      graph.add_node(book, bipartite='book')

      graph.add_node(author, bipartite='author')

      graph.add_node(publisher, bipartite='publisher')

      # 添加邊

      graph.add_edge(book, author, weight=1)

      graph.add_edge(book, publisher, weight=1)

      return graph

      3.3 綜合推薦分?jǐn)?shù)

      綜合基于內(nèi)容的推薦算法和基于知識(shí)圖譜的推薦算法,可以為采購(gòu)人員提供更全面和準(zhǔn)確的推薦服務(wù)。為了得到綜合推薦分?jǐn)?shù),我們使用加權(quán)平均法,其中權(quán)重參數(shù)α為0.8。該值是根據(jù)實(shí)驗(yàn)結(jié)果得到的最優(yōu)值,但對(duì)于不同的數(shù)據(jù)集,可能需要進(jìn)行調(diào)整。

      首先對(duì)基于內(nèi)容的推薦算法得到的推薦結(jié)果進(jìn)行加權(quán)平均,其中權(quán)重為0.8,然后對(duì)基于知識(shí)圖譜的推薦算法得到的推薦結(jié)果進(jìn)行加權(quán)平均,其中權(quán)重為0.2。最終,將兩者得到的推薦分?jǐn)?shù)加和,得到綜合推薦分?jǐn)?shù)。

      combined_recommendations = {}

      for book, score in sorted_recommendations:

      if book not in combined_recommendations:

      combined_recommendations[book] ={'book_score': 0.8 * score}

      else:

      combined_recommendations[book]['book_score'] += 0.8 * score

      for book, score in sorted_recommendations2:

      if book in combined_recommendations:combined_recommendations[book]['graph_score'] = 0.2 * score

      sorted_combined_recommendations =sor ted(combi ned_recom mend ations.items(),key=lambda x: x[1]['book_score'] + x[1].get('graph_score', 0), reverse=True)

      3.4 實(shí)驗(yàn)結(jié)果

      本實(shí)驗(yàn)使用了最近5年的圖書(shū)采購(gòu)數(shù)據(jù),并給定了一個(gè)新的圖書(shū)列表。基于此,我們開(kāi)發(fā)了一個(gè)推薦程序,采用基于內(nèi)容和知識(shí)圖譜的推薦方法,對(duì)給定的新書(shū)列表進(jìn)行推薦。具體而言,程序計(jì)算了每本書(shū)基于內(nèi)容和知識(shí)圖譜的推薦分?jǐn)?shù),并采用加權(quán)α值為0.8的方法對(duì)兩種推薦分?jǐn)?shù)進(jìn)行綜合評(píng)分,以得到最終的推薦分?jǐn)?shù)。最后,程序?qū)⑺型扑]的圖書(shū)按照推薦分?jǐn)?shù)進(jìn)行排序,輸出前100本推薦分?jǐn)?shù)最高的圖書(shū)(見(jiàn)表格1)。

      通過(guò)本實(shí)驗(yàn)的結(jié)果可以發(fā)現(xiàn),該推薦程序能夠找到那些與給定書(shū)籍具有相似主題和內(nèi)容的書(shū)籍,同時(shí)還能考慮到知識(shí)圖譜中的關(guān)聯(lián)性。這表明,當(dāng)推薦系統(tǒng)利用基于內(nèi)容和知識(shí)圖譜的推薦方法進(jìn)行綜合評(píng)估時(shí),能夠?yàn)樽x者提供更加個(gè)性化和精準(zhǔn)的推薦服務(wù)。值得一提的是,該推薦系統(tǒng)還具有一定的健壯性(Robustness),能夠在不同的α值下表現(xiàn)出不錯(cuò)的推薦效果。為了驗(yàn)證推薦系統(tǒng)的性能,我們還進(jìn)行了一些額外的實(shí)驗(yàn)。具體來(lái)說(shuō),我們分別在不同的α值下進(jìn)行實(shí)驗(yàn),發(fā)現(xiàn)在α值為0.8時(shí),推薦系統(tǒng)的性能最佳。這進(jìn)一步證實(shí)了該程序的有效性和實(shí)用性。

      4 結(jié)束語(yǔ)

      隨著人工智能技術(shù)的不斷發(fā)展,它為圖書(shū)館各項(xiàng)業(yè)務(wù)的創(chuàng)新升級(jí)提供了新的思路與方式。作為一名新時(shí)代的圖書(shū)館采購(gòu)人員,我們需要緊跟時(shí)代的發(fā)展,不斷加深對(duì)人工智能的學(xué)習(xí)與研究,并結(jié)合圖書(shū)館的圖書(shū)采購(gòu)流程,探索其應(yīng)用的結(jié)合點(diǎn)和突破點(diǎn),助力傳統(tǒng)圖書(shū)采購(gòu)工作的轉(zhuǎn)型。同時(shí),隨著用戶(hù)行為數(shù)據(jù)的引入,我們可以應(yīng)用更多的智能算法,如協(xié)同過(guò)濾、深度學(xué)習(xí)等,從而進(jìn)一步提高推薦算法的準(zhǔn)確性和可靠性。在未來(lái),我們可以逐步引入各大權(quán)威圖書(shū)榜單的實(shí)時(shí)數(shù)據(jù)等內(nèi)容,使圖書(shū)采購(gòu)更具綜合性與時(shí)效性,推動(dòng)智能圖書(shū)館的不斷發(fā)展。通過(guò)人工智能技術(shù)與圖書(shū)館采購(gòu)流程的結(jié)合,我們可以更好地滿(mǎn)足讀者需求,提高圖書(shū)的利用率和借閱量,從而為圖書(shū)館的可持續(xù)發(fā)展做出貢獻(xiàn)?!?/p>

      猜你喜歡
      新書(shū)書(shū)目圖譜
      推薦書(shū)目《初春之城》
      都市人(2022年3期)2022-04-27 00:44:57
      繪一張成長(zhǎng)圖譜
      新書(shū)速遞
      新書(shū)訊
      補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
      中成藥(2017年3期)2017-05-17 06:09:01
      主動(dòng)對(duì)接你思維的知識(shí)圖譜
      新書(shū)推介
      大社會(huì)(2016年3期)2016-05-04 03:41:15
      雜草圖譜
      本刊郵購(gòu)書(shū)目
      《全國(guó)新書(shū)目》2009年1月薦書(shū)榜
      娄底市| 普陀区| 陇南市| 宜君县| 汕尾市| 新营市| 临泽县| 鹤岗市| 武强县| 吴忠市| 德格县| 台北市| 葵青区| 封丘县| 西藏| 吉木乃县| 满洲里市| 阿瓦提县| 乌兰浩特市| 乐陵市| 临汾市| 陇南市| 安康市| 疏附县| 东光县| 嘉鱼县| 正安县| 滁州市| 乌兰浩特市| 民权县| 浦县| 来宾市| 巨野县| 青阳县| 沂源县| 随州市| 大田县| 义乌市| 张家港市| 自治县| 沂水县|