• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于圖書索書號識別的在架圖書錯序檢測方法*

      2023-02-17 09:46:24王紅芳宣靜雯
      新世紀圖書館 2023年1期
      關(guān)鍵詞:書脊邊緣標簽

      王紅芳 武 薛 宣靜雯

      0 引言

      目前,高校圖書館普遍采用藏、借、閱一體化的開放式流通模式,該方式不僅提高了圖書資源的流通效率,而且極大地滿足了讀者對圖書資源的多樣化和個性化需求,對發(fā)揮圖書的利用價值起到了積極推動作用[1]。然而,在高校圖書館采用開架閱覽的過程中,部分讀者在瀏覽、借閱圖書時,由于行為不規(guī)范等原因[2],普遍存在亂放錯放現(xiàn)象,導致從數(shù)據(jù)庫查詢到的圖書位置信息與圖書在書架上的實際存放位置不一致[3-4],給讀者借閱圖書帶來不便,嚴重影響了館藏圖書的流通效率和圖書館流通服務質(zhì)量[5]。因此,借助圖像處理和模式識別技術(shù)解決在架圖書串架錯序問題,對提高圖書館的運行管理效率和智能化管理水平具有重要的意義。

      隨著圖書館開放式借閱的日益普及,以及圖書館藏書量和讀者數(shù)量的日益增多,圖書錯架、串架現(xiàn)象也日益嚴重。盡管現(xiàn)在國內(nèi)大多數(shù)圖書館基本實現(xiàn)了以條形碼[6-7]或無線射頻技術(shù)(RFID)[8-10]結(jié)合數(shù)據(jù)庫管理技術(shù)為基礎的圖書管理系統(tǒng)[11],但是依然需要手工方式完成圖書上下架、圖書錯序整理等工作,圖書整理成為一項耗時、費力、易錯的常規(guī)性工作,導致了圖書流通過程中人力資源成本的增加。

      針對圖書館開放式流通中圖書亂架錯序問題,不少研究者從如何規(guī)范讀者圖書借閱意識、提高管理者工作熱情度方面進行了研究。例如,梁秀玉從亂架因素進行剖析,從提高讀者借閱素質(zhì)、提高圖書館管理者工作水平和合理布局開架閱覽室等方面提出了對策[12]。段小嬌提出利用計算機統(tǒng)計讀者借閱次數(shù),按照圖書流通率劃分存書區(qū)域,以保證區(qū)域圖書擺放的正確性。盡管以上方法對減少圖書亂架具有一定效果,但顯著增加了圖書管理員的工作量,而且對圖書館館藏物理空間大小有特殊的要求[13]。徐大芳等人針對圖書亂架提出了一種不同顏色的索書號標簽表示不同類別的圖書的方法[14]。楊軍提出了一種結(jié)合圖書索書號和圖書的購買時間的排架方式[15]。陳倩等人提出讀者將借閱的圖書歸還中轉(zhuǎn)書架上統(tǒng)一管理、建立監(jiān)督圖書管理者定期巡架機制、圖書館定期安排講座活動等多個方法[16]。盡管上述方法在一定程度上減少了圖書亂架現(xiàn)象,但仍然解決不了圖書亂架的根本問題。

      此外,研究者們也提出通過改善圖書館基礎設施的方法解決圖書館圖書亂架問題??岛槔椎热颂岢隼靡苿釉O備采集在架圖書圖像,利用LSD算法檢測書脊邊緣,并通過投影分離出索書號區(qū)域中字符,然后使用CNN網(wǎng)絡對字符進行識別,并結(jié)合圖書管理系統(tǒng)實現(xiàn)錯序檢測[17]。方建軍等提出了一種基于HSV空間分布特征與霍夫變換結(jié)合對書脊邊緣檢測、圖書索書號提取分割的算法[18]。蘇志芳等人根據(jù)圖書書脊圖像特點,利用機器視覺技術(shù)和無線網(wǎng)絡傳輸技術(shù),設計并實現(xiàn)了一種基于嵌入式的圖書亂架識別系統(tǒng)[19]。上述方法能較好地實現(xiàn)對一般索書號在架圖書較好的錯序檢測,為圖書館圖書的自動化整理提供一種可行的方案。然而,這些方法涉及的經(jīng)驗閾值較多,檢測性能受環(huán)境因素和采集圖像質(zhì)量的影響較大。

      本文在研究已有圖書亂架檢測方法的基礎上,通過移動設備獲取圖書館在架圖書圖像,首先使用Canny邊緣檢測和概率Hough變換直線檢測方法,實現(xiàn)單本圖書的書脊檢測與分割;然后在HSV顏色空間實現(xiàn)對索書號標簽區(qū)域的分割,最后使用光學字符識別技術(shù)識別索書號,通過在架圖書的索書號排列規(guī)則進行錯序分析,并標記錯序圖書在書架上的位置。本文方法能應用到圖書館在架圖書錯序檢測系統(tǒng)中,對構(gòu)建基于巡架機器人的圖書亂架清點系統(tǒng)具有重要的應用價值。

      1 書脊檢測與分割

      書脊檢測與分割是實現(xiàn)圖書串架檢測的第一步,如圖1是書脊的檢測與分割流程圖。首先,通過移動圖像采集設備獲取在架圖書圖像,然后對在架圖書圖像進行灰度變換、圖像增強等預處理后,采用Canny邊緣檢測算法檢測書脊邊緣信息,然后對邊緣檢測結(jié)果進行概率Hough變換,提取書脊邊緣直線信息后,再對提取的邊緣直線進行過濾處理,得到正確的書脊邊緣直線,最后根據(jù)書脊邊緣直線分割出單本書脊,并完成在架圖書的數(shù)量統(tǒng)計。

      圖1 書脊的檢測與分割流程圖

      1.1 書脊檢測

      為實現(xiàn)圖書索書號的識別,首先需要實現(xiàn)圖書書脊區(qū)域的檢測。利用邊緣檢測算法可以有效提取圖書書脊邊緣,從而實現(xiàn)對索書號區(qū)域的準確分割。常用的邊緣檢測算法有Roberts邊緣檢測算子、Sobel邊緣檢測算子、Prewitt邊緣檢測算子、LOG邊緣檢測算子和Canny邊緣檢測算子。如果像素點是邊緣上的點,那么該點在灰度導數(shù)中表現(xiàn)為一階的局部極值和二階的零交叉點。為了避免噪聲影響,提高微分運算獲取邊緣的可靠性,對采集的彩色圖書圖像首先進行灰度化和中值濾波預處理操作。由于Roberts、Sobel和Prewit算子均屬于一階邊緣檢測器,如果計算出某個像素點的一階導數(shù)大于某一閾值,就認為是邊緣點,因此這三種邊緣檢測子對噪聲比較敏感,容易將邊緣信息誤認為是噪聲,不利于后續(xù)的書脊分割。相比而言,LOG邊緣算子引入了高斯濾波和各向同性的拉普拉斯兩階差分算子,對噪聲具有較好的魯棒性,而Canny邊緣算子是在LOG邊緣算子基礎的一種更有效的邊緣檢測方法,邊緣檢測效果更好[20]。本文使用Canny邊緣檢測算子進行書脊邊緣的檢測。

      在完成圖書書脊邊緣提取后,采用概率霍夫變換(Probability Hough Transform)算法實現(xiàn)對書脊邊緣的提取。概率霍夫變換是在霍夫變換直線檢測的基礎上實現(xiàn)線段的查找,它對圖像中的一些長的線段分割效率較高,并能夠檢測到每個線段的起點和終點,有利于提取準確的書脊邊緣。

      1.2 書脊分割

      對于實際的在架圖書,同一書脊線通過概率霍夫變換檢測出來的書脊邊緣往往由多個不連續(xù)的邊緣直線組成。而且筆者在實驗中發(fā)現(xiàn),利用概率霍夫變換檢測到的直線段位置是隨機排列的,因此需要將檢測出的直線進行排序、過濾和合并,以實現(xiàn)單本圖書書脊的準確分割。為此,先將檢測的直線按照起點或終點的行坐標進行排序,然后設定線段間隔閾值,如果相鄰兩條線段的水平間隔小于該閾值,可將這兩條線段合并成一條直線,否則不做處理。通過對書脊邊緣直線濾除,能有效濾除無效的書脊邊緣,從而獲得更加準確有效的書脊邊緣區(qū)域。

      在對圖像進行預處理、書脊邊緣檢測、書脊邊緣提取等一系列處理后,最后對單本書脊進行分割。書脊分割結(jié)果如圖2所示。由圖2書脊分割結(jié)果可知,當確定單本書脊的左右邊緣位置后,可以根據(jù)書脊左右兩邊緣線段的起點和終點坐標對原圖像進行裁剪,實現(xiàn)單本書脊逐一分割,然后將分割出的單本書脊整齊排列到一張白色圖像上,并統(tǒng)計分割的書脊數(shù)量,生成所需要的書脊分割圖像。

      圖2 書脊分割結(jié)果

      1.3 索書號區(qū)域定位

      在分割出單本書脊圖像后,接下來需要定位圖書書脊下方的索書號區(qū)域,然后識別索書號字符,并根據(jù)識別出的索書號進行錯序分析。索書號標簽分割流程圖如圖3所示。依照索書號標簽分割流程,首先獲取書本索書號標簽的紅色邊緣圖像,然后獲取紅色邊緣圖像的色調(diào)H通道和飽和度S通道,接著分別計算H通道和S通道的灰度直方圖,根據(jù)灰度直方圖確定H通道和S通道的閾值范圍,然后根據(jù)閾值確定索書號標簽的位置分割出索書號標簽區(qū)域,然后識別索書號字符,并根據(jù)識別出的索書號進行錯序檢測。

      圖3 索書號標簽分割流程圖

      在獲得圖書書脊分割結(jié)果后,針對分割出的書脊進行感興趣區(qū)域定位,感興趣區(qū)域(Regions of Interest,ROI)是進一步處理的重點關(guān)注目標區(qū)域。本文的感興趣區(qū)域即是索書號標簽區(qū)域,能否準確地提取索書號標簽區(qū)域,直接影響索書號識別的準確度。目前,ROI提取算法很多,常用的算法有HSV顏色空間算法、卷積神經(jīng)網(wǎng)絡提取算法、形態(tài)學定位算法。由經(jīng)驗可知,一般情況下,索書號標簽區(qū)域都有其固定的特征,如顏色、形狀、尺寸、位置等。以西安工程大學圖書館藏書為例,通常索書號標簽上下各有一條紅色邊線,索書號字符為黑色,背景顏色為白色,二者顏色相差較大,索書號寬高比有一定比例等特征,這些都是分割索書號標簽區(qū)域的先驗信息[16]。根據(jù)這些先驗特征信息,由于顏色分量R、G、B之間的相關(guān)性較高,而H、S、V能較好地反映人眼對顏色的主觀感受,為保證后續(xù)識別效果,本文將分割出的RGB書脊圖像變換到HSV顏色空間提取索書號標簽區(qū)域。在HSV顏色空間,色調(diào)分量H和飽和度分量S反映了色彩的本質(zhì)特性,而V分量反映圖像的亮度,因此可以分析書脊區(qū)域H分量和S分量的顏色直方圖確定分割閾值,以消除圖像亮度變化對索書號區(qū)域分割的影響。

      為了確定索書號標簽區(qū)域,本文對方建軍等人提出的索書號標簽區(qū)域直方圖統(tǒng)計方法[18]加以改進,通過對大量索書號標簽的上下紅色邊線進行直方圖統(tǒng)計確定分割閾值。利用直方圖確定紅色標簽的色調(diào)分量H和飽和度分量S的值域,從而確定H分量和S分量取值范圍,進而提取得出索書號標簽區(qū)域。為了確定H分量和S分量的具體閾值范圍,需要對大量的索書號標簽的紅色邊線進行灰度直方圖統(tǒng)計,選出出現(xiàn)頻率高的公共區(qū)間,即為某一分量的閾值范圍。以色調(diào)H為例,對大量的索書號標簽的紅色邊線的H值進行排序,得到顏色分布直方圖,選出分布概率較高的區(qū)間作為H分量的值域。采用類似方法可得到S分量值域[18]。通過上述的直方圖統(tǒng)計方法確定索書號區(qū)域的H、S分量的閾值范圍如表1所示(以西安工程大學圖書館圖書索書號標簽顏色特征為例)。

      表1 索書號標簽HSV分量閾值范圍

      將RGB圖像轉(zhuǎn)換成HSV圖像后,對在閾值范圍內(nèi)的圖像區(qū)域置為1,即為白色,閾值范圍外的目標圖像置為0,即為黑色。在黑色的背景下更容易提取到索書號標簽的準確位置。通過確定索書號標簽位置,再通過邊緣坐標將索書號標簽切割出來。索書號標簽的分割結(jié)果如圖4所示。可以看出,索書號上下邊緣所在位置為白色,其余部分為黑色,根據(jù)白色像素的位置即可確定索書號位置,從而實現(xiàn)索書號標簽區(qū)域的正確分割。

      圖4 索書號區(qū)域分割結(jié)果

      2 索書號識別與錯序檢測

      2.1 索書號識別

      將分割出的索書號標簽作為輸入圖像,利用pytesseract庫對圖像中的字符進行識別[20]。pytesseract能夠從圖片中識別和“讀取”其中嵌入的字符。字符識別結(jié)果如圖5所示。

      圖5 字符識別結(jié)果

      2.2 索書號錯序檢測

      在識別出索書號字符后,計算每個字符對應的ASCII碼,逐位比較當前索書號與相鄰前一索書號對應位置的ASCII碼的大小。若相鄰前一索書號的ASCII碼小于等于當前索書號的ASCII碼,則繼續(xù)比較下一位ASCII碼,直到所有位ASCII碼比較完成或出現(xiàn)相鄰前一索書號的ASCII碼大于當前索書號的ASCII碼為止。如果所有位的ASCII碼都滿足相鄰前一索書號的ASCII碼小于或等于當前索書號的ASCII碼,則相鄰前一本書與當前書位置正確,否則可以判斷當前圖書在書架上的排放發(fā)生錯序。同理,可以使用相同的方法判斷當前圖書與相鄰的后續(xù)圖書的排序關(guān)系,后續(xù)圖書的索書號的ASCII碼必須大于或等于當前索書號的ASCII碼。當且僅當書架上的所有圖書滿足“前者索書號<=當前索書號<=后者索書號”的條件,則說明當前書架上的圖書擺放位置正確,否則存在錯序。錯序檢測過程如圖6所示。

      圖6 錯序檢測過程

      3 結(jié)果分析

      為進一步驗證本文方法對實際在架圖書是否存在錯序的檢測效果,使用Pycharm中PyQt5工具設計Windows平臺下的應用程序,利用OpenCV-Python4.4.0版本和pytesseract庫實現(xiàn)所有算法。利用移動手機圖像采集設備獲取50幅西安工程大學圖書館在架圖書圖像進行驗證實驗,每幅圖像采自同一書架的一排圖書。表2是實驗中測試圖像的測試結(jié)果。

      表2 測試結(jié)果

      由表中結(jié)果可以看出,對采集的50張在架圖書圖像進行測試,成功分割出單本書脊圖像的有46張,書脊分割準確率達92%,能正確檢測出圖書錯序信息的有42張,總錯序檢測準確率為84%,能夠滿足本系統(tǒng)的設計要求。

      對書架上排放錯序的圖書,檢測時系統(tǒng)自動使用紅色的矩形框標記出它在書架上的位置,以方便圖書管理員快速定位錯序圖書的位置并進行整理。盡管本文方法正確檢測出圖書錯位的情況較多,但也存在少數(shù)錯誤檢測的情況。錯誤檢測主要存在漏檢和錯檢兩種情況,其原因在于通過手機采集的在架圖書圖像分辨率不高,如果不能正確識別出圖書的索書號,則會導致錯序分析失效而發(fā)生誤判。因此,本文設計的圖書錯序檢測方法的性能在一定程度上依賴于采集的書架圖像的質(zhì)量,采集的圖書圖像質(zhì)量越高,分割得到的索書號區(qū)域圖像就越清晰,索書號的識別準確率就越高,發(fā)生錯判的概率就越低。

      4 結(jié)語

      本文提出了一種基于索書號識別的圖書串架檢測方法,該方法首先利用邊緣檢測和霍夫變換直線檢測算法獲取在架圖書書脊邊緣并分割圖書圖像,然后利用顏色直方圖特征定位并分割出圖書書脊上的索書號區(qū)域,并采用光學字符識別識別索書號。最后,通過對識別出的索書號進行錯序分析,從而判斷書架上排放的圖書是否存在錯序情況。

      盡管本文方法取得了較好的檢測效果,但仍存在不足之處,有待進一步研究與完善,主要包括以下三個方面:(1)在架圖書圖像是由人工通過手機采集,因而圖像質(zhì)量不穩(wěn)定。在實際應用中,可以利用安裝在云臺上的高清晰攝像頭自動采集在架圖書圖像,然后利用網(wǎng)絡傳輸?shù)接嬎銠C中進行分析,從而使系統(tǒng)對工作環(huán)境具有更好的適應性。(2)實驗中,采集的在架圖書擺放整齊,但實際圖書館中的圖書并不全都整齊擺放,對于存在擺放傾斜的圖書,該系統(tǒng)不能有效檢測。因此,需要進一步完善書脊檢測算法,通過傾斜檢測與校正算法,保證檢測算法的魯棒性,從而提高系統(tǒng)的實際應用能力。(3)對索書號進行識別時,有些索書號出現(xiàn)誤識現(xiàn)象,其原因主要在于采集的在架圖書圖像的質(zhì)量不高。一方面,可以在采集圖像時應利用專門的高清晰度圖像采集設備獲取高質(zhì)量圖像;另一方面,可以改進索書號識別算法,增強檢測算法對低質(zhì)量圖像的識別能力。

      猜你喜歡
      書脊邊緣標簽
      書脊畫畫
      無懼標簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      一張圖看懂邊緣計算
      能裝訂書脊的訂書機
      標簽化傷害了誰
      能對書脊裝訂的訂書機
      基于多進制查詢樹的多標簽識別方法
      計算機工程(2015年8期)2015-07-03 12:20:27
      書脊上作畫
      在邊緣尋找自我
      雕塑(1999年2期)1999-06-28 05:01:42
      庆阳市| 宁波市| 桦甸市| 城口县| 油尖旺区| 嵩明县| 永福县| 泰州市| 喀喇沁旗| 博客| 达尔| 平泉县| 阳泉市| 射阳县| 雷山县| 宜兰县| 太原市| 浦城县| 藁城市| 徐水县| 洱源县| 洛川县| 衡南县| 获嘉县| 东海县| 贞丰县| 永善县| 广宗县| 通城县| 沿河| 和静县| 宣恩县| 灵台县| 思南县| 德州市| 盈江县| 江都市| 福泉市| 凤阳县| 咸阳市| 连平县|