• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      Millennium系統(tǒng)漢字顯示問題的解決方法

      2010-09-06 03:25:00
      圖書館研究與工作 2010年1期
      關(guān)鍵詞:字符集亂碼字符

      齊 凌

      (浙江圖書館,浙江 杭州 310007)

      前言

      信息技術(shù)的發(fā)展,改變了圖書館的傳統(tǒng)工作模式。以圖書館內(nèi)部業(yè)務(wù)處理為核心的圖書館自動化系統(tǒng)已經(jīng)成為圖書館業(yè)務(wù)發(fā)展的必然選擇。圖書館服務(wù)與圖書館自動化系統(tǒng)是密不可分的,圖書館要提供更好的服務(wù)需要有自動化系統(tǒng)的支持,而自動化系統(tǒng)的研發(fā)則基于圖書館服務(wù)的需求,二者相互促進(jìn),共同發(fā)展?;诜?wù)和發(fā)展的需要,浙江圖書館于 1998年 8月引進(jìn)并開始使用美國 Innovative Interface公司的 INNOPAC圖書管理系統(tǒng)。整個系統(tǒng)包括流通、采訪、編目、期刊、Webopac等模塊。

      1 漢字顯示問題產(chǎn)生原因及帶來的影響

      在使用 INNOPAC的過程中,我們碰到了部分字符無法顯示的問題。1998年起始我們使用的是字符界面的版本 INNOPAC,當(dāng)時系統(tǒng)的內(nèi)碼使用的是 CCCII碼,字符集采用的是 GB字符集。由于GB字符集的字符數(shù)量比較少,只有 682個符號和6763個漢字,INNOPAC系統(tǒng)無法接受 GB字符集以外的其他字符,從其他數(shù)據(jù)庫套錄的數(shù)據(jù)也會因?yàn)檫@個原因有部分字符無法顯示。再加上老版本采用的是 Telnet的字符界面,操作性和可視性都不太強(qiáng)。因此我們在 2005年升級系統(tǒng)至 Millennium Silver 1.1,即新世紀(jì)銀版。新世紀(jì)銀版使用了 Unicode碼,采用 UTF-8編碼方式,以 GBK字符集為缺省中文字符集。但新世紀(jì)銀版的 Unicode表和 UTF-8表并沒有完整的收錄 GBK字符集中的所有字符,這就導(dǎo)致了系統(tǒng)升級到新世紀(jì)銀版后,系統(tǒng)的漢字仍舊存在問題,部分漢字的顯示仍舊出錯。之后 Innovative公司陸續(xù)推出升級版本,2007年又升級至 Millennium 2006版。這個版本對漢字的處理雖然有所改善,但仍有很多問題存在,系統(tǒng)的 Unicode表和 diac.gbk.unicode表仍然沒有能夠收錄全,部分簡體字和繁體字的對應(yīng)關(guān)系沒有做好對應(yīng),仍存在部分漢字無法顯示的問題。特別是系統(tǒng)在 05年從字符模式升級到圖形界面時,系統(tǒng)內(nèi)碼由 CCCII碼轉(zhuǎn)換到 UNICODE碼時出錯的數(shù)據(jù),仍然大量存在于系統(tǒng)中。在 Millennium工作人員界面和 OPAC界面上檢索,幾乎沒有哪個頁面是不存在亂碼或內(nèi)碼的問題。

      漢字顯示問題不能完全解決,將影響系統(tǒng)各個業(yè)務(wù)環(huán)節(jié)的正常使用。首先采訪的查重會有問題,一旦遇到有問題的漢字,查重結(jié)果的準(zhǔn)確性就得不到保證。同樣,問題也出現(xiàn)在編目模塊和流通模塊。再加上編目過程中很多漢字輸入后無法保存,這樣編目信息的準(zhǔn)確性、完整性也得不到保證。流通模塊的讀者信息也同樣存在漢字問題,如果遇到不能顯示的漢字只能用拼音表示,這樣給工作人員和讀者都帶來不便。讀者使用OPAC進(jìn)行相關(guān)檢索功能時,檢索結(jié)果的準(zhǔn)確性會打折扣。

      Millennium系統(tǒng)的漢字顯示問題并不單獨(dú)存在,大陸地區(qū)使用新世紀(jì)銀版的用戶,如清華大學(xué)圖書館、西安電子科技大學(xué)圖書館、華中科技大學(xué)圖書館等多家圖書館都存在類似的問題,各館也都在積極的尋求徹底解決問題的方法。

      2 內(nèi)碼問題分析及解決方法

      2.1 Millennium系統(tǒng)字符顯示錯誤的類型分析

      要解決字符顯示的問題,首先需要搞清楚系統(tǒng)中字符顯示出錯有哪些情況。對 Millennium系統(tǒng)字符問題進(jìn)行了分析,字符顯示錯誤的情況主要有以下幾種:

      (1)漢字顯示為異體字。這種情況漢字在系統(tǒng)中顯示的并非為我們常用的簡體字,而是對應(yīng)的繁體字或是異體字。這種情況在系統(tǒng)中出現(xiàn)的頻率很高,而且很多字都是常用字,例如下表:

      (2)漢字顯示為 EACC碼。這種情況系統(tǒng)中的漢字顯示為一串帶大括號的字符串,如:{213538}。出現(xiàn)這種情況的漢字一共有 90個,也有一部分為常用字。工作人員或者讀者在遇到這些字符串的時候往往無法分辨出對應(yīng)的漢字,對系統(tǒng)應(yīng)用帶來了很大不便。

      (3)漢字顯示為亂碼。出現(xiàn)這個問題的漢字?jǐn)?shù)量比較多,大部分都不是常用字,日常使用中很難發(fā)現(xiàn),但帶來的后果是一樣的,工作人員和讀者無法正常檢索到該記錄。

      (4)符號顯示為亂碼。這種情況與上述情況類似,不同點(diǎn)就在標(biāo)點(diǎn)或者一些字符上,對檢索也會帶來不便。

      (5)部分漢字和符號無法在 Millennium系統(tǒng)中保存。由于漢字和字符無法在系統(tǒng)中保存,導(dǎo)致讀者根本無法檢索到這些記錄,這對工作人員查重以及讀者檢索帶來很多問題。

      2.2 解決方法及注意事項(xiàng)

      (1)查找并修改系統(tǒng)中的錯誤字符。對比系統(tǒng)中的 diac.gbk.unicode表和標(biāo)準(zhǔn)的 UNICODE表,找出 diac.gbk.unicode表中缺少的字符,一共1734個漢字,符號 108個。把缺少的字符的 UNICODE碼提交給 Innovative公司,要求公司在 diac.gbk.unicode表中補(bǔ)全。

      (2)查找出系統(tǒng)中存在的所有 EACC碼共 90個,把這 90個 EACC碼對應(yīng)的中文字符及 UNICODE碼提交給 Innovative公司,要求公司修改 diac.gbk.unicode表中的 EACC碼為正確的 UNICODE碼。

      (3)查找出顯示為異體字的漢字 38個,顯示亂碼的字符 242個。

      (4)修改系統(tǒng)中的錯誤字符及方法。公司于2009年 3月底修改完 diac.gbk.unicode表。接著修正 Millennium系統(tǒng)中有問題的數(shù)據(jù),包括讀者數(shù)據(jù)和書目數(shù)據(jù)。具體的修改方法是:通過資料檔抓出錯誤的讀者數(shù)據(jù)、書目數(shù)據(jù),每個資料檔的數(shù)據(jù)不能超過 25000條,再利用全域更新,用正確的字符替代錯誤的字符。因?yàn)閷ο到y(tǒng)數(shù)據(jù)進(jìn)行全域更新會影響系統(tǒng)速度,對流通借還的影響比較大,借還書的速度很慢,借還數(shù)據(jù)不能及時更新。所以必須避開借還高峰期,利用下班以及周一閉館日進(jìn)行數(shù)據(jù)修改。還有一點(diǎn)在做全域更新時要關(guān)注系統(tǒng)處理檔(transaction file)的大小,不能超出上限,否則在做全域更新的這個資料檔的所有數(shù)據(jù)會全部被鎖住,這些數(shù)據(jù)將不能進(jìn)行任何操作。

      3 結(jié)束語

      從 2009年初開始修改至今,已經(jīng)修改了 360余個漢字與符號,常用的漢字、符號基本修改完成。累計(jì)修改數(shù)據(jù) 3268314條(其中修改異體字2581111條,修改 EACC碼 272770條,修改亂碼數(shù)據(jù) 416707條)。目前在 Millennium工作人員界面和 OPAC界面上檢索,基本看不到明顯的亂碼或者異體字。漢字內(nèi)碼問題的解決,提高了查重的準(zhǔn)確性,避免了因漢字問題導(dǎo)致的數(shù)據(jù)無法檢索,提高 OPAC的檢索準(zhǔn)確率。

      〔1〕Innovative Guide& Reference Release 2006Rev.1.Innovative Interfaces,Inc.,2007

      猜你喜歡
      字符集亂碼字符
      尋找更強(qiáng)的字符映射管理器
      這些真的不是亂碼,是漢字
      MySQL數(shù)據(jù)庫字符集的問題研究
      字符代表幾
      一種USB接口字符液晶控制器設(shè)計(jì)
      電子制作(2019年19期)2019-11-23 08:41:50
      ORACLE字符集問題的分析
      消失的殖民村莊和神秘字符
      ORACLE數(shù)據(jù)庫字符集問題及解決方法
      醫(yī)院信息系統(tǒng)Oracle數(shù)據(jù)庫中導(dǎo)入數(shù)據(jù)中文亂碼的解決技術(shù)
      炫邁:用神奇亂碼勾引你視線
      治多县| 绥芬河市| 宜章县| 舒兰市| 德江县| 开江县| 宽甸| 类乌齐县| 永靖县| 老河口市| 济源市| 新建县| 宁国市| 长宁区| 南投县| 镇江市| 谷城县| 南川市| 那曲县| 敦煌市| 巴楚县| 丰原市| 上栗县| 渝北区| 阳东县| 县级市| 岳池县| 房产| 于田县| 安龙县| 车致| 沙田区| 关岭| 陇川县| 常德市| 五大连池市| 夏邑县| 福清市| 富蕴县| 望城县| 英山县|