• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于SQL的電子資源數(shù)據(jù)庫元數(shù)據(jù)的開發(fā)與設計

      2014-10-09 11:51:30張凱
      關鍵詞:存儲系統(tǒng)分塊資源庫

      張凱

      (河北農(nóng)業(yè)大學圖書館,河北保定071001)

      在電子資源數(shù)據(jù)庫建設過程中,包含2方面的工作,即數(shù)據(jù)的存儲和數(shù)據(jù)庫的制作.首先,數(shù)據(jù)的安全存儲是關鍵.服務器與存儲系統(tǒng)的合理配置和存儲模式的選擇關系到數(shù)據(jù)的穩(wěn)定運行和長期保存.圖書館可以采用SAN(storage area network)即存儲區(qū)域網(wǎng)絡模式.這種模式采用光纖通道FC(Fibre Channel)技術,能夠提供4Gbit/s以上的數(shù)據(jù)傳輸速率,通過光纖通道交換機連接存儲陣列和一群服務器,建立專用于數(shù)據(jù)存儲的區(qū)域網(wǎng)絡,是一種新興的存儲模式.文獻[1]研究了SAN存儲網(wǎng)絡的靈活性、可管理性和可擴展性.文獻[2]總結了SAN網(wǎng)絡的特點:存儲性能高,可用性能高,光纖通道可提供4Gbit/s帶寬的高速存儲,但對于該模式下數(shù)據(jù)的存儲原理沒有做論述.在本文中系統(tǒng)通過SAN模式來存儲數(shù)據(jù)資源,實際運用中發(fā)現(xiàn)許多大的存儲文件不但存儲在單一的節(jié)點中,而且還要對這些文件進行并行處理,因此采用了分塊的方式存儲數(shù)據(jù).設計了以64M為分塊單位的算法,其次,在數(shù)據(jù)庫制作中,元數(shù)據(jù)的設計和開發(fā)是重點.本文采用了方正apabi的建庫平臺來建立數(shù)據(jù)庫,該平臺從數(shù)據(jù)制作到發(fā)布提供了一整套成功的方案.文獻[3-4]對方正apabi平臺的使用做了具體介紹.通過該平臺可以新建數(shù)據(jù)庫、加工資源、數(shù)據(jù)審核、數(shù)據(jù)發(fā)布,但是對于元數(shù)據(jù)的修改沒有做論述.實際使用中,筆者發(fā)現(xiàn)在apabi平臺中修改元數(shù)據(jù)時會出現(xiàn)一些問題,因此在這方面做了如下的具體工作:由于平臺是通過底層的SQL Server數(shù)據(jù)管理系統(tǒng)開發(fā)的,通過對SQL“表”的研究發(fā)現(xiàn)了修改元數(shù)據(jù)的方法.在元數(shù)據(jù)的設計中,采用XML語言來描述其結構,將數(shù)據(jù)文件的結構、內(nèi)容和表現(xiàn)形式分離,具有良好的操作性、靈活性和規(guī)范性,成為元數(shù)據(jù)編碼的主流技術.本文以農(nóng)業(yè)學科書評數(shù)據(jù)庫為例用XML語言編制了元數(shù)據(jù),內(nèi)容包括了該庫的描述、字段信息、唯一標識等.字段信息定義為:被評圖書題名、被評圖書作者和被評圖書出版社3個公有字段.

      1 數(shù)據(jù)存儲技術

      1.1 存儲區(qū)域網(wǎng)絡SAN

      目前從存儲系統(tǒng)的模式來看,存儲區(qū)域網(wǎng)絡SAN是一種更加安全穩(wěn)定的模式,采用光纖通道交換機和光纖線纜把存儲設備和服務器機群連接,提供速率高達2Gbit/s的數(shù)據(jù)傳輸,是真正的高速共享存儲.其優(yōu)點很多,如:具有自己獨立的存儲區(qū)域網(wǎng)路,不占用外網(wǎng)的資源;光纖接口提供連接長度達10km;獨立的存儲管理系統(tǒng)對存儲設備進行集中管理和監(jiān)測[5-6].

      1.2 存儲系統(tǒng)結構框架

      本文采用SAN存儲區(qū)域網(wǎng)絡來組建存儲系統(tǒng).考慮到圖書館所提供的多方面服務,系統(tǒng)包括了圖書館主頁、借閱管理、各種數(shù)據(jù)庫、陣列管理服務器和存儲設備以及相連接的光纖交換機.各個服務器通過自帶的HBA卡與光纖交換機相連,磁盤陣列和磁帶庫也通過光纖接口和光纖交換機連接.通過獨立的陣列備份服務器,可以把數(shù)據(jù)定時備份到磁帶庫而不占用外網(wǎng)資源,這樣磁盤陣列作為獨立的網(wǎng)絡節(jié)點而不再是服務器的附屬,組成了高速傳輸、運行穩(wěn)定的SAN存儲區(qū)域網(wǎng)絡,系統(tǒng)框架如圖1所示.

      1.3 分塊算法的結構設計

      SAN存儲系統(tǒng)通常采用的是分布式文件系統(tǒng),在本文設計的存儲系統(tǒng)中,許多大的存儲文件不但不能存儲在單一的節(jié)點中,而且還要對這些文件進行并行處理,因此采用分塊的方式,也就是存儲的文件分成若干個block塊文件存儲在不同節(jié)點上,這樣可以提升處理速度,與此同時把存儲的文件都分成64MB的block文件,經(jīng)檢驗這種分法比較合適.很多的應用文件一般不超過64MB,但不是所有的文件都分塊,對于很小的文件規(guī)定當?shù)陀谀硞€值時是不用分塊的,也就是只有1個block[7].分塊算法的結構如下:

      在本算法中,首先定義block的集合為A0到An.An最大取64.當存儲文件小于A0時,不用分塊.如果文件大于最大的An時,需要分塊.最后調(diào)用分塊算法的子模塊blocking(size)procedure,對存儲的文件分割存儲.

      圖1 存儲系統(tǒng)框架Fig.1 Storage system structure

      2 數(shù)據(jù)庫制作中的關鍵問題

      基于SAN模式的農(nóng)業(yè)數(shù)據(jù)庫存儲系統(tǒng)搭建好以后,接下來就要考慮軟件的實現(xiàn)了,也就是數(shù)據(jù)庫的建設問題.筆者利用方正的Apabi數(shù)字資源平臺來創(chuàng)建.該平臺可以為用戶提供統(tǒng)一的數(shù)字資源發(fā)布頁面,統(tǒng)一的用戶管理認證,統(tǒng)一的檢索入口,同時針對不同資源又有豐富的資源展示方式、導航方式和檢索方式,能夠在內(nèi)容層面關聯(lián)不同類型的資源[8].結合專業(yè)優(yōu)勢和研究成果,本校圖書館設計建立了農(nóng)業(yè)學科書評庫和棗文獻數(shù)據(jù)庫.棗文獻數(shù)據(jù)庫又包含棗圖書、棗專利、棗會議文獻3個種類.在建庫過程中,有2個關鍵的技術,決定著數(shù)據(jù)庫的性能,對此本文做了具體的研究,既深入研究了SQL Server的表與元數(shù)據(jù)的關系以及利用XML語言對元數(shù)據(jù)進行設計.

      2.1 元數(shù)據(jù)與SQL表的關系及其修改

      利用Apabi數(shù)字資源平臺建立棗資源數(shù)據(jù)庫,前臺界面清晰直觀,數(shù)據(jù)的制作也很方便,是一種高效快速的建庫方法.但是值得注意的是,在建庫的最初階段,數(shù)據(jù)庫的組織結構框架一定要慎重設計.一旦元數(shù)據(jù)和對應的資源庫建立好,并且制作完成需要發(fā)布的數(shù)據(jù),再想對顯示的組織結構圖進行更改會很麻煩,筆者就遇到過由于資源庫歸類不合適而需要改變元數(shù)據(jù),在刪除該資源庫重新建立的時候遇到一系列問題.首先apabi數(shù)字資源平臺里不能直接刪除該資源庫,提示因為庫里還有資源沒有刪除,要先刪除已經(jīng)發(fā)布的資源,顯然資源已經(jīng)發(fā)布就不能被刪除了.其次如果停用該資源庫,然后新建同名的資源庫,這時又會提式發(fā)布失敗,或者顯示發(fā)布成功但在前臺看不到新發(fā)布的資源,很明顯新發(fā)布的資源沒有上傳到統(tǒng)一平臺里.根據(jù)以上2方面問題,深入研究了服務器上安裝的SQL Server里與Apabi數(shù)據(jù)庫相關聯(lián)的表.因為SQL Server是Apabi數(shù)字資源平臺的底層開發(fā)工具,而SQL Server里表的標識就是Apabi平臺中元數(shù)據(jù)的唯一標識.

      在SQL Server數(shù)據(jù)管理系統(tǒng)里,一個表就對應了Apabi資源平臺里的元數(shù)據(jù).在SQL Server里面的ApaDLibrary_370_11數(shù)據(jù)庫里點擊“表”,列出了Apabi資源平臺里所有的資源庫的元數(shù)據(jù)信息.但是,具體哪個表是要找的元數(shù)據(jù)的信息呢?回到Apabi資源平臺,在元數(shù)據(jù)管理界面,鼠標指向之前建好的元數(shù)據(jù)棗文獻數(shù)據(jù)庫,網(wǎng)頁最下面會顯示出一串IP信息,注意其中的“MetaTypeID=18”就是棗文獻數(shù)據(jù)庫這一元數(shù)據(jù)在SQL表里的位置.打開表“CMF_META_0018”,如圖2所示,里面就包含了制作的關于棗文獻數(shù)據(jù)庫的具體信息.

      在上面提到的在刪除資源庫和重新建立元數(shù)據(jù)和資源庫的時候,系統(tǒng)提示錯誤信息,就是因為雖然在數(shù)字資源平臺里刪除或者停用這個元數(shù)據(jù)和資源庫并重新建立,但是在SQL里對應的這個表并沒有徹底刪除.嘗試刪除這個表,又會提示不能刪除,某一列被另外的表占用.根據(jù)提示找到被占用的另一個表,考慮可能該表使用了表“CMF_META_0018”的數(shù)據(jù),先把它刪除才能刪除表“CMF_META_0018”,但是又會提示該表數(shù)據(jù)被第3個表占用.按照類似的方法,筆者找到許多關聯(lián)的表.顯然,要想徹底刪除表“CMF_META_0018”需要把這些相關聯(lián)的表全部找出來刪除,操作非常繁瑣.

      2.2 元數(shù)據(jù)的結構設計

      在建庫過程中,標準的建立即元數(shù)據(jù)的設計是關鍵.如何定義和組織數(shù)據(jù)并且使讀者能夠快速檢索到需要的內(nèi)容,是建立農(nóng)業(yè)數(shù)據(jù)庫時需要慎重考慮的.

      元數(shù)據(jù)是數(shù)據(jù)庫設計中的核心部分.這里的元數(shù)據(jù)是指具有相同屬性、可以用相同方式描述其信息的一類資源,是數(shù)據(jù)庫性質(zhì)和屬性的描述,定義了數(shù)據(jù)庫的組織結構形式.以農(nóng)業(yè)學科書評數(shù)據(jù)庫為例,元數(shù)據(jù)里包括了庫的描述、字段信息、唯一標識等,其中字段信息可以定義為:被評圖書題名、被評圖書作者和被評圖書出版社這3個公有字段.為了檢索的方便也可以添加其他的自定義字段,字段確定后就可以用程序語言具體地描述出來,通常采用的是XML格式既可擴展標記語言來編寫.

      XML標記語言把數(shù)據(jù)的結構和顯示方式分離,是編寫元數(shù)據(jù)的主要語言[9-10].以XML格式編寫的農(nóng)業(yè)學科書評數(shù)據(jù)庫的結構如下:

      圖2 SQL里棗文獻數(shù)據(jù)庫的表Fig.2 Table of jujube database in SQL

      <Field Name="ClassCode"Type="String"Length="50"DisplayName="中圖法分類號"CategoryID="CAT_ZTF"/>

      <Field Name="Title"Type="String"Length="256"Mandatory="TRUE"DisplayName="被評圖書題名"/>

      <Field Name="Creator"Type="String"Length="256"Mandatory="TRUE"DisplayName="被評圖書作者"/>

      <Field Name="Publisher"Type="String"Length="256"DisplayName="被評圖書出版社"/>

      <Field Name="PTitle"Type="String"Length="250"Mandatory="TRUE"DisplayName="書評提名"/>

      <Field Name="PCreator"Type="String"Length="256"DisplayName="述評作者"/>

      <Field Name="PPlace"Type="String"Length="256"Mandatory="TRUE"DisplayName="書評來源"/>

      <Field Name="Catalog"Type="Xmldata"DisplayName="目錄"Description="目錄"/>

      </MetaField>

      </MetaSchema>首先,描述XML的版本為1.0.從MetaSchema元素開始,到</MetaSchema>結束,是該數(shù)據(jù)庫元數(shù)據(jù)的主要內(nèi)容.其中,<Identity>部分描述數(shù)據(jù)庫的唯一標識.<DisplayName>定義數(shù)據(jù)庫的名稱,還有庫創(chuàng)建的時間和功能等信息[11-12].

      中間的<MetaField>到結尾</MetaField>之間,是定義農(nóng)業(yè)學科書評庫的字段信息,由公有字段和自定義字段組成.每條“Field Name”定義了一個字段.例如字段“ClassCode”,它的類型定義為“String”也就是字符串類型.長度Length是50字節(jié).顯示名稱為“中圖法分類號”.

      3 結論

      農(nóng)業(yè)數(shù)據(jù)庫資源的保存與建設是農(nóng)業(yè)高校發(fā)展的關鍵部分.以SAN結構組建的存儲平臺,具有高的冗余性和運行穩(wěn)定性能,為數(shù)據(jù)資源的長期保存提供了可靠保障.在分塊算法的結構設計中,把存儲的文件分成64MB的block文件,經(jīng)檢驗這種分法是比較合適的.同時深入探索元數(shù)據(jù)與SQL Server表的關系可以更好地對表進行開發(fā)和維護.以XML格式編寫的數(shù)據(jù)庫元數(shù)據(jù),結構清晰,編寫簡便,可以很好地與各種數(shù)據(jù)庫建庫工具銜接,具有良好的兼容性.

      [1] 徐革,李寧.基于FCSAN和IPSAN架構的數(shù)字圖書館綜合網(wǎng)絡存儲應用[J].計算機應用研究,2005(6):168-170.XU Ge,LI Ning.Application of network storage consolidation solutions for digital library based on FC SAN and IP SAN[J].Application Research of Computers,2005(6):168-170.

      [2] 余曉征,李巖.分布式數(shù)字資源中心網(wǎng)絡存儲系統(tǒng)的研究[J].農(nóng)業(yè)網(wǎng)絡信息,2007(5):12-15.YU Xiaozheng,LI Yan.Study on network storage systems of the distributed digital resource center[J].Agriculture Network Information,2007(5):12-15.

      [3] 劉菁.利用方正Apabi建立圖書館設備管理系統(tǒng)[J].科技信息,2006(9):183.LIU Jing.Establishment of facility management system of library by using Founder Apabi system[J].Science &Technology Information,2006(9):183.

      [4] 王亞秋.中國棗專題知識庫的構建[J].安徽農(nóng)業(yè)科學,2008,36(20):8858-8859.WANG Yaqiu.On the construction of knowledge base of Chinese jujube[J].Journal of Anhui Agricultural Sciences,2008,36(20):8858-8859.

      [5] 李春梅.基于SAN的存儲資源整合和高可用性研究[J].計算機安全,2012(11):56-59.LI Chunmei.Storage resource integration and high usability research base on SAN[J].Computer Security,2012(11):56-59.

      [6] 任斌,孔德剛.基于IP SAN的高校存儲網(wǎng)絡研究與實現(xiàn)[J].長春工程學院學報:自然科學版,2011,12(4):117-118.REN Bin,KONG Degang.Research and implement of university storage network based on IP SAN[J].Journal of Changchun Institute of Technology:Natural Sciences Edition,2011,12(4):117-118.

      [7] BUYYA R.A Taxonomy of data grids for distributed data sharing,management,and processing[J].ACM Computing Surveys,2006(3):1-53.

      [8] 劉菁.利用方正Apabi建立圖書館設備管理系統(tǒng)[J].科技信息,2006(S2):183.LIU Jing.Establishment of facility management system of library by using Founder Apabi system[J].Science &Technology Information,2006(S2):183.

      [9] 吳顯義.我國元數(shù)據(jù)研究現(xiàn)狀分析[J].情報科學,2004,22(1):55-62.WU Xianyi.Analysis on the status Quo of metadata in China[J].Information Science,2004,22(1):55-62.

      [10] 畢強,朱亞玲.元數(shù)據(jù)標準及其互操作研究[J].情報理論與實踐,2007,30(5):666-670.BI Qiang,ZHU Yaling.Research on metadata standard and its interoperability[J].Information Studies:Theory &Application,2007,30(5):666-670.

      [11] DEITEL H M,DEITEL P J.XML how to Program[M].Beijing:Publishing House of Qinghua University,2002.

      [12] 鄭建標.一種基于XML和元數(shù)據(jù)的工具框架研究[J].微計算機信息,2007,23(3):197-199.ZHENG Jianbiao.A framework research base on the XML and the metadata[J].Microcomputer Information,2007,23(3):197-199.

      猜你喜歡
      存儲系統(tǒng)分塊資源庫
      健身氣功開放課程資源庫建設研究
      武術研究(2021年2期)2021-03-29 02:28:28
      分布式存儲系統(tǒng)在企業(yè)檔案管理中的應用
      哈爾濱軸承(2020年2期)2020-11-06 09:22:36
      分塊矩陣在線性代數(shù)中的應用
      貴州●石斛種質(zhì)資源庫
      天河超算存儲系統(tǒng)在美創(chuàng)佳績
      高中歷史信息化教育資源庫應用探索
      福建基礎教育教學資源庫建設研究——以福建基礎教育網(wǎng)資源庫為例
      反三角分塊矩陣Drazin逆新的表示
      基于自適應中值濾波的分塊壓縮感知人臉識別
      基于多分辨率半邊的分塊LOD模型無縫表達
      乳源| 民权县| 大石桥市| 富源县| 和龙市| 安化县| 太保市| 华安县| 河南省| 灵宝市| 宣化县| 宝鸡市| 丹凤县| 泸州市| 武宣县| 许昌市| 深水埗区| 泰宁县| 苍山县| 平昌县| 宣汉县| 宁乡县| 金坛市| 工布江达县| 镇坪县| 岢岚县| 水城县| 庆元县| 驻马店市| 中卫市| 海盐县| 崇信县| 汤原县| 革吉县| 郴州市| 安阳县| 长阳| 循化| 正阳县| 张家口市| 富源县|