楊瑞華,張建華,余 艷,向 導,劉 建,廖明強
(中國工程物理研究院核物理與化學研究所,四川綿陽 621900)
針對特殊專業(yè)研究中的設(shè)想和實施階段產(chǎn)生的大量科技文獻資料,如何將文獻安全并科學有效地管理,以便隨時查找和利用,成為需要解決的問題。早在1992年埃斯特雷亞山社區(qū)學院建立了最初的信息共享空間,共享專業(yè)性的學生進行學習研究[1]。
科研工作中經(jīng)常會利用已知信息,并因此取得事半功倍的效果。當前管理科研信息的軟件系統(tǒng)有“檔案管理系統(tǒng)[2]”和某些單位建立的信息港模式。檔案管理系統(tǒng)中通常只能存儲單位內(nèi)部的定型成果信息,信息港管理則是一定程度上可公開的信息。而科研人員所需的中間過程數(shù)據(jù)、討論的紀錄、處理數(shù)據(jù)采用的工具及一些雖未在正式刊物發(fā)表,卻對科研極具參考價值的信息卻無法查找,更無法利用。為此,開發(fā)了文獻資料數(shù)據(jù)成果共享平臺管理軟件。
軟件系統(tǒng)采用Delphi+SQL Server架構(gòu),采用網(wǎng)絡(luò)化C/S/S三層構(gòu)架的模式實現(xiàn)了不限制類型的各類文件文獻數(shù)據(jù)資料的統(tǒng)一管理,使多年累積的技術(shù)成果和文獻資料得以長期保存,方便檢索,并更好地應(yīng)用在日常的科研課題文獻資料獲取中。通過這種受控的信息資源網(wǎng)絡(luò)交流共享軟件平臺,使日??蒲泄ぷ髦械奈墨I和文件資料數(shù)據(jù)得到更充分有效的利用。
文獻共享方式大致可分為紙質(zhì)“借閱式”、對面“詢問式”、推送“郵件式”、瀏覽“網(wǎng)頁式”。文中介紹及時“桌面式”共享方式[3]。
圖1 系統(tǒng)主要界面
(1)借閱式共享。在計算機未出現(xiàn)前,文獻信息是以紙張形式存在的,紙張式信息共享的方式就是借閱。而在當今信息化程度較高的情況下,借閱式共享的效率已無法滿足要求,但出于某種原因該方式仍將長期存在。
(2)詢問式共享。詢問方式的主要缺點是信息交流不充分。也是最普通的信息共享方式。
(3)郵件式共享。有文獻信息時,利用網(wǎng)絡(luò)郵件進行發(fā)布,采用一對一或一對多的方式。其缺點是導致無用信息增多。
(4)網(wǎng)頁式共享。網(wǎng)頁式共享也可稱為信息港模式,均是經(jīng)過整理后公開發(fā)表、發(fā)布的信息,通常可反映精髓,而大多對于科研更有幫助的原始信息和過程信息則無法出現(xiàn)。不能為日后的參考提供充分信息資源。
(5)桌面式共享。采用內(nèi)部網(wǎng)絡(luò)使用的共享軟件進行桌面交互式共享,改變了借閱式和詢問式的缺點,同時又集中其優(yōu)點。采用多對多方式共享文獻,多個用戶可同時或錯時上傳、下載文獻。也就是所用用戶均可向信息池中添加信息,而又可根據(jù)權(quán)限和積分等共享信息。
提供主動式、非面對面的信息共享方式,使得系統(tǒng)參與人員可利用非整塊的空閑時間,主動上傳文獻資料,克服資料面對面交接的時間和空間局限,實現(xiàn)桌面共享。在節(jié)約時間的同時,主動提供共享信息。獲取信息也是主動進入系統(tǒng)進行搜索所需的信息。
通過這種方式將以往的面對面詢問式、紙張借閱式、郵件對點式和網(wǎng)頁搜索被動式,用非實時、多對多、無限借閱、拖放式上傳和桌面檢索等方式所替代。
軟件只在授權(quán)的網(wǎng)絡(luò)和計算機中使用,未通過該軟件獲取的信息無法讀取。軟件限制使用范圍,文獻采用二進制形式拆分加密存放于數(shù)據(jù)庫中。如此,軟件離開規(guī)定的環(huán)境便不可使用,而數(shù)據(jù)庫被非法獲取后只能看到一些“加密”后的二進制碼,其破譯難度較高,上傳文獻的安全性得到了保障。
(1)身份認證。本軟件集成采用“域控”方式的網(wǎng)絡(luò)中用戶身份信息,登錄系統(tǒng)時直接獲取域中身份信息,無需驗證,操作簡單。同時軟件系統(tǒng)具有一定安全性保障。在異地計算機上則采用頁面登錄方式,輸入用戶名和密碼也可以方便進入系統(tǒng)。這里輸入的用戶名和密碼在數(shù)據(jù)庫中是經(jīng)過加密存放的,也有一定強度的安全性。
(2)瀏覽上傳。進入上傳頁面后,一種方式是點擊“瀏覽文獻”按鈕,選定要上傳文獻后,系統(tǒng)自動獲取文獻的大小、修改日期等基本信息,并形成系統(tǒng)所需的部分屬性信息。僅需少量輸入即可實現(xiàn)文獻上傳。另一種更為方便的方式是將需要共享的文件直接拖放至該頁面,即可實現(xiàn)文件基本信息獲取。
在文獻數(shù)據(jù)共享時采用文件流分割上傳和下載技術(shù),提高了速度,同時突破文件大小限制。同時采用多線程技術(shù),避免巨大文獻上傳時造成的計算機“假死”現(xiàn)象[4]。
(1)文獻類型。共享的文獻類型無限制,由此信息庫中不僅包括發(fā)表文章、總結(jié)報告和數(shù)碼照片等,還包括經(jīng)典軟件工具等豐富的共享資源。
(2)分割上傳技術(shù)。利用“文件流”進行文件分割,再將分割后的“文件流”轉(zhuǎn)換為“內(nèi)存流”,利用內(nèi)存流進行文件的網(wǎng)絡(luò)傳送。設(shè)計好其之間的邏輯關(guān)系,大幅提高文件上傳速度,尤其針對較大文件的處理效果更為明顯。
數(shù)據(jù)庫字段最大限制為4 GB,要確保上傳文件為保證安全保存在數(shù)據(jù)庫中,需采用文件分割技術(shù)來突破上傳限制,滿足較大文件上傳需求。
(3)多線程技術(shù)。采用多線程的應(yīng)用程序允許同一程序的多部分同時執(zhí)行,為程序賦予并行特性,因而可執(zhí)行某些實時性和隨機性強的操作,提高CPU的利用率,加快文獻數(shù)據(jù)信息處理速度。在本軟件系統(tǒng)中,啟動一個或多個線程讀取并分割文件,同時啟動其他線程上傳內(nèi)存流并保存至數(shù)據(jù)庫中。
該流分割技術(shù)不僅支持大文件的傳送,還增強了文件安全性。分割存放的單個文件則是一堆二進制碼,若不采用本系統(tǒng)專用技術(shù)合并,后臺數(shù)據(jù)被竊取后將無較大用途。
文獻上傳后,可能發(fā)現(xiàn)文獻錯誤,需要刪除。該刪除過程將導致數(shù)據(jù)庫占用多余的空間。尤其是幾GB文件的刪除,其日志文件及其他殘留信息會空占服務(wù)器硬盤空間,并嚴重影響數(shù)據(jù)庫性能。網(wǎng)絡(luò)服務(wù)器存放位置不便于經(jīng)常出入管理。因此軟件采用遠程控制技術(shù),使得具有相應(yīng)權(quán)限的用戶可遠程清理數(shù)據(jù)庫,保證數(shù)據(jù)庫的清潔。
通過該系統(tǒng),克服了以往優(yōu)勢資源無法得到充分利用的情況,實現(xiàn)了主動式文獻資料數(shù)據(jù)成果的需求。在該軟件平臺的數(shù)據(jù)庫中可積累大量原始的文獻數(shù)據(jù)資源,而非檔案管理中單一模式的總結(jié)報告。
通常一項新技術(shù)的產(chǎn)生或一種新模式的變化,在開始階段均無法被完全接受,需要時間的積累來提高認識。而有序積累和原始積累對一個單位的長遠發(fā)展有著重要意義。
[1]李越,唐小利,陳晨.國內(nèi)外信息共享空間(IC)研究及其啟示[J].醫(yī)學信息學雜志,2011(8):65-68.
[2]莫雪妹.檔案信息資源共建共享的思考[J].China's Foreign Trade,2011(14):152-156.
[3]李君,蔣志東.信息資源共享研究綜述[J].現(xiàn)代商貿(mào)工業(yè),2011(11):240-241.
[4]羅峰.基于P2P和網(wǎng)絡(luò)編碼的遠程桌面共享[J].重慶郵電大學學報:自然科學版,2007(4):454-457.