楊 科,朱泳標(biāo),李 娜
(中鐵二院工程集團(tuán)有限責(zé)任公司,四川 成都 610031)
鐵路工程地質(zhì)勘察階段中會(huì)產(chǎn)生大量資料,這些資料在施工建設(shè)期作為線路、路基、橋梁、隧道等專(zhuān)業(yè)設(shè)計(jì)依據(jù)之一,同時(shí)是鐵路工程項(xiàng)目的關(guān)鍵基礎(chǔ)資料。圍繞鐵路工程地質(zhì)資料一體化、標(biāo)準(zhǔn)化建設(shè)已持續(xù)多年,隨著鐵路工程建設(shè)項(xiàng)目穩(wěn)步增長(zhǎng),資料數(shù)量逐年增加,對(duì)資料的查閱暴露出響應(yīng)速度慢、資料類(lèi)型繁多、格式不統(tǒng)一等問(wèn)題,傳統(tǒng)的歸檔查詢(xún)已經(jīng)越來(lái)越難以滿足管理和使用要求,利用信息化前沿技術(shù),對(duì)傳統(tǒng)的查詢(xún)系統(tǒng)進(jìn)行智能化改造已經(jīng)刻不容緩。分布式檢索平臺(tái)是大數(shù)據(jù)生態(tài)圈中重要的組成部分,依托分布式橫向擴(kuò)展和倒排索引技術(shù),不僅支持處理PB級(jí)海量數(shù)據(jù)檢索,還能提高檢索效率,將耗時(shí)控制在毫秒級(jí)。該文借助分布式檢索平臺(tái),對(duì)工程地質(zhì)資料查詢(xún)過(guò)程中的難點(diǎn)、痛點(diǎn)進(jìn)行問(wèn)題分析,并通過(guò)大數(shù)據(jù)優(yōu)化設(shè)計(jì),實(shí)現(xiàn)了一套工程地質(zhì)資料檢索系統(tǒng)。
工程地質(zhì)專(zhuān)業(yè)主要為設(shè)計(jì)專(zhuān)業(yè)提供基礎(chǔ)數(shù)據(jù),傳統(tǒng)上,地質(zhì)人員通過(guò)模板整理資料,并提交給其他專(zhuān)業(yè)設(shè)計(jì)人員。設(shè)計(jì)人員在參考資料的時(shí)候,按照習(xí)慣和模板約束,在眾多資料里逐層手動(dòng)搜索,找到想要的文檔或圖像。在數(shù)據(jù)量大的情況下,這種方式效率較為低下,對(duì)于設(shè)計(jì)人員而言,所有資料應(yīng)該是一種“平面化”的數(shù)據(jù),自己只需要輸入搜索關(guān)鍵字,就能從這些平面化數(shù)據(jù)中得到想要的結(jié)果。
例如想搜索某條線路里某段范圍內(nèi)的“風(fēng)化帶”資料,那么包括“風(fēng)化帶”的所有資料應(yīng)該以評(píng)分高低返回給用戶,評(píng)分越高的資料代表其更接近用戶的檢索意圖。但現(xiàn)實(shí)是,工程地質(zhì)資料分為地質(zhì)說(shuō)明書(shū)、地質(zhì)平面圖、縱橫斷面圖、試驗(yàn)結(jié)果表等類(lèi)型,包括了Office、AutoCAD、PDF、文本文件、圖像等多種格式,要在此多源異構(gòu)、非結(jié)構(gòu)化的數(shù)據(jù)背景下,完成海量數(shù)據(jù)檢索,且結(jié)果要高度貼合用戶意圖,就需要在“平面化”資料一側(cè)覆蓋所有文件格式,將其轉(zhuǎn)換、加載為文本。在檢索引擎一側(cè)支持服務(wù)的水平擴(kuò)展,為海量數(shù)據(jù)的實(shí)時(shí)檢索提供基礎(chǔ)支撐。
對(duì)地質(zhì)資料的檢索和應(yīng)用還存在更深層次的挖掘問(wèn)題,即怎么從簡(jiǎn)單的資料里獲取更多的信息,比如加入位置信息能夠方便用戶從地圖上直觀發(fā)現(xiàn)該資料,加入線路和工點(diǎn)信息則幫助用戶縮小檢索范圍,從而提高檢索的效率、精度。從信息論的角度來(lái)看,更多的信息,能使檢索的不確定性減少。增加信息量的方式,就是挖掘隱藏在已有資料之間的上下文信息。資料原作者在編寫(xiě)過(guò)程中,存在沒(méi)有明確寫(xiě)入事件發(fā)生的地點(diǎn)和時(shí)間的情況,究其原因可能是當(dāng)時(shí)編寫(xiě)環(huán)境就暗含了這些信息,也可能是資料存儲(chǔ)的路徑包含了這些信息,但是隨著文件上傳到中心平臺(tái),被分布式系統(tǒng)分塊、冗余到各個(gè)服務(wù)器后,上下文信息在轉(zhuǎn)移過(guò)程丟失。檢索資料的深度問(wèn)題,即如何利用技術(shù)手段和分析算法還原這些信息的問(wèn)題。
工程地質(zhì)資料通常存儲(chǔ)在磁盤(pán)陣列(RAID)上,依靠RAID的冗余能力實(shí)現(xiàn)資料的妥善存儲(chǔ)。但是在對(duì)數(shù)據(jù)進(jìn)行挖掘和分析的情況下,磁盤(pán)陣列和分析系統(tǒng)位于不同的I/O會(huì)導(dǎo)致傳輸量大、延遲高等問(wèn)題,海量數(shù)據(jù)則會(huì)將該問(wèn)題更加放大。另一方面,需要基于RAID搭建文件服務(wù),在用戶檢索到某份資料并想下載的時(shí)候,需要從業(yè)務(wù)服務(wù)切換到文件系統(tǒng)服務(wù),進(jìn)一步增加了延遲,影響用戶體驗(yàn)。
為了解決上述問(wèn)題,該文設(shè)計(jì)和實(shí)現(xiàn)了基于分布式檢索引擎的工程地質(zhì)資料檢索系統(tǒng),重點(diǎn)解決了從海量異構(gòu)資料中結(jié)構(gòu)化文檔資料、挖掘隱藏信息,并將原始資料妥善存儲(chǔ)在檢索系統(tǒng)內(nèi)部的問(wèn)題,提供了一個(gè)用戶友好、性能強(qiáng)大的資料檢索解決方案。
Elasticsearch是一個(gè)基于Apache Lucene的分布式搜索引擎,它在Lucene支持的功能之上,提供了在節(jié)點(diǎn)管理、節(jié)點(diǎn)發(fā)現(xiàn)、建索引、查詢(xún)的功能,并提供了對(duì)開(kāi)發(fā)友好的 REST API,能夠較快實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)的交換。Elasticsearch采用倒排索引技術(shù),詞組全文檢索的準(zhǔn)確度、效率都遠(yuǎn)高于同類(lèi)產(chǎn)品,并且作為分布式原生架構(gòu),其水平擴(kuò)展的配置簡(jiǎn)單,可以做到按需擴(kuò)容,即使作為單點(diǎn)部署,在海量數(shù)據(jù)下仍然保持高響應(yīng)速度和高吞吐率。
國(guó)內(nèi)已有很多學(xué)者將Elasticsearch用于各個(gè)行業(yè),解決了很多業(yè)務(wù)系統(tǒng)的檢索問(wèn)題。結(jié)合工程地質(zhì)資料特點(diǎn),以及對(duì)廣度、深度和存儲(chǔ)問(wèn)題的綜合分析,選擇以Elasticsearch作為基礎(chǔ)平臺(tái)開(kāi)發(fā)搭建地質(zhì)資料檢索系統(tǒng)。
元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),是數(shù)據(jù)屬性的結(jié)構(gòu)化信息,為數(shù)據(jù)的挖掘提供模板。從系統(tǒng)分析的角度來(lái)看,元數(shù)據(jù)約束了工程地質(zhì)資料應(yīng)具備的信息量,也為檢索系統(tǒng)定義了基本的數(shù)據(jù)結(jié)構(gòu)。良好設(shè)計(jì)的元數(shù)據(jù),能夠幫助檢索縮小范圍、提高命中率。
按照用戶對(duì)資料檢索的使用習(xí)慣,結(jié)合對(duì)工程地質(zhì)資料的分析,該文將元數(shù)據(jù)分為兩大類(lèi),第一類(lèi)是對(duì)資料分類(lèi)的描述。資料分類(lèi)是本系統(tǒng)最大的變量,不僅新工程的納入會(huì)增加分類(lèi)數(shù)量,舊有的分類(lèi)也會(huì)隨著系統(tǒng)使用而更新關(guān)鍵字,因此,分類(lèi)元數(shù)據(jù)應(yīng)該設(shè)計(jì)為一個(gè)全局的、可維護(hù)的基礎(chǔ)字典,最終形成如表1所示的結(jié)構(gòu)。
表1 資料分類(lèi)元數(shù)據(jù)設(shè)計(jì)
資料分類(lèi)在系統(tǒng)上線前,通過(guò)梳理既有資料,統(tǒng)計(jì)得到資料分類(lèi)的關(guān)鍵詞組,再組織地質(zhì)人員和相關(guān)專(zhuān)家對(duì)關(guān)鍵詞組進(jìn)行篩選后,將篩選結(jié)果存入Elasticsearch。
第二類(lèi)是對(duì)資料數(shù)據(jù)的描述,是資料在系統(tǒng)內(nèi)部的組織方式。用戶的檢索方式不局限于文字信息檢索,還包括地圖選點(diǎn)等方式以位置信息搜索資料。資料數(shù)據(jù)元數(shù)據(jù)設(shè)計(jì)為如表2所示的結(jié)構(gòu)。
表2 資料數(shù)據(jù)結(jié)構(gòu)元數(shù)據(jù)設(shè)計(jì)
資料數(shù)據(jù)在系統(tǒng)上線后,通過(guò)資料上傳頁(yè)面,由用戶批量導(dǎo)入資料。系統(tǒng)將對(duì)資料進(jìn)行預(yù)處理、結(jié)構(gòu)化、文本挖掘,得到元數(shù)據(jù)約束的信息,并存入Elasticsearch。
資料預(yù)處理是對(duì)工程地質(zhì)原始資料進(jìn)行數(shù)據(jù)清洗和轉(zhuǎn)換的過(guò)程,以確保入庫(kù)資料的有效性。通過(guò)對(duì)各類(lèi)資料的分析,發(fā)現(xiàn)大部分資料具備元數(shù)據(jù)要求信息量,以Word格式的“地質(zhì)說(shuō)明書(shū)”為例,其中包括了線路、里程和地質(zhì)信息,而dwg格式的“橫斷面圖”則包括了日期、線路、里程信息,但是不少文檔仍然需要一個(gè)或者多個(gè)信息才能補(bǔ)全元數(shù)據(jù)結(jié)構(gòu)。同時(shí)還存在少數(shù)資料,特別是一些數(shù)據(jù)緩存文件,只是作為數(shù)據(jù)計(jì)算過(guò)程的中間結(jié)果,不具備檢索的意義,應(yīng)通過(guò)數(shù)據(jù)清洗將這類(lèi)資料過(guò)濾掉。清洗的方法包括后綴名過(guò)濾、對(duì)文件名進(jìn)行正則表達(dá)式搜索淘汰。由于地質(zhì)資料這類(lèi)非結(jié)構(gòu)化數(shù)據(jù)需要對(duì)文件內(nèi)容進(jìn)行文本抽取后才能結(jié)構(gòu)化,因此很難在預(yù)處理階段應(yīng)用數(shù)據(jù)合法性檢查、一致性檢查等結(jié)構(gòu)化的清洗方法,對(duì)數(shù)據(jù)進(jìn)行補(bǔ)全和糾正將放在對(duì)文本進(jìn)行抽取、結(jié)構(gòu)化之后。
數(shù)據(jù)轉(zhuǎn)換主要針對(duì)Office文件,特別是Office 2007之前的格式,這些文件不能被腳本語(yǔ)言直接抽取出文字,需要轉(zhuǎn)換為docx、xlsx等格式才能被后續(xù)流程處理。預(yù)處理流程如圖1所示。
圖1 數(shù)據(jù)預(yù)處理流程
文本抽取是整個(gè)系統(tǒng)的核心,設(shè)計(jì)的難點(diǎn)在于需要一套運(yùn)行在Linux服務(wù)器上,自動(dòng)化抽取多種資料格式的集成處理程序。考慮到系統(tǒng)將會(huì)使用到多種前沿技術(shù),以及對(duì)Linux系統(tǒng)的支持,程序由Python語(yǔ)言實(shí)現(xiàn)能夠很好地“粘合”這些不同技術(shù)。
在數(shù)據(jù)預(yù)處理流程后,地質(zhì)資料可以分為四種類(lèi)型,第一類(lèi)是Office文檔,包括Word、PowerPoint、Excel格式。第二類(lèi)是PDF文檔,主要包括圖像和文字兩大類(lèi)內(nèi)容。第三類(lèi)是CAD文件,通常為dwg格式,主要內(nèi)容包括了平面圖和縱橫斷面圖。最后一類(lèi)是圖像,包括巖芯和踏勘現(xiàn)場(chǎng)圖像,這類(lèi)文件不僅數(shù)據(jù)量特別大,而且對(duì)工程地質(zhì)人員的工作開(kāi)展有極大的幫助,是重要的工程地質(zhì)資料。另外需要考慮后續(xù)應(yīng)用過(guò)程中,更多的資料類(lèi)型加入檢索,在設(shè)計(jì)階段,遵循對(duì)修改封閉,對(duì)擴(kuò)展開(kāi)放的原則,采用工廠方法模式,根據(jù)輸入文檔的格式,設(shè)計(jì)不同的工廠類(lèi)處理不同的地質(zhì)資料。以目前的四類(lèi)資料為主,每個(gè)工廠類(lèi)生成如下產(chǎn)品:
(1)Office文件的抽取。
Python中有多個(gè)庫(kù)可以對(duì)Office 2007以后的版本進(jìn)行全文提取,而圖像、樣式等信息將會(huì)被丟棄,只獲取所有文本內(nèi)容、作者和編輯時(shí)間。
(2)PDF文件的抽取。
根據(jù)對(duì)地質(zhì)PDF文件的研究,發(fā)現(xiàn)具有文本抽取價(jià)值的文件,大多數(shù)是文本型的,在Linux中有多個(gè)可執(zhí)行程序,可以將其中的文本提取出來(lái),使用Python的subprocess庫(kù),啟動(dòng)子進(jìn)程來(lái)處理PDF文件,提取出的文字存入緩存文件,再由Python腳本獲取。
(3)CAD文件的抽取。
目前已經(jīng)有多個(gè)商業(yè)或開(kāi)源的庫(kù)可以處理CAD文件,在Linux上可以選擇的控件比較少,libdxfrw開(kāi)源了對(duì)大多數(shù)版本CAD的解析,并支持Linux上GCC編譯。編寫(xiě)?yīng)毩⒌腖inux可執(zhí)行程序,調(diào)用相關(guān)函數(shù)從dwg文件對(duì)象(AcDbObject)的文本區(qū)域提取出所有文字,存入緩存文件,再由Python腳本訪問(wèn)緩存文件得到文本內(nèi)容。
(4)圖像的抽取。
圖像目前是處理最為耗時(shí)的一類(lèi)資料。主要思路是通過(guò)目標(biāo)檢測(cè)算法找到圖像中的實(shí)體,并根據(jù)這些實(shí)體能夠得到語(yǔ)義上的聯(lián)系。該文通過(guò)卷積神經(jīng)網(wǎng)絡(luò)和YOLO V3訓(xùn)練了地質(zhì)資料中常見(jiàn)的一些實(shí)體,例如巖芯中的泥土、巖石、鉆孔巖芯等,生成了一個(gè)可以識(shí)別這些實(shí)體的模型。在對(duì)圖像進(jìn)行處理中,首先讀取該模型對(duì)圖像中的實(shí)體進(jìn)行檢測(cè),再對(duì)檢測(cè)到的所有實(shí)體進(jìn)行去重,最后根據(jù)這些實(shí)體查詢(xún)實(shí)體關(guān)系字典,得到圖像的分類(lèi)。例如,一張圖像通過(guò)實(shí)體檢測(cè),得到了多個(gè)泥土、泥巖、鉆孔巖芯框?qū)嶓w,通過(guò)查詢(xún)實(shí)體關(guān)系字典,這張圖像很可能就是現(xiàn)場(chǎng)的鉆孔巖芯圖。
文本抽取的類(lèi)設(shè)計(jì)如圖2所示,僅以O(shè)ffice文件和圖像抽取為例。
圖2 文本抽取工廠方法類(lèi)圖
原始文件經(jīng)過(guò)文本抽取后,得到原始文本、作者、編輯時(shí)間等元數(shù)據(jù)約束的信息。還需要對(duì)原始文本結(jié)構(gòu)化處理,為后續(xù)的挖掘提供關(guān)鍵字、詞頻等重要信息。但文本結(jié)構(gòu)化本身是一個(gè)復(fù)雜流程,應(yīng)根據(jù)待獲取的信息,將該流程分解為多個(gè)較小的子流程,逐步降低復(fù)雜度,具體流程如下:
(1)去除停用詞,利用地勘語(yǔ)料庫(kù)進(jìn)行中文分詞,統(tǒng)計(jì)前20個(gè)詞頻較高的詞組并緩存。
(2)調(diào)用中文文本摘要算法進(jìn)行單文本摘要,對(duì)應(yīng)元數(shù)據(jù)的“摘要”信息。
(3)對(duì)原始文本進(jìn)行正則表達(dá)式搜索,得到線路里程信息。里程信息通常是以CK、DK、D1K、D2K冠號(hào)開(kāi)始,加上1 000以?xún)?nèi)的數(shù)字組成,由起始里程和終止里程成對(duì)出現(xiàn),如DK11+123~DK15+789。原始文本中可能包括多個(gè)里程信息對(duì),通常出現(xiàn)頻率最高的才是真正里程信息,但是為了防止關(guān)鍵信息丟失,所有里程文字和出現(xiàn)頻率作為鍵值對(duì)一起緩存,便于后續(xù)挖掘處理。
(4)對(duì)于圖像這類(lèi)特殊資料,不參與分詞或摘要流程,直接將圖像抽取后得到實(shí)體名稱(chēng)作為詞組緩存。
經(jīng)過(guò)文本抽取和結(jié)構(gòu)化后,元數(shù)據(jù)要求的大多數(shù)信息已經(jīng)具備,剩下較為隱蔽的信息等待挖掘。
隱藏信息是指不明確寫(xiě)入資料,或者需要對(duì)資料進(jìn)行多次處理后才能得到的信息。結(jié)構(gòu)化后的原始文本中可能包括了線路、工點(diǎn)、資料類(lèi)型等關(guān)鍵信息,但是存在命名不一致、二義性等問(wèn)題,另外圖像資料則可能不包含上述任何信息。因此,應(yīng)在結(jié)構(gòu)化后應(yīng)用聚類(lèi)、相似度算法盡量挖掘出線路、位置等關(guān)鍵信息。
(1)時(shí)間聚類(lèi),找到資料的時(shí)間軸。
在資料中包括了眾多時(shí)間,有踏勘時(shí)間、編寫(xiě)時(shí)間、匯報(bào)時(shí)間,文檔本身還具備最近編輯時(shí)間,在這諸多時(shí)間中,哪一個(gè)時(shí)間更具備參考意義。當(dāng)完成文本結(jié)構(gòu)化后,不妨對(duì)單個(gè)文檔進(jìn)行升維,將其映射到本次上傳的所有文本中的時(shí)間維度中,因?yàn)橛脩舻氖褂昧?xí)慣往往同一批文件屬于同期所做工作的匯編。然后再對(duì)所有時(shí)間進(jìn)行K-means聚類(lèi),最后將單個(gè)文檔里的所有時(shí)間,與聚類(lèi)各個(gè)分簇中心計(jì)算歐氏距離,距離最短的時(shí)間往往更具備代表性,能夠體現(xiàn)該資料在時(shí)間軸上,與同批次文件編寫(xiě)的強(qiáng)關(guān)聯(lián)性,選擇該時(shí)間作為本資料的編輯時(shí)間。圖3表示了只對(duì)時(shí)間信息中的日期進(jìn)行聚類(lèi)后的結(jié)果。圖4為時(shí)間信息挖掘流程。
圖3 同批次資料內(nèi)含時(shí)間信息聚類(lèi)示意圖
圖4 時(shí)間信息挖掘流程
(2)坐標(biāo)反算結(jié)合非極大值抑制,分析資料的位置信息。
由于工程地質(zhì)資料都采用投影坐標(biāo)作為項(xiàng)目坐標(biāo),每個(gè)項(xiàng)目中央子午線和投影高是不同的,必須通過(guò)坐標(biāo)轉(zhuǎn)換系統(tǒng),對(duì)資料的項(xiàng)目坐標(biāo)進(jìn)行坐標(biāo)反算,得到其GPS坐標(biāo),這個(gè)坐標(biāo)是對(duì)資料最精確的位置描述,可以直接作為位置信息進(jìn)行存儲(chǔ)。但是很多資料并不具備項(xiàng)目坐標(biāo),而是里程信息,并且一個(gè)資料內(nèi)含多個(gè)里程信息,在前一步驟中,已經(jīng)得到了多對(duì)和多個(gè)里程作為候選信息,消除重疊的找到最佳的里程即能完善該資料的位置信息。具體做法是利用坐標(biāo)轉(zhuǎn)換系統(tǒng)將其轉(zhuǎn)換為GPS坐標(biāo),再沿線路方向建立笛卡爾坐標(biāo)系,圍繞GPS坐標(biāo)形成一個(gè)矩形,每個(gè)矩形具備一個(gè)分?jǐn)?shù)值,即該里程對(duì)的詞頻,如圖6所示,沿線路方向,將里程信息對(duì)轉(zhuǎn)換為左右兩個(gè)GPS坐標(biāo)點(diǎn),默認(rèn)500米作為矩形高度,單個(gè)里程則為500米的正方形。圖中深色的矩形為當(dāng)前詞頻最高的里程信息,計(jì)算剩余的矩形和該矩形的重疊區(qū)域(IOU),當(dāng)IOU大于預(yù)設(shè)值,則淘汰該里程信息。再在小于預(yù)設(shè)值的里程信息里選擇詞頻最高的,進(jìn)行下一次循環(huán),如圖中可以得到兩對(duì)里程信息,其對(duì)應(yīng)的GPS坐標(biāo)以空格分隔存儲(chǔ)到“位置信息”中。
圖5 位置信息挖掘流程
圖6 非極大值抑制算法獲取最佳里程示意圖
(3)相似度算法,挖掘資料的分類(lèi)信息。
在結(jié)構(gòu)化處理后,已經(jīng)具備了單個(gè)資料詞組到詞頻的映射,查詢(xún)Elasticsearch中的文檔分類(lèi)數(shù)據(jù),將分類(lèi)中的詞組詞頻映射取出,兩者計(jì)算余弦相似度,最相似的分類(lèi)即為該資料分類(lèi),最后存儲(chǔ)到“類(lèi)型信息”中。文檔分類(lèi)數(shù)據(jù)也需要定時(shí)更新維護(hù),通過(guò)同類(lèi)文檔的關(guān)鍵字的聚合,在專(zhuān)家的建議確認(rèn)下,逐步提高模型的準(zhǔn)確性。由圖7可見(jiàn),隨著同類(lèi)文檔的數(shù)量增加,單個(gè)文檔與同類(lèi)文檔的相似度越來(lái)越大,雖然數(shù)量達(dá)到一定量后,相似度有所下降,這是由于更多的關(guān)鍵字加入會(huì)降低相似度,但是整體保持了較高的相似度,保證了文檔分類(lèi)的準(zhǔn)確率。
圖7 單個(gè)資料與相同分類(lèi)資料的余弦相似度折線圖
在完成所有隱藏信息挖掘后,將原始文件通過(guò)BASE64編碼轉(zhuǎn)換成字符串,對(duì)應(yīng)到元數(shù)據(jù)中的“原始文件”,便于用戶在檢索到該資料后,快速的解碼并下載。該方式也可以最大化利用分布式系統(tǒng)的性能,防止文件下載的單點(diǎn)故障。
該文引入分布式搜索引擎,結(jié)合軟件設(shè)計(jì)模式和數(shù)據(jù)挖掘方法,實(shí)現(xiàn)了工程地質(zhì)資料檢索系統(tǒng),該系統(tǒng)已經(jīng)在中鐵二院地勘巖土工程設(shè)計(jì)研究院的多個(gè)項(xiàng)目組投入使用,并在兄弟設(shè)計(jì)單位中得到應(yīng)用驗(yàn)證。根據(jù)反饋,該系統(tǒng)支持資料格式多、檢索命中率高、檢索速度快、使用簡(jiǎn)單的特點(diǎn)得到了用戶的肯定,從根本上改變了傳統(tǒng)資料檢索的使用方式,提高了地質(zhì)、設(shè)計(jì)人員的工作效率。
隨著川藏線、成渝中線等重大鐵路工程項(xiàng)目的推進(jìn),該系統(tǒng)將為廣大地質(zhì)人員、工程設(shè)計(jì)人員的工作、科研提供有力幫助。