• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于Linux快速文件快速檢索工具實(shí)現(xiàn)

      2021-08-06 03:03:18任啟紅
      卷宗 2021年20期
      關(guān)鍵詞:數(shù)組列表命令

      任啟紅

      (三江學(xué)院 計(jì)算機(jī)科學(xué)與工程學(xué)院,江蘇 南京 210012)

      Linux系統(tǒng)自帶的find命令、locate命令、xagrs命令可以用于對(duì)文件路徑、文件內(nèi)容進(jìn)行檢索,但速度比較慢從幾分鐘到幾十分鐘不等(具體視文件數(shù)量、硬盤類型、目錄深度等等具體情形而定),如何快速進(jìn)行文件路徑和文件內(nèi)容檢索是一個(gè)比較重要的問題。本文提出基于內(nèi)存建立索引、根據(jù)用戶實(shí)時(shí)輸入快速檢索的計(jì)算方法。

      1 概述

      使用linux自帶的命令find、locate,效率比較低下,需要花費(fèi)數(shù)分鐘至數(shù)十分鐘才能完成檢索文獻(xiàn)[1]內(nèi)存文件列表的建立和內(nèi)存跳表的構(gòu)建兩個(gè)功能模塊,這兩種功能模塊都是基于自定義的內(nèi)存管理方法。先申請(qǐng)固定大小的內(nèi)存塊,里面包括32比特的位圖、32個(gè)數(shù)據(jù)塊,每一比特的位圖依次對(duì)應(yīng)一個(gè)數(shù)據(jù)塊,這種方案為每條索引記錄分配的內(nèi)存都相同,比較耗費(fèi)內(nèi)存;文獻(xiàn)[2]提出把文件系統(tǒng)內(nèi)生成子目錄散列槽,且通過唯一標(biāo)識(shí)符標(biāo)志每個(gè)子目錄散列槽并在文件系統(tǒng)內(nèi)快速接收文件的方法,把業(yè)務(wù)目錄根據(jù)業(yè)務(wù)人員分別配置權(quán)限,不過這個(gè)比較適用于詳細(xì)的某行業(yè)定制;文獻(xiàn)[3]采用把索引存放到數(shù)據(jù)庫進(jìn)行管理,我們采用把目錄、文件路徑存放到內(nèi)存進(jìn)行檢索,速度會(huì)更快。

      2 快速檢索方案及實(shí)現(xiàn)

      我們采用C語言實(shí)現(xiàn),工具名為Found,開發(fā)的系統(tǒng)分為如下幾個(gè)步驟:

      1)讀取配置文件(里邊有包含目錄或排除目錄),并解析需要包含的目錄列表;

      2)根據(jù)目錄列表遞歸讀取所有文件和所在目錄,并存儲(chǔ)到內(nèi)存記為數(shù)組pAllFiles;

      3)創(chuàng)建兩個(gè)線程、一個(gè)讀取鍵盤輸入;一個(gè)執(zhí)行操作(如檢索數(shù)組、更新索引);

      4)按每個(gè)路徑大小分配內(nèi)存,并建立索引,內(nèi)存額外開銷比較??;

      5)每次輸入后進(jìn)行一次檢索,因?yàn)橛?jì)算機(jī)處理比鍵盤操作快約106倍,這樣節(jié)省了查詢的時(shí)間;

      詳細(xì)流程圖如圖1。

      圖1 系統(tǒng)工程流程圖

      本軟件優(yōu)點(diǎn):

      1)軟件運(yùn)行中途也可更新檢索;

      2)字符串比較采用KMP算法,減少檢索時(shí)比較次數(shù);

      3)采用上一次計(jì)算的結(jié)果更新索引(nextIndex)下一跳索引作為比較輸入,減少比較次數(shù):

      4)用C語言開發(fā),速度快;

      5)實(shí)時(shí)根據(jù)用戶輸入進(jìn)行檢索速度快;

      6)可根據(jù)文件刪除、新增,手動(dòng)更新索引列表;

      7)基于內(nèi)存比較,速度快;

      8)每個(gè)路徑+文件名按照實(shí)際使用長度申請(qǐng),浪費(fèi)的額外內(nèi)存較少;

      9)可支持目錄排除建立索引;

      圖2 每輪搜索更新下一跳示意圖

      本軟件缺點(diǎn):

      1)界面不太友好;

      2)建立索引需要時(shí)間(Linux下find命令不需要建立索引時(shí)間);

      3)每次讀取一個(gè)文件名都需要新申請(qǐng)內(nèi)存,添加到索引指針數(shù)組;

      4)開始需要配置申請(qǐng)件數(shù)量大小指針數(shù)組空間,可能有一些浪費(fèi);

      5)當(dāng)前是全量更新索引;

      6)更新索引不是自動(dòng)的;

      進(jìn)行檢索時(shí):設(shè)置線程睡眠時(shí)間為usleep(1000);

      3 實(shí)驗(yàn)結(jié)果與分析

      測(cè)試環(huán)境:

      處理器:Inter(R) Core(TM) i5-6200 CPU @ 2.30GHz 2.40GHz

      內(nèi)存:8.00GB

      主機(jī)操作系統(tǒng)Windows10,

      使用VMware? Workstation 14 Pro版本:14.1.3 build-9474260

      虛擬機(jī)操作系統(tǒng):Ubuntu 20.10測(cè)試文件數(shù)量:1172814

      測(cè)試用例及結(jié)果,如表1所示:

      表1 測(cè)試結(jié)果

      從結(jié)果看,F(xiàn)ound工具比find命令整體上是快不少。

      4 結(jié)語

      當(dāng)前軟件由于是純C實(shí)現(xiàn),界面不太友好,需要進(jìn)一步完善。

      猜你喜歡
      數(shù)組列表命令
      巧用列表來推理
      只聽主人的命令
      JAVA稀疏矩陣算法
      學(xué)習(xí)運(yùn)用列表法
      JAVA玩轉(zhuǎn)數(shù)學(xué)之二維數(shù)組排序
      擴(kuò)列吧
      移防命令下達(dá)后
      這是人民的命令
      尋找勾股數(shù)組的歷程
      不含3-圈的1-平面圖的列表邊染色與列表全染色
      娱乐| 汉阴县| 油尖旺区| 隆回县| 绍兴市| 廉江市| 东阳市| 额济纳旗| 固阳县| 雷州市| 射阳县| 名山县| 三原县| 化德县| 桂阳县| 芜湖县| 丽江市| 县级市| 桐柏县| 明溪县| 萍乡市| 杭锦后旗| 新泰市| 亳州市| 衡水市| 微博| 凌海市| 七台河市| 永州市| 内丘县| 新乡县| 西和县| 海兴县| 临泉县| 通化市| 东宁县| 白玉县| 五指山市| 剑河县| 建阳市| 根河市|