• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于百度智能云的權(quán)源信息錄入方法

      2022-06-06 12:58:18
      地理空間信息 2022年5期
      關(guān)鍵詞:內(nèi)業(yè)置信度感興趣

      姜 毅

      (1. 山東省國土測繪院,山東 濟南 250013)

      建立和實施不動產(chǎn)統(tǒng)一登記制度,是國務院機構(gòu)改革和職能轉(zhuǎn)變的一項重點工作任務,也是完善社會主義市場經(jīng)濟體制、建設(shè)現(xiàn)代市場體系的必然要求[1],受到黨中央、國務院的高度重視[2]。不動產(chǎn)權(quán)籍調(diào)查是不動產(chǎn)登記的基礎(chǔ),是條例實施、簿冊統(tǒng)一和信息平臺建設(shè)的重要數(shù)據(jù)支持。做好農(nóng)村不動產(chǎn)權(quán)籍調(diào)查工作,加快不動產(chǎn)統(tǒng)一登記、發(fā)證,對規(guī)范農(nóng)村宅基地管理,深化農(nóng)村改革,促進城鄉(xiāng)統(tǒng)籌發(fā)展,實現(xiàn)農(nóng)村宅基地“三權(quán)分置”和“三變”改革具有重要意義[3]。近年來,全國各地區(qū)農(nóng)村不動產(chǎn)權(quán)籍調(diào)查工作陸續(xù)開展,時間緊任務重,權(quán)源信息錄入是其中一項重要的內(nèi)業(yè)工作。權(quán)源信息大多來自戶口簿、身份證等掃描件,數(shù)據(jù)格式為圖像,無法直接復制應用,且縣區(qū)掃描件數(shù)量少則十萬級多則百萬級,傳統(tǒng)內(nèi)業(yè)人員手動錄入的工作方式在精度和效率上均難以滿足生產(chǎn)需求。現(xiàn)如今科學技術(shù)不斷發(fā)展,人工智能正加速改變各行各業(yè),研究如何引入智能化方法,使得不動產(chǎn)權(quán)籍調(diào)查能精準、自動、快捷地獲取和處理多源異構(gòu)數(shù)據(jù)具有重要意義。本文從圖像格式權(quán)源信息的智能化錄入著手,基于百度智能云文字識別算法,設(shè)計了高效、準確、自動的權(quán)源信息錄入方法,以提高權(quán)源信息的數(shù)字化、高效性、準確性和自動化,從而節(jié)約內(nèi)業(yè)生產(chǎn)成本,助力測繪生產(chǎn)智能化發(fā)展,推動不動產(chǎn)統(tǒng)一登記的順利進行。

      1 開發(fā)平臺與相關(guān)軟件

      1.1 開發(fā)平臺

      Microsoft Visual Studio[4]簡稱VS,是微軟研發(fā)的可視化開發(fā)工具,包括集成開發(fā)環(huán)境(IDE)、代碼管控工具、統(tǒng)一建模語言工具等完備的開發(fā)工具集?;赩S實現(xiàn)的目標代碼適用于所有微軟支持的平臺,主要包 括 Microsoft Windows、.NET Framework、 Windows Mobile等。

      C#[5]是微軟公司發(fā)布的面向?qū)ο蟮木幊陶Z言,由C和C++衍生而來。這意味著它可以調(diào)用由C/C++編寫的本機原生函數(shù)與COM 直接集成,從而綜合VB 的簡單可視化操作和C++高效的運行效率。C#常用于獨立和嵌入式的系統(tǒng)程序編寫任務,適用范圍從特定小型系統(tǒng)到復雜大型系統(tǒng),是.NET應用程序開發(fā)的首選語言。

      1.2 百度智能云

      百度智能云[6]是百度公司打造的智能云計算品牌,融合了云計算、大數(shù)據(jù)、百度大腦等百度核心技術(shù),具有先進的技術(shù)和豐富的解決方案,能全面賦能各行各業(yè)、加速產(chǎn)業(yè)的智能化,將半人工智能輸送到千萬行業(yè)中去。百度智能云在深度學習、自然語言處理、語音技術(shù)和視覺技術(shù)等核心AI技術(shù)領(lǐng)域具有明顯優(yōu)勢。百度智能云產(chǎn)品包括人工智能、計算與網(wǎng)絡、存儲和CDN、網(wǎng)站服務、智能視頻、智能大數(shù)據(jù)等方面,其中人工智能產(chǎn)品支持人臉識別FACE、文字識別OCR、全功能AI 開發(fā)平臺BML、智能對話定制以及服務平臺UNIT等豐富功能。

      百度智能云文字識別OCR 依托于深度學習技術(shù),提供自然場景下的文字檢測、定位、識別等功能,具有準確率高、服務穩(wěn)定、支持多語種識別等特點;還能針對圖像模糊、傾斜、翻轉(zhuǎn)等情況進行專項優(yōu)化,多項ICDAR 指標居世界第一,總體識別準確率高達99%,服務可用性可達99.99%。百度智能云文字識別官網(wǎng)案例如圖1所示。

      圖1 百度智能云文字識別OCR示例

      權(quán)源信息錄入操作多基于Windows7或Windows10等桌面操作系統(tǒng),因此本文選用Visual Studio 2010(VS2010)作為桌面應用程序的開發(fā)平臺,以C#為開發(fā)語言,以.NET Framework 3.5為目標框架,以文字識別OCR為文字識別技術(shù)智能輔助工具,設(shè)計了基于百度智能云文字識別的權(quán)源信息錄入方法。

      2 關(guān)鍵技術(shù)與實現(xiàn)

      2.1 百度智能云API調(diào)用

      百度智能云提供多種API 調(diào)用方式,用戶可通過云端服務、私有化部署、安裝離線SDK等3種方式實現(xiàn):①云端服務,百度智能云提供各類智能算法的云端接口,用戶可通過HTTP-SDK對圖像中的文字信息進行識別,云端識別后反饋結(jié)果至客戶端,部署輕量靈活;②私有化部署,百度智能云提供了一體機和軟件部署包兩種私有化方案,可將API部署至本地的服務器,在局域網(wǎng)或內(nèi)網(wǎng)中實現(xiàn)圖像中文字的識別功能;③安裝離線SDK,百度智能云可將SDK集成到桌面或移動設(shè)備中,能在無網(wǎng)、弱網(wǎng)等環(huán)境條件下實現(xiàn)圖像文字的識別功能。

      由于云端服務中HTTP-SDK 方法部署輕便靈活,電子協(xié)議中注明用戶數(shù)據(jù)用完即銷毀,能有效保證數(shù)據(jù)私密性,因此本文選用HTTP-SDK 作為API 調(diào)用方法。百度智能云文字識別實現(xiàn)的詳細流程如圖2所示。

      圖2 百度智能云文字識別實現(xiàn)流程圖

      首先在百度智能云中注冊成為開發(fā)者,并創(chuàng)建應用(應用是調(diào)用API 服務的基本操作單元),然后在VS2010 中利用NuGet 安裝最新版本的Baidu.AI,并基于應用創(chuàng)建自動分配的API Key、Secret Key 實例化Baidu.Aip.Ocr.Ocr;再加載圖像并配置相關(guān)參數(shù),調(diào)用文字識別接口;最后解析反饋結(jié)果,實現(xiàn)圖像文字識別功能。通用文字識別請求參數(shù)與返回參數(shù)如表1、2所示。

      表1 通用文字識別請求參數(shù)詳情

      2.2 交互方法設(shè)計與實現(xiàn)

      高效的數(shù)據(jù)互操作方法也是內(nèi)業(yè)人員權(quán)源信息高效錄入的保證,既要滿足批量識別順序錄入的需求,又要能靈活識別單個錄入任意指定感興趣區(qū)域。本文設(shè)計了圖像索引目錄式錄入方法和基于剪切板工具的單條數(shù)據(jù)錄入方法,從而實現(xiàn)高效的圖像文字識別數(shù)據(jù)互操作。

      表2 通用文字識別返回數(shù)據(jù)參數(shù)詳情

      2.2.1 批量順序錄入

      由于收錄的權(quán)源信息通常分村按戶存檔,因此本文設(shè)計的基于文件存儲序列的權(quán)源信息批量順序錄入方法,以村資料目錄為總目錄,遞歸遍歷文件夾下所有戶信息,程序自動按照順序生成資料卡,可實現(xiàn)便捷的權(quán)源信息順序錄入。批量錄入界面如圖3 所示,左側(cè)為圖像大圖窗口,單擊鼠標左鍵可實現(xiàn)圖像旋轉(zhuǎn);中間為資料卡目錄窗口,以“縮略圖+戶名稱+文件名”作為資料卡,單擊可查看大圖,雙擊可實現(xiàn)圖像文字信息的自動解譯;右側(cè)為解析結(jié)果窗口,輸出圖像文字識別結(jié)果。權(quán)源信息文字識別完成后,內(nèi)業(yè)人員可通過復制粘貼完成權(quán)源圖像資料的高效錄入。

      圖3 批量順序錄入界面

      2.2.2 自由感興趣區(qū)域錄入

      權(quán)源信息的靈活識別是高效完成數(shù)據(jù)錄入任務的關(guān)鍵。本文設(shè)計并實現(xiàn)了“Control C+Control V”式的簡易自由圖像文字識別錄入方法,極大地提高了錄入的自動化程度和效率。內(nèi)業(yè)人員指定任意感興趣區(qū)域,程序?qū)⒆詣油瓿蓤D像文字識別,并將識別信息自動加載到剪切板,內(nèi)業(yè)直接通過粘貼快捷鍵完成數(shù)據(jù)的錄入工作。自由感興趣區(qū)域圖像文字識別算法流程如圖4所示。

      圖4 自由感興趣區(qū)域圖像文字識別算法流程圖

      首先通過微信、QQ 等截圖工具截取需解析的感興趣區(qū)域,系統(tǒng)將復寫WndProc方法(執(zhí)行截圖等操作會觸發(fā)該函數(shù)),若判斷發(fā)出操作的信息類型為剪切板操作且確認剪切板包含圖像,則認定當前剪切板內(nèi)圖像為待解析圖像;然后將感興趣區(qū)域圖像保存到本地加載中的批量信息錄入窗口,同時作為百度智能云文字識別的輸入圖像,新開線程,解析當前輸入圖像文字;最后將解析文本結(jié)果存儲到剪切板內(nèi),內(nèi)業(yè)人員通過粘貼操作即可實現(xiàn)信息錄入。感興趣區(qū)域圖像識別界面如圖5所示。

      圖5 自由感興趣區(qū)域圖像識別界面

      本文通過深入了解內(nèi)業(yè)人員需求,將內(nèi)業(yè)圖像格式權(quán)源信息錄入過程簡化為“Control C+Control V”式的圖像文字識別錄入方法,極大地簡化了權(quán)源信息數(shù)字化操作流程,提高了自動化程度。

      3 實例分析

      3.1 批量順序錄入識別效率與行置信度分析

      本文選取高拍儀采集的身份證與戶口簿掃描件作為測試數(shù)據(jù)源,圖像格式為jpg,分辨率為2 952×1 944、150 dpi,大小約為220 KB。本文調(diào)用AccurateBasic方法,隨機選取10個身份證正面與戶口簿信息,測試其運行時間;采用返回數(shù)據(jù)參數(shù)中的average、vari?ance、min 分別統(tǒng)計識別結(jié)果中行置信度的平均值、方差、最小值。測試結(jié)果如表3 所示,可以看出,高拍儀身份證掃描件的平均識別時間為1.39 s,行置信度最低為0.92,平均值最高為1.00,行置信度平均可達0.98,平均方差為0.000 32;高拍儀戶口簿隨機頁掃描件的平均識別時間2.71 s,行置信度最低為0.87,平均值最高為0.98,行置信度平均可達0.97,平均方差為0.004 19。高拍儀身份證、戶口簿等權(quán)源信息解譯受圖像大小、清晰度和未知感興趣區(qū)域的影響,識別效率受影響程度為秒級;身份證復雜程度、數(shù)據(jù)量和模糊度均低于戶口簿,因此擁有更高的識別效率和行置信度。總體看來,本文基于百度智能云的權(quán)源信息錄入方法擁有較高的效率與行置信度。

      表3 識別效率與行置信度統(tǒng)計表

      3.2 自由感興趣區(qū)域錄入識別效率與行置信度分析

      證件號碼的高效高質(zhì)錄入是權(quán)源信息高效采集的重要保障,本文采用微信截圖工具截取高拍儀身份證掃描件證件號碼的方式驗證自由感興趣區(qū)域錄入方法的精度與效率。測試結(jié)果如表4所示,可以看出,自由感興趣區(qū)域權(quán)源信息錄入的平均時間為0.39 s,行置信度最小值為0.95,平均值最高為1.00,行置信度平均可達1.00,平均方差為0.000 02,經(jīng)人工判定均識別正確??傮w來看,本文自由感興趣區(qū)域權(quán)源信息錄入方法可實現(xiàn)實時準確的權(quán)源信息感興趣區(qū)域自由采錄。

      表4 錄入效率與行置信度統(tǒng)計表

      4 結(jié) 語

      本文是將互聯(lián)網(wǎng)人工智能與測繪生產(chǎn)相結(jié)合,推動測繪生產(chǎn)智能化發(fā)展的一次成功嘗試。權(quán)源信息的高效高質(zhì)錄入是完成農(nóng)村不動產(chǎn)權(quán)籍調(diào)查工作的關(guān)鍵,本文基于百度智能云文字識別API,利用VS2010平臺,設(shè)計并實現(xiàn)了批量順序錄入和自由感興趣區(qū)域錄入兩種權(quán)源信息錄入方法。實驗結(jié)果表明,本文方法操作簡便,具有較高的效率和置信度,能顯著提高權(quán)源信息數(shù)字化工作的效率、準確性和自動化水平,節(jié)約內(nèi)業(yè)生產(chǎn)成本,提高生產(chǎn)效率。下一步的研究重點在于特定權(quán)源對象的結(jié)構(gòu)化識別與自動存儲,進一步提高權(quán)源信息錄入的智能化水平。傳統(tǒng)測繪生產(chǎn)行業(yè)應在牢牢掌控時空位置服務在基礎(chǔ)設(shè)施、數(shù)據(jù)資源和法律標準等方面的優(yōu)勢的基礎(chǔ)上,樹立創(chuàng)意性思維,積極主動地與互聯(lián)網(wǎng)等人工智能技術(shù)進行跨界融合,實現(xiàn)測繪向智能、綠色、泛在發(fā)展的整體轉(zhuǎn)型[7-8],激流勇進逐步實現(xiàn)智能化測繪。

      猜你喜歡
      內(nèi)業(yè)置信度感興趣
      公路施工項目內(nèi)業(yè)資料管理探討
      硼鋁復合材料硼含量置信度臨界安全分析研究
      應用地表覆蓋數(shù)據(jù)估算LiDAR內(nèi)業(yè)工作量的方法研究
      更 正
      含能材料(2021年1期)2021-01-10 08:34:34
      高速公路機電系統(tǒng)內(nèi)業(yè)資料管理思考
      正負關(guān)聯(lián)規(guī)則兩級置信度閾值設(shè)置方法
      計算機應用(2018年5期)2018-07-25 07:41:26
      建筑工程內(nèi)業(yè)資料管理探討
      江西建材(2018年4期)2018-04-10 12:37:50
      這樣的智能廚房臺面,你會感興趣嗎?
      置信度條件下軸承壽命的可靠度分析
      軸承(2015年2期)2015-07-25 03:51:04
      夢斷交易會
      興趣英語(2013年9期)2013-11-28 05:49:22
      仁怀市| 禹城市| 临汾市| 盈江县| 花垣县| 海南省| 板桥市| 嘉义市| 诸暨市| 泸西县| 新蔡县| 原阳县| 芦山县| 安国市| 昌都县| 来安县| 临江市| 衡水市| 黎川县| 沁阳市| 额尔古纳市| 巴楚县| 阜平县| 澄迈县| 自治县| 汝阳县| 察隅县| 福贡县| 曲阳县| 宁陵县| 平陆县| 龙门县| 屏山县| 隆尧县| 土默特右旗| 临安市| 三亚市| 吴旗县| 铜梁县| 新晃| 尼玛县|