高君 張意騰 李旭
[摘 要] 隨著大數(shù)據(jù)時(shí)代的來臨和發(fā)展,企業(yè)的傳統(tǒng)供應(yīng)鏈管理模式正逐步向協(xié)同化管理轉(zhuǎn)變。供應(yīng)鏈服務(wù)的各企業(yè)自身及各企業(yè)之間有大量的數(shù)據(jù)交換和信息共享。但是這些數(shù)據(jù)往往是通過email、傳真、紙質(zhì)文件、電子文件、數(shù)據(jù)接口等各種不同形式傳遞的,而且格式千差萬別,需要大量的人力去進(jìn)行分析、跟蹤處理。中海油能源物流有限公司上海分公司立足智能數(shù)據(jù)識(shí)讀,輔助構(gòu)建智能供應(yīng)鏈數(shù)據(jù)平臺(tái),融合多來源數(shù)據(jù),從而高效、準(zhǔn)確地采集、處理、跟蹤、查詢供應(yīng)鏈信息,可實(shí)現(xiàn)可視化管理,有利于為供應(yīng)鏈業(yè)務(wù)的高效協(xié)同提供堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
[關(guān)鍵詞] 供應(yīng)鏈 協(xié)同管理 數(shù)據(jù)智能識(shí)讀
中圖分類號(hào):TP311.13 文獻(xiàn)識(shí)別碼:A
近期,中海油能源物流有限公司響應(yīng)國家“依靠信息技術(shù)推動(dòng)企業(yè)數(shù)字化轉(zhuǎn)型”的倡導(dǎo),全面推進(jìn)公司產(chǎn)業(yè)塑造和技術(shù)提升,逐步對(duì)13大類通用物資進(jìn)行物流集采,啟用集采平臺(tái)統(tǒng)一供應(yīng)鏈供應(yīng)。隨著集采模式的全面運(yùn)用,整個(gè)供應(yīng)鏈需要協(xié)同,還需共享源于供應(yīng)商、物流商、公司內(nèi)部以及甲方多個(gè)部門的供應(yīng)鏈環(huán)節(jié)的大量數(shù)據(jù)。這些供應(yīng)鏈數(shù)據(jù)來源廣且復(fù)雜、數(shù)據(jù)量大、形式多樣且儲(chǔ)存方式不統(tǒng)一等,存在數(shù)據(jù)分散且共享度低的問題。如果收集或者處理不及時(shí),極易造成信息溝通和跟蹤困難,會(huì)使供應(yīng)鏈數(shù)據(jù)的整體關(guān)聯(lián)分析難以實(shí)現(xiàn),會(huì)對(duì)業(yè)務(wù)的處理效率和結(jié)果造成不好的影響。
因此中海油能源物流有限公司上海分公司考慮使用數(shù)據(jù)智能讀取處理方案,一方面將海量供應(yīng)鏈信息電子化、數(shù)字化,另一方面結(jié)合人工智能技術(shù)與流程機(jī)器人平臺(tái),實(shí)現(xiàn)數(shù)據(jù)的智能匹配和處理,節(jié)省人力資源,減少事務(wù)性、重復(fù)性、低難度業(yè)務(wù)的處理頻率,促進(jìn)業(yè)務(wù)協(xié)同,提高資源利用率和工作效率,從而提升企業(yè)在數(shù)據(jù)智能識(shí)讀和處理方面的技術(shù)水平。
一、智能文件識(shí)別的實(shí)現(xiàn)思路
OCR(Optical Character Recognition)是使用掃描儀或數(shù)碼相機(jī)把文本資料掃描成圖像文件,然后對(duì)圖像文件進(jìn)行分析處理,自動(dòng)識(shí)別獲取文字信息及版面信息的軟件。
OCR引擎核心技術(shù)模塊主要由下面幾個(gè)部分組成:
(1)圖像輸入:讀取不同圖像格式文件的算法。
(2)圖像預(yù)處理:主要包括圖像二值化、噪聲去除、傾斜較正等算法。
(3)版面分析:將文檔圖片分段落、分行的算法。
(4)字符切割:主要處理字符粘連、斷筆造成的字符難以簡單切割的問題。
(5)字符特征提?。簩?duì)字符圖像提取多維的特征用于后面的特征匹配模式識(shí)別算法。
(6)字符識(shí)別:將當(dāng)前字符提取的特征向量與特征模板庫進(jìn)行模板粗分類和模板細(xì)匹配,識(shí)別出字符的算法。
(7)版面恢復(fù):識(shí)別原文檔的排版,按原排版格式將識(shí)別結(jié)果輸出到word或pdf等格式文檔的算法。
(8)后處理校正:根據(jù)特定的語言上下文的關(guān)系,對(duì)識(shí)別結(jié)果進(jìn)行較正的算法。
智能文件識(shí)別是以O(shè)CR識(shí)別為基礎(chǔ)的,基于深度學(xué)習(xí)的先進(jìn)算法,可精準(zhǔn)識(shí)別多種文件和票據(jù)的圖像文字信息,適用于各應(yīng)用場景,可以迅速提升輸入效率,優(yōu)化用戶體驗(yàn)。
考慮到物流公司供應(yīng)鏈數(shù)據(jù)來源廣、形式多樣、數(shù)據(jù)量大且儲(chǔ)存方式不統(tǒng)一的情況,智能文件識(shí)別通過預(yù)配置存儲(chǔ)的業(yè)務(wù)文件類型、文件模板,結(jié)合OCR人工智能識(shí)別技術(shù),可實(shí)現(xiàn)紙質(zhì)業(yè)務(wù)單據(jù)數(shù)字影像的智能識(shí)讀,以及相應(yīng)的智能化分類和關(guān)鍵業(yè)務(wù)數(shù)據(jù)的抽取,從而實(shí)現(xiàn)最終的供應(yīng)鏈數(shù)據(jù)識(shí)讀的智能化處理。智能化處理的特點(diǎn)主要體現(xiàn)為以下幾點(diǎn):(1)單證類型可配置,支持不同種類的供應(yīng)鏈單據(jù)類型。(2)區(qū)域可配置,設(shè)置單據(jù)中不同的識(shí)讀區(qū)域。(3)參數(shù)可配置,根據(jù)不同的單據(jù)類型設(shè)置識(shí)讀的要素并實(shí)現(xiàn)參數(shù)配置化。(4)輸出格式可配置,設(shè)置輸出的文件類型,如word、pdf、excel等多種類型文件。(5)供應(yīng)鏈數(shù)據(jù)智能化處理,將識(shí)讀出的各類供應(yīng)鏈文件進(jìn)行分類存檔、核心供應(yīng)鏈數(shù)據(jù)按照識(shí)讀模板進(jìn)行自動(dòng)化匹配及存儲(chǔ),幫助建立供應(yīng)鏈業(yè)務(wù)數(shù)據(jù)庫。
OCR模板定義指的是針對(duì)客戶個(gè)性化的單據(jù)需求,根據(jù)單據(jù)的格式來定義識(shí)別的規(guī)則。OCR模板定義分為:上傳設(shè)備掃描圖片、定義框選參照字段、框選識(shí)別區(qū)。識(shí)別區(qū)就是真正要識(shí)讀的區(qū)域,系統(tǒng)通過第二步會(huì)將圖片“擺正”,下一步就是識(shí)讀,針對(duì)定義的識(shí)別區(qū)讀取數(shù)據(jù)。每個(gè)定義框選的區(qū)域都被認(rèn)為是一個(gè)單獨(dú)的區(qū)域字段,每個(gè)字段可以指定識(shí)別規(guī)則,如作為文本或字母或數(shù)字等,準(zhǔn)確的定義類型有助于提高識(shí)別率,最后對(duì)定義后的模板進(jìn)行保存發(fā)布。
二、智能數(shù)據(jù)識(shí)讀助力供應(yīng)鏈協(xié)同管理
通過智能數(shù)據(jù)識(shí)讀技術(shù),中海油能源物流有限公司上海分公司實(shí)現(xiàn)了供應(yīng)鏈文件智能讀取、識(shí)別、和處理,并可將結(jié)果保存成供應(yīng)鏈各環(huán)節(jié)需要的各種類型的業(yè)務(wù)文件,形成了核心業(yè)務(wù)數(shù)據(jù)庫。其過程主要如下:
1.通過梳理各種訂單、單證的來源及各種復(fù)雜的業(yè)務(wù)單證格式及物流要素,成功設(shè)置了多種訂單識(shí)讀模板,如標(biāo)準(zhǔn)發(fā)票數(shù)據(jù)識(shí)讀模板、潤滑油采購訂單模板、集采平臺(tái)采購訂單標(biāo)準(zhǔn)識(shí)讀模板等,從而建立了業(yè)務(wù)數(shù)據(jù)識(shí)讀標(biāo)準(zhǔn)和規(guī)范,構(gòu)建了業(yè)務(wù)識(shí)讀引擎,為數(shù)據(jù)自動(dòng)識(shí)讀奠定了基礎(chǔ)。
2.借助OCR技術(shù)實(shí)現(xiàn)“自動(dòng)化”模式的數(shù)據(jù)采集,實(shí)現(xiàn)了采購訂單、發(fā)票數(shù)據(jù)等自動(dòng)識(shí)讀、自動(dòng)分類、自動(dòng)儲(chǔ)存。以往甲方的銷售訂單、采購訂單、供應(yīng)商的發(fā)票信息等往往以電子郵件的方式傳達(dá),這些信息均需要現(xiàn)場人員手工分類、錄入、匹配,且需要保存大量的紙質(zhì)文檔,不便檢索和查詢。通過智能識(shí)別,這些供應(yīng)鏈數(shù)據(jù)得以從文件中自動(dòng)識(shí)別出來,并實(shí)現(xiàn)了自動(dòng)分門別類的存儲(chǔ),借助信息系統(tǒng)實(shí)現(xiàn)了自動(dòng)數(shù)據(jù)的匹配(如銷售數(shù)據(jù)和采購數(shù)據(jù)的自動(dòng)匹配、訂單數(shù)據(jù)和收貨數(shù)據(jù)的自動(dòng)匹配、采購訂單和發(fā)票的自動(dòng)匹配等)。自動(dòng)識(shí)讀一方面大大減少了現(xiàn)場人員的信息錄入工作強(qiáng)度,另外一方面還保證了數(shù)據(jù)的質(zhì)量,提升了數(shù)據(jù)錄入的準(zhǔn)確率,可使現(xiàn)場人員把更多的精力投入供應(yīng)鏈的管理中。通過對(duì)供應(yīng)商、客戶原始憑證及發(fā)票的電子掃描及自動(dòng)識(shí)讀等協(xié)同要素的自動(dòng)識(shí)讀,實(shí)現(xiàn)了協(xié)同關(guān)鍵要素的快速提取和共享,減少了數(shù)據(jù)傳遞節(jié)點(diǎn),大大提高了協(xié)同工作效率,實(shí)現(xiàn)了供應(yīng)商、采購商、物流商的多方協(xié)同工作。
3.將供應(yīng)鏈管理過程中各環(huán)節(jié)、節(jié)點(diǎn)中復(fù)雜多樣化的各類原始業(yè)務(wù)憑證和文件(包括紙質(zhì)文檔、word、excel、pdf、jpeg、數(shù)據(jù)庫文件等多種類型文件) 電子化、體系化,進(jìn)行存檔管理,如銷售訂單、銷售合同、供應(yīng)商報(bào)價(jià)文件、采購訂單、采購合同、入庫單、發(fā)貨單、供應(yīng)商發(fā)票等關(guān)鍵節(jié)點(diǎn)的關(guān)鍵文檔,構(gòu)建供應(yīng)鏈協(xié)同工作的電子化業(yè)務(wù)數(shù)據(jù)庫。
4.在銷售報(bào)價(jià)及采購方案的確定過程中,借助自動(dòng)識(shí)讀數(shù)據(jù)工具,提升智能化管理水平。上海物流分公司針對(duì)上百個(gè)服務(wù)商及幾千個(gè)供應(yīng)商的業(yè)務(wù)邏輯及管理模型進(jìn)行梳理,完善物流公司采購及供應(yīng)的供應(yīng)鏈業(yè)務(wù)數(shù)據(jù)管理模型。通過電子化、智能化的處理引擎,自動(dòng)形成了采購及銷售的預(yù)推薦方案,供業(yè)務(wù)人員參考、借鑒、落實(shí),極大提高了業(yè)務(wù)人員的工作效率,減少了不必要的冗余操作。
5.在解決現(xiàn)有規(guī)范格式文件的自動(dòng)識(shí)讀和存檔處理的基礎(chǔ)上,可對(duì)新應(yīng)用文檔進(jìn)行模板設(shè)置,在自動(dòng)識(shí)讀技術(shù)基礎(chǔ)上進(jìn)行了智能化的改進(jìn),可減少采辦錄入工作量,提高了業(yè)務(wù)數(shù)據(jù)的采集效率,減少采辦人員在采購過程中的出錯(cuò)率,提升業(yè)務(wù)流轉(zhuǎn)效率。針對(duì)數(shù)據(jù)中大量出現(xiàn)的情況進(jìn)行針對(duì)性檢查,并通過數(shù)學(xué)描述與業(yè)主一并提高物資的周轉(zhuǎn)率、分?jǐn)偤侠硇裕档臀镔Y庫存量和庫存占用資金,從而提高物流的整體運(yùn)營水平。
中海油能源物流有限公司上海分公司通過將集采業(yè)務(wù)涉及的各種單據(jù)及關(guān)聯(lián)系統(tǒng)的數(shù)據(jù)進(jìn)行數(shù)據(jù)自動(dòng)識(shí)讀、智能處理、規(guī)范化的存儲(chǔ),實(shí)現(xiàn)了數(shù)據(jù)的集中存儲(chǔ)、集成應(yīng)用。關(guān)鍵供應(yīng)鏈環(huán)節(jié)數(shù)據(jù)得以實(shí)現(xiàn)快速收集、處理和分析,為實(shí)現(xiàn)采購、物流直至供應(yīng)環(huán)節(jié)的對(duì)應(yīng)供應(yīng)鏈數(shù)據(jù)自動(dòng)匹配奠定了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ),有利于提升倉儲(chǔ)管理服務(wù)工作,有利于為貿(mào)易物流節(jié)約成本。
中海油能源物流有限公司上海分公司目前只是實(shí)現(xiàn)了部分客戶需求、采辦、費(fèi)控的部分環(huán)節(jié)的供應(yīng)鏈管理數(shù)據(jù)的智能識(shí)讀和處理。未來我們要考慮整條供應(yīng)鏈的數(shù)據(jù)協(xié)同,克服供應(yīng)鏈信息孤島,解決供應(yīng)鏈上下游企業(yè)間信息共享同步性差、信息不透明的問題,使整個(gè)供應(yīng)鏈條實(shí)現(xiàn)準(zhǔn)確敏捷的響應(yīng);要實(shí)現(xiàn)從客戶需求到詢價(jià)、報(bào)價(jià)、采辦、供應(yīng)商發(fā)貨、收貨、開票、費(fèi)控、管理分析等全供應(yīng)鏈數(shù)據(jù)的快速識(shí)別、處理、共享、分析,以采集與跟蹤物資供應(yīng)鏈全生命周期的數(shù)據(jù)。我們還要建立供應(yīng)協(xié)同平臺(tái),利用全面的供應(yīng)鏈數(shù)據(jù),整合上下游企業(yè)物資供應(yīng)鏈信息,進(jìn)行業(yè)務(wù)模型分析,滿足上海物流的供應(yīng)鏈管理需求,為企業(yè)降本增效、降管理、決策提供數(shù)據(jù)支持。