文/張芝怡朱長征龍艷
國內(nèi)日平均3億多單的快遞包裹需要末端網(wǎng)點(diǎn)高效的分揀作業(yè),國內(nèi)大量末端快遞網(wǎng)點(diǎn)因無力支付高昂的企業(yè)數(shù)據(jù)平臺對接費(fèi)用,大多還采用人工+傳送帶的低效分揀方式。本文設(shè)計(jì)了一種基于文字識別的快遞面單三段碼識別方法,并基于開源的OCR識別模型進(jìn)行了驗(yàn)證。該方法用于自動(dòng)化分揀設(shè)備,無須再對接企業(yè)數(shù)據(jù),為末端網(wǎng)點(diǎn)普及自動(dòng)化分揀系統(tǒng)設(shè)備提供了一種可行的方案。
國家郵政局2021年郵政行業(yè)發(fā)展統(tǒng)計(jì)公報(bào)中表明2021年快遞業(yè)務(wù)保持較快增長。全年快遞服務(wù)企業(yè)業(yè)務(wù)量完成1083.0億件,同比增長29.9%;快遞業(yè)務(wù)收入完成10332.3億元,同比增長17.5%??爝f包裹的分揀工作量越來越大,對時(shí)效要求也越來越高。國內(nèi)各大快遞企業(yè)的一級分撥中心大多采用自動(dòng)化分揀設(shè)備,而末端網(wǎng)點(diǎn)大多沿用人工+傳送帶的分揀方式,人工成本高、效率低,同時(shí)容易產(chǎn)生錯(cuò)分和暴力分揀的問題。但現(xiàn)有的自動(dòng)化分揀設(shè)備動(dòng)輒幾百萬的價(jià)格、三四百平方米的占地面積,幾十萬的數(shù)據(jù)對接費(fèi)用,完全不適用于末端網(wǎng)點(diǎn)。為解決末端網(wǎng)點(diǎn)分揀檢測效率低下且獲取訪問網(wǎng)點(diǎn)數(shù)據(jù)庫權(quán)限價(jià)格昂貴的問題,運(yùn)用自主研發(fā)的三段碼技術(shù)提高了分揀的準(zhǔn)確性且減少了獲取權(quán)限所需的高昂費(fèi)用。
2.1 物流行業(yè)的自動(dòng)化分揀情況。在2020-2021年,我國快遞行業(yè)業(yè)務(wù)總量保持逐年增長的趨勢。國家郵政局網(wǎng)站統(tǒng)計(jì)數(shù)據(jù)顯示,快遞行業(yè)業(yè)務(wù)量從2012年的56.9億件,增長至2021年的1083億件,2022年上半年,全國快遞服務(wù)企業(yè)業(yè)務(wù)量累計(jì)完成512.2億件,同比增長3.7%;業(yè)務(wù)收入累計(jì)完成4982.2億元,同比增長2.9%。我國有4萬多個(gè),人均處理量在2-3萬件的末端網(wǎng)點(diǎn),盡管國內(nèi)少數(shù)大型物流運(yùn)轉(zhuǎn)中心已開始采用全自動(dòng)化分揀,但多數(shù)快遞公司處于半自動(dòng)化狀態(tài),末端物流分揀中心目前仍靠人工錄入地址信息、掃描進(jìn)行分揀。因?yàn)槟┒丝爝f網(wǎng)點(diǎn)每一次的分揀都需要訪問總部數(shù)據(jù)庫后對快遞包裹進(jìn)行分揀,因而需要繳納高昂的加盟費(fèi)獲取訪問權(quán)限,對于末端網(wǎng)點(diǎn)而言是一筆巨大的開支。
2.2 國內(nèi)大多數(shù)掃描技術(shù)應(yīng)用現(xiàn)狀。通常,分揀快遞的依據(jù)是自動(dòng)或者人工識別快遞單上的信息。快遞運(yùn)單中的信息作為分揀快遞唯一的依據(jù),是一種可視化的圖像數(shù)據(jù),運(yùn)單圖像中以兩種方式記錄著收、寄件人的個(gè)人信息和地理位置信息,其中,第一種為紙質(zhì)信息說明,如運(yùn)單中打印的收、寄件人信息,傳統(tǒng)的分揀快遞人員正是以此為依據(jù)對快遞包裹進(jìn)行分揀;第二種為電子信息說明,如條形碼和三段碼,快遞分揀人員使用設(shè)備對電子信息進(jìn)行掃描,從而完成快遞包裹的入庫、分揀和出庫。由于快遞運(yùn)單在運(yùn)輸?shù)耐局腥菀自斐晌廴?,?dǎo)致通過識別條形碼來分揀快遞包裹的識別率并不高??爝f運(yùn)單信息包括三段碼字符(一般由印刷體數(shù)字和大寫英文字母組成)和一維條形碼,它們都標(biāo)明了快遞的發(fā)出所在地和接收所在地的代碼,通常,國內(nèi)大分揀中心的自動(dòng)分揀都是依靠圖像識別技術(shù)來識別一維條碼,然而三段碼字符也是需要識別的一個(gè)重要信息,但是目前幾乎沒有被使用。而且,小型分揀中心由于受到場地面積,成本的限制,目前大多數(shù)都是由人工識別快遞單上的三段碼字符。因此,研究如何高效識別運(yùn)單信息,無論是對于大的分揀中心,還是小型的分揀網(wǎng)點(diǎn),都將是提高快遞自動(dòng)分揀效率的一個(gè)重要發(fā)展方向。
3.1 建立的背景。相較于當(dāng)前主要以識別快遞包裹條形碼的識別方式,基于人工智能AI的機(jī)器模型設(shè)計(jì)及訓(xùn)練,實(shí)現(xiàn)對快遞標(biāo)簽三段碼的識別。三段碼的識別,無須對接快遞企業(yè)的數(shù)據(jù)系統(tǒng),即可實(shí)現(xiàn)分揀作業(yè)。不僅節(jié)省了和各大快遞企業(yè)系統(tǒng)數(shù)據(jù)對接的費(fèi)用,而且可以同時(shí)支持多家快遞企業(yè)包裹的分揀。
3.2 三段碼的定位。三段碼定位通過YOLOV4目標(biāo)檢測網(wǎng)絡(luò)先對logo進(jìn)行訓(xùn)練,能夠識別出logo,得到logo標(biāo)識的位置信息,通過logo位置信息定位出三段碼的相對位置,然后就完成了三段碼定位。
3.3 三段碼識別模式。將基于AI的目的地區(qū)域碼識別、配送目的地漢字識別和條形碼、二維碼識別三種方法相結(jié)合,提出了兩種面單全信息識別模式:三種方法互相驗(yàn)證模式和三種方法互為備份(冗余)模式?;轵?yàn)證模式可以有效提高分揀準(zhǔn)確率,做到對快件標(biāo)簽信息識別的準(zhǔn)確率達(dá)到99.9%以上。三種識別方法互為備份模式,可以應(yīng)對分揀過程中的突發(fā)狀況,比如快件標(biāo)簽部分信息污染或缺失、通信網(wǎng)絡(luò)阻塞或中斷。最大限度上確保自動(dòng)化分揀系統(tǒng)的不間斷有效運(yùn)轉(zhuǎn)。分揀時(shí)依據(jù)的是目的地區(qū)域碼,另外兩種識別作為校正手段,每個(gè)分揀隔口對應(yīng)一個(gè)目的地區(qū)域碼的第三段碼。
3.4 三段碼的識別效果??爝f包裹標(biāo)簽一般都包含快件的訂單號、三段碼和收寄人電話地址等信息。通過對十多萬張的標(biāo)簽中的三段碼進(jìn)行標(biāo)注,制作了訓(xùn)練樣本,并對機(jī)器模型進(jìn)行訓(xùn)練。訓(xùn)練出的三段碼機(jī)器識別模型,可以準(zhǔn)確識別快遞包裹三段碼信息,識別準(zhǔn)確率達(dá)到90%以上,結(jié)合自主設(shè)計(jì)的三段碼校驗(yàn)方法,可以使識別準(zhǔn)確率達(dá)到99.9%以上。三段碼信息里包含了對快遞包裹進(jìn)行分揀所需要的完整信息。識別出三段碼,無須像當(dāng)前成熟市場中以識別條碼為主的快遞分揀系統(tǒng),也不再需要訪問企業(yè)的數(shù)據(jù)系統(tǒng),甚至無須網(wǎng)絡(luò)就可以對快遞包裹進(jìn)行分揀作業(yè)。節(jié)省了和企業(yè)系統(tǒng)對接的一大筆費(fèi)用,而且可以同時(shí)分揀多家快遞企業(yè)的包裹,提高快遞分揀系統(tǒng)的使用率,等效于降低了快遞分揀系統(tǒng)的投入成本。
3.5 基于印刷體識別開源模型,進(jìn)行識別的認(rèn)證。CnOCR是Python 3下的文字識別(Optical Character Recognition,簡稱OCR)工具包,支持簡體中文、繁體中文(部分模型)、英文和數(shù)字的常見字符識別,支持豎排文字的識別。自帶了20+個(gè)訓(xùn)練好的識別模型,適用于不同應(yīng)用場景,安裝后即可直接使用。同時(shí),CnOCR也提供簡單的訓(xùn)練命令供使用者訓(xùn)練自己的模型。
目前三段碼機(jī)器識別模型可以準(zhǔn)確識別快遞包裹三段碼信息,識別準(zhǔn)確率達(dá)到90%以上,結(jié)合自主設(shè)計(jì)的三段碼校驗(yàn)方法,可以使識別準(zhǔn)確率達(dá)到99.9%以上,節(jié)約成本占系統(tǒng)總成本的50%。通過三種條碼,解決了一維條形碼受污從而不能識別面單信息的問題。一維條形碼的貯存數(shù)據(jù)不多,需要訪問網(wǎng)點(diǎn)數(shù)據(jù)庫而三段碼信息里包含了對快遞包裹進(jìn)行分揀所需要的完整信息,保密性高。不僅節(jié)省了和各大快遞企業(yè)系統(tǒng)數(shù)據(jù)對接的費(fèi)用,而且可以同時(shí)支持多家快遞企業(yè)包裹的分揀。三段碼的使用在識別準(zhǔn)確性上超過了傳統(tǒng)的條碼識別,實(shí)現(xiàn)了技術(shù)突破,對于整個(gè)分揀過程的效率具有極大的提高。我國快遞業(yè)發(fā)展極其迅猛,近年來業(yè)務(wù)總量年均增速較快,身為一個(gè)快遞大國,在同時(shí)面臨面對勞動(dòng)力人口數(shù)量及占比雙降,人力成本不斷上升的情況下,選擇自動(dòng)化物流系統(tǒng)替代人工將成為長期必然選擇,從而實(shí)現(xiàn)降低生產(chǎn)成本提高生產(chǎn)效率。
引用出處
[1]韓貴金,胡仲陽,石海賓.基于YOLOv4與位置先驗(yàn)的快遞三段碼檢測算法[J].《西安郵電學(xué)院學(xué)報(bào)》??2021,026(004)?-?105~110?
[2]趙楠楠,邱林,魏玉飛,等.一種可同時(shí)識別一維條碼和三段碼字符的快遞單識別方法:,CN112288372A[P].2021.