⊙ 文 劉水文 南昌職業(yè)大學(xué)
食品安全問(wèn)題是關(guān)系到國(guó)家發(fā)展和人民生活的重要問(wèn)題,在信息技術(shù)飛速發(fā)展的今天,如何運(yùn)用相關(guān)技術(shù)來(lái)保障食品安全已經(jīng)是一個(gè)新的研究方向。通過(guò)技術(shù)手段獲取有關(guān)食品安全的資料,然后對(duì)其進(jìn)行分析,挖掘內(nèi)部的價(jià)值,對(duì)于解決中國(guó)的食品安全問(wèn)題具有重要意義。本章從食品安全的角度出發(fā),探討了食品安全的數(shù)據(jù)收集和處理技術(shù)。
在社會(huì)主義市場(chǎng)經(jīng)濟(jì)條件下,農(nóng)業(yè)、食品加工業(yè)和餐飲行業(yè)不斷發(fā)展壯大,食品的品種越來(lái)越多樣化,但與此同時(shí),食品的質(zhì)量安全問(wèn)題也越來(lái)越突出,并逐步發(fā)展成了重大的社會(huì)問(wèn)題。比如,部分食品生產(chǎn)廠家為了追求一時(shí)的經(jīng)濟(jì)利益,在生產(chǎn)中違規(guī)添加食品添加劑,造成了嚴(yán)重的食品安全事件。在市場(chǎng)上銷(xiāo)售的食品沒(méi)有達(dá)到國(guó)家安全標(biāo)準(zhǔn)、食品生產(chǎn)過(guò)程沒(méi)有達(dá)到標(biāo)準(zhǔn)生產(chǎn)要求、食品原料質(zhì)量低劣、消費(fèi)者購(gòu)買(mǎi)食品的期待得不到滿(mǎn)足等問(wèn)題不斷出現(xiàn),使得食品安全問(wèn)題已經(jīng)引起了國(guó)內(nèi)外學(xué)者的普遍關(guān)注。
食品是一種具有專(zhuān)業(yè)性、技術(shù)性和滯后性特點(diǎn)的體驗(yàn)性商品,因此在獲取食品信息的過(guò)程中會(huì)遇到許多困難。加上食品的制造和銷(xiāo)售場(chǎng)所分散、范圍廣、產(chǎn)品銷(xiāo)售不透明等諸多制約條件,使得各相關(guān)方之間的信息不對(duì)稱(chēng),從而讓食品安全信息成為導(dǎo)致食品安全事故的主要根源。通過(guò)對(duì)國(guó)內(nèi)外相關(guān)學(xué)者的研究成果進(jìn)行全面分析,發(fā)現(xiàn)目前中國(guó)的食品安全問(wèn)題主要是源于信息不完整、信息不對(duì)稱(chēng)、信息不通暢。
為了保障食品安全,國(guó)家出臺(tái)了各種法律法規(guī),并要求加強(qiáng)監(jiān)管。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,“互聯(lián)網(wǎng)+”逐漸在食品安全監(jiān)管中發(fā)揮出重要的作用。在互聯(lián)網(wǎng)大環(huán)境下,網(wǎng)絡(luò)上的信息量呈爆炸式的增加。IDC公布的報(bào)告指出,到2025年,世界上的數(shù)據(jù)總?cè)萘繉哪壳暗?8ZB增至175ZB,相當(dāng)于平均每日產(chǎn)生491EB的數(shù)據(jù);世界范圍內(nèi)的互聯(lián)網(wǎng)使用者之間的交互將從目前的1426個(gè)增加到4090個(gè);全球范圍內(nèi)的互聯(lián)網(wǎng)接入裝置將從307億部增至754億部。與常規(guī)信息相比,互聯(lián)網(wǎng)信息具有實(shí)時(shí)性、覆蓋范圍廣、數(shù)據(jù)量大等特性,如果能將數(shù)據(jù)采集、信息處理等技術(shù)應(yīng)用到食品安全研究中,將有助于控制和監(jiān)管食品安全問(wèn)題。
食品保障關(guān)系到每個(gè)國(guó)民,因?yàn)楦鲊?guó)發(fā)展水平的差別,使得食品保障無(wú)論是在發(fā)達(dá)國(guó)家還是發(fā)展中國(guó)家,都有其各自的側(cè)重點(diǎn)。在互聯(lián)網(wǎng)環(huán)境下,各種食品安全數(shù)據(jù)呈現(xiàn)出多種形態(tài),我們首先要做的就是確定特定的目標(biāo)和數(shù)據(jù)源,然后通過(guò)三種不同的文本形式對(duì)食品安全進(jìn)行深入的探討。在信息技術(shù)方面,根據(jù)食品安全數(shù)據(jù)的表達(dá)方式,可以劃分為文字信息、多媒體信息和超文本信息;按結(jié)構(gòu)化的不同,可以劃分為非結(jié)構(gòu)化信息、半結(jié)構(gòu)化信息、結(jié)構(gòu)化信息。本文所采集的食品安全數(shù)據(jù)在結(jié)構(gòu)與形式上屬于一種非結(jié)構(gòu)性的文字資料。
在互聯(lián)網(wǎng)上,食品安全信息的語(yǔ)料以不具結(jié)構(gòu)性的自由文字為主導(dǎo),包括不同的新聞機(jī)構(gòu)對(duì)有關(guān)的食品安全問(wèn)題進(jìn)行的報(bào)道、專(zhuān)門(mén)的檢測(cè)單位出具的檢測(cè)結(jié)果、有關(guān)部門(mén)頒布的食品衛(wèi)生法規(guī)等。這些只是食品安全性文字資料中的一小部分,有關(guān)食品安全資料的種類(lèi)和數(shù)量則更多。由于受到科研經(jīng)費(fèi)和技術(shù)條件的限制,無(wú)法收集和統(tǒng)計(jì)完整的食品安全資料,為此,本文選擇了一些特定類(lèi)型的語(yǔ)料進(jìn)行分析。
在食品安全領(lǐng)域,違法使用的添加劑往往是導(dǎo)致食品安全問(wèn)題的主要原因,可以通過(guò)抽象的形式將食品和違禁的添加劑之間的內(nèi)在聯(lián)系表現(xiàn)出來(lái)。此外,在生產(chǎn)、加工、銷(xiāo)售等環(huán)節(jié),因不法經(jīng)營(yíng)活動(dòng)也會(huì)造成食品中毒、食源性疾病、食品污染等重大問(wèn)題。從性質(zhì)上講,中國(guó)的食品違法行為具有廣泛的普遍性和不確定性,在全國(guó)各地、每年的不同時(shí)段都會(huì)出現(xiàn),在空間和時(shí)間上存在著一定的不穩(wěn)定因素,使得食品安全事件的防范工作變得十分困難。如果能夠以可視的形式呈現(xiàn)出食品安全違法行為的發(fā)生時(shí)間、地點(diǎn)等特征,將有利于揭示其時(shí)間與空間的規(guī)律性,為今后的防控工作提供有益的借鑒與參考。
因?yàn)檫@些信息都是以中文的方式呈現(xiàn),所以在對(duì)其進(jìn)行處理和解析時(shí),除了采用常規(guī)的數(shù)據(jù)分析技術(shù)外,還需要與自然語(yǔ)言處理(NLP)技術(shù)相配合。在食品安全數(shù)據(jù)中使用的方法主要包括數(shù)據(jù)預(yù)處理、文本篩選和信息抽取等,其中,數(shù)據(jù)預(yù)處理技術(shù)是對(duì)爬蟲(chóng)獲得的原始資料進(jìn)行格式轉(zhuǎn)換、刪除無(wú)用符號(hào)、數(shù)據(jù)信息去重和數(shù)據(jù)集成等;本文采用的文字篩選技術(shù)是從收集到的原始資料中選出符合標(biāo)準(zhǔn)的食品安全性指標(biāo);信息抽取技術(shù)則是食品安全數(shù)據(jù)的關(guān)鍵技術(shù),對(duì)食品安全數(shù)據(jù)進(jìn)行有效的抽取和分析。
從網(wǎng)上直接獲取的數(shù)據(jù)格式多樣,信息密度低,且不適合存儲(chǔ)。為了克服以上問(wèn)題,本文采用了三種食品安全性數(shù)據(jù)的結(jié)構(gòu)形式,分別是食品安全新聞報(bào)道、食品檢測(cè)公告、食品安全刑事判決文件,提高了數(shù)據(jù)的查詢(xún)和管理水平;同時(shí),以 ECharts為主要的輔助手段,實(shí)現(xiàn)了從抽象到具象的轉(zhuǎn)換。盡管這三種不同的形式均以食品安全為話(huà)題,但其論文的結(jié)構(gòu)和具體的內(nèi)容卻不盡一致,所以在構(gòu)造這些模型前,必須根據(jù)它們不同的特征,分別進(jìn)行相應(yīng)的結(jié)構(gòu)化。本文從語(yǔ)料庫(kù)的組織和內(nèi)涵入手,對(duì)三類(lèi)數(shù)據(jù)的特征進(jìn)行了分析。
食品安全新聞是一種典型的新聞形式,目的是利用簡(jiǎn)潔的語(yǔ)言報(bào)道有關(guān)食品安全的事實(shí)。從論文的結(jié)構(gòu)上看,主要包括標(biāo)題、導(dǎo)語(yǔ)、正文、結(jié)語(yǔ)和落款;在表達(dá)方法上,先用一段文字概括新聞的由來(lái)和報(bào)道的時(shí)間,再用簡(jiǎn)潔、明了的文字來(lái)描寫(xiě)事情的細(xì)節(jié)。
食品檢測(cè)公告是指有關(guān)部門(mén)負(fù)責(zé)對(duì)市場(chǎng)上所銷(xiāo)售的產(chǎn)品和加工產(chǎn)品進(jìn)行抽樣檢測(cè),并將其結(jié)果以書(shū)面方式通知消費(fèi)者。在論文的組織方面,食品檢測(cè)公告由標(biāo)題、正文和落款三個(gè)方面構(gòu)成;在具體的檢測(cè)項(xiàng)目中,題目以簡(jiǎn)短的形式說(shuō)明檢測(cè)目標(biāo)和檢測(cè)批次等,正文包括檢測(cè)食品、檢出非法添加劑、超標(biāo)項(xiàng)目、處理結(jié)果等,落款的主體是檢測(cè)單位和檢測(cè)時(shí)間。
食品安全犯罪判決文件是一部專(zhuān)門(mén)記錄法院對(duì)食品安全案件進(jìn)行審判的司法文件。從論文的組織上看,包括標(biāo)題、正文及結(jié)尾部分;在具體的內(nèi)容上,包括被告人的基本情況、案件詳情、涉案食品、審判結(jié)果和審判時(shí)間等。
從以上的分析可以看出,三種不同文本形式的食品安全信息具有不同的表達(dá)要點(diǎn):食品安全新聞報(bào)道是對(duì)食品安全信息的發(fā)展歷程進(jìn)行描述;食品檢測(cè)公告強(qiáng)調(diào)了食品安全檢測(cè)和添加違禁添加劑之間的聯(lián)系;食品安全犯罪案件判決文件包括審判時(shí)間、地點(diǎn)、人員、食品等方面的內(nèi)容。
在食品安全領(lǐng)域,食品安全問(wèn)題的發(fā)生常常由于非法添加劑的濫用。如果能將食品與非法添加劑抽象為一個(gè)個(gè)實(shí)體節(jié)點(diǎn),并按照共現(xiàn)關(guān)系將它們用線(xiàn)連接,就能更有效地展示各類(lèi)食品與非法添加劑之間的內(nèi)在聯(lián)系。本文利用 ECharts技術(shù),根據(jù)對(duì)公告進(jìn)行結(jié)構(gòu)化的數(shù)據(jù)分析,建立了食物和違法添加劑的關(guān)系,以顯示其與違法添加物的聯(lián)系。具體的構(gòu)造方式可以分成以下步驟:一是抽取資料。抽取數(shù)據(jù)庫(kù)中的食品信息結(jié)構(gòu)檢測(cè)公告數(shù)據(jù),并將其轉(zhuǎn)換成列表形式。二是產(chǎn)生結(jié)點(diǎn)資料。將食物信息和違法添加劑的數(shù)量單獨(dú)地在統(tǒng)計(jì)清單中顯示,將其作為一個(gè)參數(shù)來(lái)設(shè)定結(jié)點(diǎn)尺寸,并將其分為以下幾種:“節(jié)點(diǎn)名稱(chēng)”:節(jié)點(diǎn)名稱(chēng)、“SymbolSize”:結(jié)點(diǎn)尺寸、“x”:座標(biāo)位置、“y”:座席地點(diǎn)、“category”:結(jié)合部類(lèi)型,從而更直觀地將食物與違法添加劑之間的關(guān)系展現(xiàn)出來(lái)。
在資料收集上,本文首先對(duì)目前網(wǎng)絡(luò)媒介中的食品安全性信息的特征進(jìn)行分析,確定了評(píng)估標(biāo)準(zhǔn),并據(jù)此分析出了特定的調(diào)查目標(biāo)和信息的來(lái)源;然后對(duì)食品安全信息的收集系統(tǒng)進(jìn)行詳細(xì)的描述和實(shí)現(xiàn),利用此方案從新華網(wǎng)、食品安全網(wǎng)、無(wú)訟網(wǎng)等網(wǎng)站收集食品安全新聞、食品檢測(cè)通告和食品安全犯罪裁判文書(shū)等三大類(lèi)食品安全信息,并給出了收集結(jié)果。
在現(xiàn)代社會(huì),尤其是在全球經(jīng)濟(jì)日益融合發(fā)展的今天,食品安全管理成為十分關(guān)鍵的社會(huì)公共問(wèn)題,為社會(huì)提供必要的食品安全管理公共服務(wù),也成為當(dāng)代政府必須承擔(dān)的社會(huì)管理責(zé)任。重視食品安全問(wèn)題需要不斷進(jìn)行有關(guān)食品安全管理的探討與交流,分析相關(guān)法律、制度和行政管理是解決食品安全問(wèn)題比較有效的方法。通過(guò)對(duì)食品安全行政管理的歷史、行政管理機(jī)構(gòu)、相關(guān)法規(guī)、食品安全管理相關(guān)法規(guī)及路徑等方面進(jìn)行探討與分析,可以歸納出目前食品安全管理中存在的問(wèn)題;通過(guò)對(duì)國(guó)內(nèi)外相關(guān)學(xué)者的研究成果進(jìn)行全面分析,發(fā)現(xiàn)目前中國(guó)食品安全問(wèn)題的根源是信息不完整、信息不對(duì)稱(chēng)、信息不通暢。
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,“互聯(lián)網(wǎng)+”逐漸在食品安全監(jiān)管中發(fā)揮出重要的作用,因此,本文圍繞計(jì)算機(jī)技術(shù)下食品安全信息的收集與處理進(jìn)行分析與研究。在互聯(lián)網(wǎng)媒介中,食品信息以多種形式存在,常規(guī)的信息收集技術(shù)無(wú)法實(shí)現(xiàn)對(duì)信息的全面覆蓋,在今后的工作中,可以從更加豐富的資源中獲取多樣化的食品安全數(shù)據(jù),提高其普適性。同時(shí),在信息加工上也要進(jìn)行智能化的改進(jìn),可以將其與大數(shù)據(jù)的分析技術(shù)結(jié)合起來(lái),以全面提高信息處理水平。