對(duì)標(biāo)準(zhǔn)數(shù)字化頂層設(shè)計(jì)的理解與建議,我主要分 三個(gè)層面來(lái)說(shuō),一是標(biāo)準(zhǔn)數(shù)字化頂層設(shè)計(jì)的理解,二 是標(biāo)準(zhǔn)數(shù)字化的需求和存在問(wèn)題,三是標(biāo)準(zhǔn)數(shù)字化的 建議。
第一、標(biāo)準(zhǔn)數(shù)字化頂層設(shè)計(jì)的理解
對(duì) 標(biāo) 準(zhǔn) 數(shù) 字 化 頂 層 設(shè) 計(jì) 的 理 解 離 不 開(kāi) I S O SMART的定義,ISO SMART(Standards M a c h i n e A p p l i c a b l e , R e a d a b l e a n d Transferable)為機(jī)器可應(yīng)用、可識(shí)讀、可理解 的標(biāo)準(zhǔn)。第0層是傳統(tǒng)紙質(zhì)標(biāo)準(zhǔn)(PAPER)。第1 層是開(kāi)放數(shù)字格式標(biāo)準(zhǔn),“提供檢索和閱讀,比如 PDF格式”。第2層是機(jī)器可讀文檔,即“結(jié)構(gòu)化標(biāo) 準(zhǔn)文檔,內(nèi)容可被軟件處理”,這是在“語(yǔ)法”層 面把標(biāo)準(zhǔn)進(jìn)行拆解,拆成篇、章、節(jié)等段落,以及 表格、圖片等語(yǔ)法層面的內(nèi)容碎片,進(jìn)而存成XML (Extensible Markup Language, 擴(kuò)展標(biāo)記語(yǔ)言) 或JSON(JavaScript Object Notation,一種輕量 級(jí)的數(shù)據(jù)交換格式)。目前,標(biāo)準(zhǔn)館用技術(shù)手段把所 有的標(biāo)準(zhǔn)進(jìn)行了OCR識(shí)別,并自動(dòng)生成機(jī)器可讀文 檔,該項(xiàng)工作在2013年已經(jīng)全部完成。第3層為機(jī)器 可讀內(nèi)容,即“語(yǔ)義增強(qiáng)內(nèi)容,為一個(gè)目的接受多個(gè) 標(biāo)準(zhǔn)的內(nèi)容”,這是在“語(yǔ)義”層面,把標(biāo)準(zhǔn)組織成 知識(shí)圖譜,也是我們常說(shuō)的標(biāo)準(zhǔn)剪裁。舉個(gè)例子,喝 茶至少和三類(lèi)標(biāo)準(zhǔn)有關(guān),茶葉標(biāo)準(zhǔn)、飲用水標(biāo)準(zhǔn)、杯 子標(biāo)準(zhǔn),可三類(lèi)標(biāo)準(zhǔn)剪裁成專(zhuān)門(mén)針對(duì)喝茶的標(biāo)準(zhǔn)。盡 管其存儲(chǔ)形式也是XML或者JSON,但“機(jī)器可讀 內(nèi)容”與“機(jī)器可讀文檔”最大區(qū)別正是其語(yǔ)義的表 達(dá)。產(chǎn)品標(biāo)準(zhǔn)的語(yǔ)義,就是揭示標(biāo)準(zhǔn)化對(duì)象及其屬性 的關(guān)系。這也是標(biāo)準(zhǔn)館目前在做的工作。我們針對(duì) 26,000余項(xiàng)國(guó)家、行業(yè)、地方標(biāo)準(zhǔn)中的產(chǎn)品標(biāo)準(zhǔn), 做了標(biāo)準(zhǔn)化對(duì)象和指標(biāo)項(xiàng)的知識(shí)組織,形成了87萬(wàn) 余條的指標(biāo)數(shù)據(jù),初步具備了開(kāi)展機(jī)器可讀內(nèi)容層面的標(biāo)準(zhǔn)知識(shí)服務(wù)能力。第4層為機(jī)器可解釋內(nèi)容,即 “具備信息建模能力以表達(dá)內(nèi)容關(guān)聯(lián)要素,具備自學(xué) 習(xí)的分析驗(yàn)證閉環(huán)能力,使得內(nèi)容可達(dá)可推理,形成 不間斷的價(jià)值流,提供智能問(wèn)答或預(yù)測(cè)內(nèi)容”。這是 在“語(yǔ)用”層面,描述標(biāo)準(zhǔn)文獻(xiàn)的智能應(yīng)用,主要包 括:智能問(wèn)答,基于標(biāo)準(zhǔn)知識(shí)圖譜,能夠去理解和回 答問(wèn)題,在一些實(shí)踐應(yīng)用場(chǎng)景,也能基于標(biāo)準(zhǔn)化對(duì)象 和屬性自動(dòng)生成文檔;不間斷的價(jià)值流,就是展望從 標(biāo)準(zhǔn)研制到應(yīng)用的全流程,全部是數(shù)據(jù)形式,機(jī)器識(shí) 讀,沒(méi)有人的參與,這就是價(jià)值流的不間斷;具備自 學(xué)習(xí)的分析驗(yàn)證的閉環(huán)能力,使內(nèi)容可達(dá)可推理,即 基于標(biāo)準(zhǔn)構(gòu)建流程模型,使得內(nèi)容可以進(jìn)行推理,形 成作業(yè)流程指導(dǎo)或者根因分析等專(zhuān)家系統(tǒng),這也是我 們目前正在研究的方向。
我認(rèn)為標(biāo)準(zhǔn)數(shù)字化是一個(gè)交叉學(xué)科,包括圖 書(shū)館學(xué)指導(dǎo)業(yè)務(wù),標(biāo)準(zhǔn)化定義應(yīng)用場(chǎng)景,計(jì)算機(jī)突 破技術(shù)瓶頸,最終共同實(shí)現(xiàn)價(jià)值體現(xiàn)。我們需要用 圖書(shū)館學(xué)、語(yǔ)義網(wǎng)和知識(shí)本體的理論去指導(dǎo)這個(gè)方 法,用標(biāo)準(zhǔn)化理論與方法的來(lái)定義各種場(chǎng)景的應(yīng)用 需求。作為管理學(xué)科,在企業(yè)的應(yīng)用場(chǎng)景中有沒(méi)有 數(shù)字化賦能標(biāo)準(zhǔn)化的需求,這種需求如何去提升, 如何去挖掘?這是標(biāo)準(zhǔn)化學(xué)科需要做的事情。計(jì)算 機(jī)學(xué)科做的是突破技術(shù)瓶頸,如高效計(jì)算、機(jī)器學(xué) 習(xí)和自然語(yǔ)言處理等,機(jī)器能解決的只是代替人的 重復(fù)性工作,解決的是從1到N的問(wèn)題。從0到1的 過(guò)程,一定是標(biāo)準(zhǔn)化的研究人員去根據(jù)需求分析出 來(lái),根據(jù)應(yīng)用場(chǎng)景去設(shè)計(jì)。最后是價(jià)值體現(xiàn),數(shù)字化賦能標(biāo)準(zhǔn)化、提升標(biāo)準(zhǔn)的實(shí)施能力,這是我現(xiàn)在認(rèn) 識(shí)的兩個(gè)價(jià)值。我認(rèn)為標(biāo)準(zhǔn)化本身是一個(gè)管理學(xué)科, 在政府或企業(yè)的應(yīng)用場(chǎng)景中,標(biāo)準(zhǔn)化還是應(yīng)充分體現(xiàn) 出管理特性,不管是標(biāo)準(zhǔn)大數(shù)據(jù)、標(biāo)準(zhǔn)制修訂或者標(biāo) 準(zhǔn)編寫(xiě)等軟件平臺(tái),都是為政府或企業(yè)的標(biāo)準(zhǔn)化實(shí)施 應(yīng)用服務(wù)的,目標(biāo)是提升它的數(shù)字化實(shí)施能力,讓標(biāo) 準(zhǔn)能夠快速地應(yīng)用到企業(yè)的具體工藝場(chǎng)景中,能夠快 速地讓政府做出正確的決策。
第二、標(biāo)準(zhǔn)數(shù)字化的需求和存在問(wèn)題
在需求上,標(biāo)準(zhǔn)數(shù)字化的信息服務(wù),主要包括情 報(bào)服務(wù)、檢索服務(wù)和行業(yè)應(yīng)用。情報(bào)服務(wù),主要包括 起草單位大數(shù)據(jù)分析,提出單位、歸口單位、起草人 和國(guó)別分析;檢索服務(wù),主要包括擴(kuò)展全文搜索,建 設(shè)指標(biāo)數(shù)據(jù)庫(kù),細(xì)化檢索體驗(yàn),也就是要做到查到、 查全、查準(zhǔn)、關(guān)聯(lián);行業(yè)應(yīng)用,包括標(biāo)準(zhǔn)制修訂、標(biāo) 準(zhǔn)編寫(xiě)、標(biāo)準(zhǔn)管理、標(biāo)準(zhǔn)查新查重、標(biāo)準(zhǔn)對(duì)比等。
信息服務(wù)包括傳統(tǒng)服務(wù)和增值服務(wù)。傳統(tǒng)的服 務(wù)包括文獻(xiàn)檢索、文獻(xiàn)閱覽、信息咨詢(xún)、信息跟蹤、 信息培訓(xùn)和信息推送,傳統(tǒng)服務(wù)盡管需求明確,但是 缺乏服務(wù)深化的潛力,而且供給飽和;增值服務(wù)主要 包括專(zhuān)題的數(shù)據(jù)服務(wù)、知識(shí)服務(wù)、情報(bào)服務(wù)和工具服 務(wù),其主要問(wèn)題為行業(yè)需求不明確,需要技術(shù)引領(lǐng), 產(chǎn)品先行,更多地引導(dǎo)和挖掘。
第三、標(biāo)準(zhǔn)數(shù)字化的建議
現(xiàn)階段國(guó)家標(biāo)準(zhǔn)館的標(biāo)準(zhǔn)數(shù)字化主要發(fā)展方向, 一是定位需求痛點(diǎn),用數(shù)字化賦能標(biāo)準(zhǔn)化,進(jìn)而解決 政府和企業(yè)的標(biāo)準(zhǔn)化管理需求,需求痛點(diǎn)就是標(biāo)準(zhǔn)化 需要數(shù)字化賦能;二是補(bǔ)足短板,我們需要一個(gè)面向 各行業(yè)的全流程解決方案,我們現(xiàn)有的全流程解決方 案還存在著用戶(hù)體驗(yàn)以及技術(shù)上的難題需要突破,需 要大量的需求磨合和軟件迭代升級(jí);三是應(yīng)用人工智 能技術(shù),包括解放傳統(tǒng)工作和助力創(chuàng)新工作;四是延 伸產(chǎn)品線,把標(biāo)準(zhǔn)數(shù)字化集成到企業(yè)的流程、設(shè)計(jì)、 制造、管理、運(yùn)維工具中。
點(diǎn)評(píng):于欣麗
甘克勤介紹了ISO SMART的定義,介紹了標(biāo)準(zhǔn)館這幾年對(duì)標(biāo)準(zhǔn)數(shù)字化所做工作,以及取得的 成果。標(biāo)準(zhǔn)館在2013年已經(jīng)達(dá)到了SMART第2層,現(xiàn)在正在做第3層,取得了很好的成效。我們看 到,在頂層設(shè)計(jì)方面,我國(guó)已經(jīng)有了一個(gè)比較清晰的思路和框架,當(dāng)然還需要不斷完善。