楊曦宇
(三線建設(shè)干部學(xué)院圖書館,四川 攀枝花 617000)
知識(shí)自動(dòng)化,就是知識(shí)型工作的自動(dòng)化,是通過計(jì)算機(jī)、網(wǎng)絡(luò)和平臺(tái)來自動(dòng)執(zhí)行之前只有人可以完成的知識(shí)型工作任務(wù),將人從一些單調(diào)重復(fù)和煩瑣的腦力勞動(dòng)中解放出來,將機(jī)器生產(chǎn)力進(jìn)一步釋放出來。知識(shí)自動(dòng)化是綜合運(yùn)用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、增強(qiáng)學(xué)習(xí),以及軟件技術(shù)、計(jì)算技術(shù)和自動(dòng)化技術(shù)來實(shí)現(xiàn)知識(shí)表示、獲取、分析、聯(lián)結(jié)和使用的智能系統(tǒng),是對(duì)知識(shí)工程和專家系統(tǒng)的進(jìn)化與迭代。知識(shí)工程通過知識(shí)的獲取、驗(yàn)證、表示、推論等活動(dòng)來構(gòu)建專家系統(tǒng)和智能系統(tǒng),專家系統(tǒng)是知識(shí)工程的智能應(yīng)用,知識(shí)自動(dòng)化與專家系統(tǒng)具有更為深刻的內(nèi)在聯(lián)系。作為工業(yè)4.0的九大技術(shù)支柱之一,作為閉環(huán)賦能技術(shù)的實(shí)現(xiàn),知識(shí)工作自動(dòng)化是基于模型而不是基于文檔的數(shù)據(jù)、信息和知識(shí)的自動(dòng)化流動(dòng)和處理,是基于解決復(fù)雜系統(tǒng)問題而提出的[1]。為了分析和處理復(fù)雜系統(tǒng)問題,知識(shí)自動(dòng)化還包含了常規(guī)的互聯(lián)網(wǎng)信息交互、模式識(shí)別、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和推理算法等最前沿的技術(shù)。大數(shù)據(jù)時(shí)代,大體量、超大體量和密集數(shù)據(jù)科學(xué)分析、處理與深度解析成為新常態(tài),傳統(tǒng)的專家系統(tǒng)等高度依賴專家智慧的知識(shí)處理、參考咨詢和知識(shí)服務(wù)方式已經(jīng)難以應(yīng)對(duì),自動(dòng)化和智能化的知識(shí)處理成為應(yīng)用新范式,以更好地實(shí)現(xiàn)數(shù)據(jù)向知識(shí)與智慧的轉(zhuǎn)化。
大數(shù)據(jù)時(shí)代,數(shù)據(jù)已經(jīng)成為整個(gè)社會(huì)運(yùn)行的基礎(chǔ)資源,成為國(guó)家的戰(zhàn)略資源。數(shù)據(jù)無時(shí)無刻不在改變著人們的生產(chǎn)、生活、學(xué)習(xí)、研究乃至思維方式。當(dāng)前,互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)作為公共基礎(chǔ)設(shè)施,在應(yīng)用中產(chǎn)生了海量的數(shù)據(jù),物聯(lián)網(wǎng)、智能工廠、智能車間等產(chǎn)生了海量的工業(yè)數(shù)據(jù),這就需要借助知識(shí)自動(dòng)化技術(shù)實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)流動(dòng)和智能分析。大工業(yè)時(shí)代需要機(jī)械自動(dòng)化、電氣電子自動(dòng)化,知識(shí)和智能時(shí)代需要辦公自動(dòng)化、知識(shí)工作自動(dòng)化,需要借助知識(shí)工作自動(dòng)化技術(shù)來實(shí)現(xiàn)人與機(jī)器的相互合作、相互補(bǔ)充。大數(shù)據(jù)時(shí)代,計(jì)算機(jī)與認(rèn)知系統(tǒng)將成為人類能力的擴(kuò)展和延伸。
而在經(jīng)濟(jì)社會(huì)發(fā)展形態(tài)上,人類社會(huì)開始進(jìn)入“后信息經(jīng)濟(jì)時(shí)代”,即所謂的智慧經(jīng)濟(jì)時(shí)代。智慧經(jīng)濟(jì)是一種創(chuàng)新形態(tài)的萌生經(jīng)濟(jì),能實(shí)現(xiàn)經(jīng)濟(jì)與環(huán)境、能源、社會(huì)最大限度地可持續(xù)發(fā)展。大數(shù)據(jù)是智慧經(jīng)濟(jì)的基礎(chǔ),智慧經(jīng)濟(jì)是農(nóng)業(yè)經(jīng)濟(jì)—工業(yè)經(jīng)濟(jì)—信息經(jīng)濟(jì)—知識(shí)經(jīng)濟(jì)發(fā)展的必然結(jié)果,創(chuàng)意—?jiǎng)?chuàng)新—?jiǎng)?chuàng)造—?jiǎng)?chuàng)業(yè)主導(dǎo)智慧經(jīng)濟(jì)時(shí)代知識(shí)的發(fā)展。智慧經(jīng)濟(jì)通過對(duì)知識(shí)的萃取、開發(fā)和運(yùn)用,通過對(duì)傳統(tǒng)產(chǎn)業(yè)的滲透、改造和升級(jí),促使知識(shí)功能化、個(gè)性化、價(jià)值化和增值化。作為未來經(jīng)濟(jì)社會(huì)發(fā)展的顛覆性技術(shù)、工業(yè)4.0的九大支柱技術(shù)之一,知識(shí)工作自動(dòng)化必將在智慧社會(huì)、智慧經(jīng)濟(jì)、智能產(chǎn)業(yè)和智能制造中發(fā)揮重要作用。2013年麥肯錫全球研究所發(fā)布的《顛覆技術(shù):即將變革生活、商業(yè)和全球經(jīng)濟(jì)的發(fā)展》報(bào)告中提出了對(duì)未來的發(fā)展將產(chǎn)生顛覆性力量的12種技術(shù),其中知識(shí)工作自動(dòng)化被放在了第二位。與此相類似的思路,是中國(guó)學(xué)者提出的大數(shù)據(jù)時(shí)代的知識(shí)工程技術(shù),提出了社會(huì)物理信息系統(tǒng)概念,同樣在2013年,中國(guó)學(xué)者提出知識(shí)自動(dòng)化技術(shù)。
研究方面,繼數(shù)學(xué)家吳文俊和他的幾何定理機(jī)器證明在國(guó)際機(jī)器證明領(lǐng)域產(chǎn)生巨大的影響,雙清論壇召開多次會(huì)議之后,2015年9月,中國(guó)工程科技中長(zhǎng)期發(fā)展戰(zhàn)略研究項(xiàng)目“大數(shù)據(jù)與制造流程知識(shí)自動(dòng)化發(fā)展戰(zhàn)略研究”在南京舉行了項(xiàng)目研討會(huì)。該項(xiàng)目由中國(guó)工程院、國(guó)家自然科學(xué)基金委聯(lián)合下達(dá),由哈爾濱工業(yè)大學(xué)、中南大學(xué)、中科院沈陽(yáng)自動(dòng)化所等九所科研院所聯(lián)合開展研究,旨在為中國(guó)流程工業(yè)的發(fā)展提供戰(zhàn)略性指導(dǎo)。之后又召開項(xiàng)目和分組研討會(huì),對(duì)我國(guó)流程工業(yè)“大數(shù)據(jù)與制造流程知識(shí)自動(dòng)化發(fā)展戰(zhàn)略”項(xiàng)目的研究目標(biāo)、研究思路、總體架構(gòu)、科學(xué)問題、發(fā)展方向、重點(diǎn)任務(wù)、關(guān)鍵技術(shù)、研究計(jì)劃等內(nèi)容進(jìn)行了深入討論,明確了大數(shù)據(jù)和知識(shí)自動(dòng)化對(duì)我國(guó)發(fā)展流程工業(yè)智能優(yōu)化制造的重要意義和我國(guó)智能制造工業(yè)的發(fā)展方向。2016年6月,國(guó)家自然科學(xué)基金委發(fā)布的《國(guó)家自然科學(xué)基金“十三五”發(fā)展規(guī)劃》[2],在學(xué)科布局中新增了“數(shù)據(jù)與計(jì)算科學(xué)”學(xué)科,在優(yōu)先發(fā)展領(lǐng)域中包括了“流程工業(yè)知識(shí)自動(dòng)化系統(tǒng)理論與技術(shù)”。2017年5月,同濟(jì)大學(xué)人工智能研究院成立并舉行學(xué)術(shù)報(bào)告會(huì),東北大學(xué)流程工業(yè)綜合自動(dòng)化國(guó)家重點(diǎn)實(shí)驗(yàn)室柴天佑教授作《大數(shù)據(jù)與知識(shí)自動(dòng)化驅(qū)動(dòng)的制造流程智能化》學(xué)術(shù)報(bào)告。2017年7月,北京科技大學(xué)自動(dòng)化學(xué)院公布了工業(yè)過程知識(shí)自動(dòng)化教育部重點(diǎn)實(shí)驗(yàn)室開放課題申請(qǐng)。2020年11月,國(guó)家自然科學(xué)基金委員會(huì)第267期雙清論壇在北京舉辦,論壇主題為“人工智能對(duì)數(shù)學(xué)的機(jī)遇與挑戰(zhàn)”,研討內(nèi)容涉及數(shù)學(xué)、信息科學(xué)與智慧醫(yī)療等多個(gè)學(xué)科領(lǐng)域,會(huì)議對(duì)機(jī)器學(xué)習(xí)自動(dòng)化與元學(xué)習(xí)相關(guān)研究、深度神經(jīng)網(wǎng)絡(luò)、類腦智能和堆球理論等研究前沿問題進(jìn)行深入探討。在生產(chǎn)領(lǐng)域,無論是離散型工業(yè)或是流程型工業(yè),特別是復(fù)雜系統(tǒng)領(lǐng)域,知識(shí)自動(dòng)化都已開始有所應(yīng)用。知識(shí)自動(dòng)化將使未來的工業(yè)生產(chǎn)突破流程型,或者是離散型的傳統(tǒng)定義。隨著智能機(jī)器人的深度介入,工業(yè)流程和工業(yè)生產(chǎn)過程將發(fā)生根本性的變革。而就廣義知識(shí)自動(dòng)化而言,其在圖書館學(xué)情報(bào)學(xué)、知識(shí)管理和知識(shí)服務(wù)領(lǐng)域的應(yīng)用包括自動(dòng)標(biāo)注技術(shù)、自動(dòng)推薦系統(tǒng)、自動(dòng)問答系統(tǒng)、基于大數(shù)據(jù)挖掘的知識(shí)發(fā)現(xiàn)系統(tǒng)、文本情感分析和機(jī)器翻譯等方面。以自動(dòng)問答系統(tǒng)為例,經(jīng)過以結(jié)構(gòu)化數(shù)據(jù)和數(shù)據(jù)庫(kù)自然語言接口為中心的自動(dòng)問答系統(tǒng),以信息和信息檢索技術(shù)為中心的自動(dòng)問答系統(tǒng)和以知識(shí)和知識(shí)自動(dòng)化為中心的自動(dòng)問答系統(tǒng)的發(fā)展歷程,自動(dòng)問答系統(tǒng)可以像人類一樣思考,對(duì)虛擬空間的大數(shù)據(jù)進(jìn)行深度開發(fā)和智力挖掘。
技術(shù)的突破,特別是人工智能技術(shù)的突破,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)及深度增強(qiáng)學(xué)習(xí)等理論研究和工程化的成熟,為知識(shí)自動(dòng)化的發(fā)展奠定了堅(jiān)實(shí)的技術(shù)基礎(chǔ)。比如無人駕駛技術(shù),現(xiàn)在不是用計(jì)算機(jī)編程方法寫出來,不是事先編好程序邏輯,而是通過模式識(shí)別、K-均值、多分類神經(jīng)網(wǎng)絡(luò)、貝葉斯回歸算法和深度學(xué)習(xí)算法,通過對(duì)大數(shù)據(jù)的分析自己得出邏輯,讓機(jī)器自己產(chǎn)生行為策略。這是人工智能和原先控制論最根本的區(qū)別。2006年深度學(xué)習(xí)取得重大研究進(jìn)展,2011年之后推出智能系統(tǒng),經(jīng)過學(xué)習(xí)和訓(xùn)練,系統(tǒng)能夠從原始信息中自動(dòng)抽取知識(shí),對(duì)知識(shí)進(jìn)行分類并且能夠分析和理解自然語言。如此,系統(tǒng)就能夠像人類一樣學(xué)習(xí),并從已經(jīng)發(fā)生的事件進(jìn)行推理和總結(jié)經(jīng)驗(yàn)。
特別值得一提的是,增強(qiáng)學(xué)習(xí)在算法上由程序計(jì)算進(jìn)化到認(rèn)知計(jì)算。根據(jù)麥肯錫預(yù)測(cè),到2025年,移動(dòng)互聯(lián)網(wǎng)、知識(shí)工作自動(dòng)化、物聯(lián)網(wǎng)、云、先進(jìn)機(jī)器人、自動(dòng)汽車這六大技術(shù)領(lǐng)域相關(guān)的產(chǎn)業(yè),經(jīng)濟(jì)規(guī)模將達(dá)到數(shù)十萬億美元,而這些產(chǎn)業(yè)都離不開認(rèn)知計(jì)算。認(rèn)知計(jì)算是這些顛覆性技術(shù)及產(chǎn)品的“中樞神經(jīng)系統(tǒng)”,是感知人、物、事件、環(huán)境,并綜合進(jìn)行數(shù)據(jù)分析與決策的關(guān)鍵組件。當(dāng)前,程序計(jì)算方式已無法滿足復(fù)雜環(huán)境下大數(shù)據(jù)運(yùn)算的需求,需要系統(tǒng)本身的認(rèn)知和分析,向認(rèn)知計(jì)算發(fā)展。在眾多的算法中,IBM稱認(rèn)知計(jì)算為“皇冠上的明珠”。
隨著大數(shù)據(jù)時(shí)代的來臨,數(shù)據(jù)的種類、規(guī)模、容量、速度和復(fù)雜程度都超過了人腦的認(rèn)知和處理能力,認(rèn)知計(jì)算及其近年的進(jìn)展為大數(shù)據(jù)分析和理解提供了新的技術(shù)支持與可能性。以IBM Watson、AlphaGo、AlphaGo Zero為代表的認(rèn)知計(jì)算系統(tǒng),通過對(duì)大數(shù)據(jù)進(jìn)行實(shí)時(shí)運(yùn)算和分析,能夠從自身與數(shù)據(jù)、與人的交互中學(xué)習(xí),從而具有洞察、理解、推理、分析的能力和解決問題的能力,擁有“智庫(kù)”和決策功能,能夠不斷自我提高,有的人甚至認(rèn)為智能機(jī)器人會(huì)由客體變?yōu)槭澜缧碌闹黧w。
2017年1月,我國(guó)工業(yè)和信息化部發(fā)布《軟件和信息技術(shù)服務(wù)業(yè)發(fā)展規(guī)劃(2016—2020年)》[3],指出軟件是新一代信息技術(shù)產(chǎn)業(yè)的靈魂,將“軟件定義”視為“信息革命的新標(biāo)志和新特征”。軟件和信息技術(shù)服務(wù)業(yè)是引領(lǐng)科技創(chuàng)新、驅(qū)動(dòng)經(jīng)濟(jì)社會(huì)轉(zhuǎn)型發(fā)展的核心力量,是建設(shè)制造強(qiáng)國(guó)和網(wǎng)絡(luò)強(qiáng)國(guó)的核心支撐。
工業(yè)軟件是人們對(duì)工業(yè)研發(fā)設(shè)計(jì)、生產(chǎn)制造、經(jīng)營(yíng)管理、運(yùn)維服務(wù)等全生命周期業(yè)務(wù)環(huán)節(jié)規(guī)律的模型化、代碼化、工具化,是工業(yè)知識(shí)、技術(shù)積累和經(jīng)驗(yàn)體系的新載體,是數(shù)百年來人類最優(yōu)秀的工業(yè)知識(shí)和技術(shù)積累的新集成,是實(shí)現(xiàn)工業(yè)數(shù)字化、網(wǎng)絡(luò)化、智能化的核心,是工業(yè)企業(yè)最重要的知識(shí)資產(chǎn)。工業(yè)軟件作為工業(yè)創(chuàng)新知識(shí)長(zhǎng)期積累、沉淀并在應(yīng)用中迭代進(jìn)化的軟件化產(chǎn)物,在某種程度上,代表著一個(gè)國(guó)家工業(yè)化和信息化融合的能力和水平。選擇恰當(dāng)?shù)墓I(yè)軟件,不僅能夠促進(jìn)核心知識(shí)的重用和繼承,有助于數(shù)據(jù)的自由流動(dòng)、知識(shí)工作的自動(dòng)化以及各工作流程的順利銜接,更能為建立數(shù)字化工廠、實(shí)現(xiàn)智能制造奠定基礎(chǔ)。
把人類知識(shí)嵌入軟件,把軟件嵌入芯片,把芯片嵌入機(jī)器設(shè)備,從而使機(jī)器實(shí)現(xiàn)由使能向賦能的轉(zhuǎn)變。在信息技術(shù)革命前,知識(shí)通過大腦來記憶,通過語言來口傳心授、言傳身教、吟誦傳唱得以傳承,通過文字書寫在竹簡(jiǎn)錦帛、宣紙獸皮上得以傳播,通過篆刻在甲骨拓片上得以保存,在保護(hù)保存、傳播傳承、學(xué)習(xí)使用上受到時(shí)空的限制。軟件把原本需要人思考的過程和使用的數(shù)據(jù)、信息、知識(shí)和圖表圖像錄入計(jì)算機(jī),僅用幾張光盤、移動(dòng)硬盤就可保存大型圖書館所有的紙質(zhì)文獻(xiàn)資源。通過網(wǎng)絡(luò)泛在、軟件泛在、數(shù)據(jù)泛在和知識(shí)泛在,人們可以像使用水電氣一樣使用網(wǎng)絡(luò)、使用知識(shí)[4]。軟件本身就是人類對(duì)物質(zhì)世界和精神世界探索的數(shù)字化成果,是對(duì)陳述性知識(shí)和程序性知識(shí)的模型化、代碼化,是對(duì)人的隱性知識(shí)、專有知識(shí)、經(jīng)驗(yàn)知識(shí)、技能技巧和訣竅的顯性表達(dá)。作為數(shù)字化的指令集合,作為事物運(yùn)行的規(guī)則體系,軟件對(duì)其所承載的知識(shí)、經(jīng)驗(yàn)和技術(shù),進(jìn)行了全方位的封裝和重構(gòu),形成模型化、算法化、數(shù)字化的知識(shí)形態(tài),并且可以借由互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)和智能終端跨越時(shí)空傳播使用,從而降低知識(shí)獲取的成本,提高知識(shí)的利用率。內(nèi)嵌入機(jī)器設(shè)備的工業(yè)軟件使機(jī)器由硬變軟,更具靈活性和可調(diào)節(jié)性。
軟件定義(Software Defined,SD)打破了原來以硬件為核心的傳統(tǒng)框架,軟件定義硬件,軟件開發(fā)軟件,軟件復(fù)用來提高效率,而將領(lǐng)域知識(shí)封裝成組件模塊,重復(fù)利用本身也是“知識(shí)自動(dòng)化”的范疇,這樣可以讓機(jī)器快速響應(yīng),即可進(jìn)行個(gè)性化定制和數(shù)字化生產(chǎn),而無需復(fù)雜的編碼、測(cè)試過程。
知識(shí)自動(dòng)化是基于虛擬空間的自動(dòng)化,需要從物理系統(tǒng)的自動(dòng)化轉(zhuǎn)向基于信息物理系統(tǒng)(Cyber-Physical Systems,CPS)的自動(dòng)化,從CPS的自動(dòng)化轉(zhuǎn)向基于“人—信息—物理系統(tǒng)”(Human-Cyber-Physical Systems,HCPS)或社會(huì)物理信息系統(tǒng)(Cyber-Physical-Social Systems,CPSS)的自動(dòng)化,從而實(shí)現(xiàn)虛擬網(wǎng)絡(luò)世界與現(xiàn)實(shí)物理世界的深度融合、完美映射和協(xié)同互動(dòng)。CPS是虛擬空間與物理空間交互的實(shí)現(xiàn)載體,將整合虛實(shí)子系統(tǒng)的資源和能力,形成一個(gè)新的、整體功能和性能更加優(yōu)越的新系統(tǒng)。CPS可以將資源、信息、物體以及人緊密聯(lián)系在一起,實(shí)現(xiàn)知識(shí)表示、知識(shí)存儲(chǔ)、知識(shí)共享、知識(shí)推理。
CPS通過集成先進(jìn)的感知、計(jì)算、通信、控制、遠(yuǎn)程協(xié)調(diào)和自治等信息技術(shù)和自動(dòng)控制技術(shù),構(gòu)建物理空間與信息空間中人、機(jī)、物、環(huán)境、信息等要素相互映射、實(shí)時(shí)交互、高效協(xié)同的復(fù)雜系統(tǒng),實(shí)現(xiàn)系統(tǒng)內(nèi)資源配置和運(yùn)行的按需響應(yīng)、快速迭代、動(dòng)態(tài)優(yōu)化。CPS是軟件和算法的集成,工業(yè)軟件定義了信息物理系統(tǒng),其本質(zhì)是要打造“狀態(tài)感知—實(shí)時(shí)分析—科學(xué)決策—精準(zhǔn)執(zhí)行”的數(shù)據(jù)閉環(huán),構(gòu)筑數(shù)據(jù)自動(dòng)流動(dòng)的閉環(huán)賦能體系和規(guī)則[5]。通過對(duì)物質(zhì)世界運(yùn)行狀態(tài)的感知,工業(yè)軟件實(shí)現(xiàn)隱性數(shù)據(jù)、顯性數(shù)據(jù)、信息、知識(shí)的轉(zhuǎn)化,體現(xiàn)了信息物理系統(tǒng)的認(rèn)知水平和智慧程度。
推動(dòng)“中國(guó)制造2025”,需要工業(yè)云、大數(shù)據(jù)、物聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)等技術(shù)的支撐,然而要實(shí)現(xiàn)智能制造系統(tǒng)動(dòng)態(tài)性能優(yōu)化、設(shè)備特征化和數(shù)控?zé)o縫運(yùn)行,需要建立以工業(yè)產(chǎn)品的數(shù)字化基因知識(shí)化處理為基礎(chǔ)的工業(yè)生態(tài)系統(tǒng),解決知識(shí)沉淀和經(jīng)驗(yàn)積累的循環(huán)利用問題。知識(shí)自動(dòng)化中的“知識(shí)”一方面包括人的知識(shí)和經(jīng)驗(yàn),另一方面也包括基于信息物理系統(tǒng)CPS的數(shù)據(jù)、信息和隱性知識(shí)的狀態(tài)感知,實(shí)時(shí)分析、關(guān)聯(lián)、處理和計(jì)算。