易 翔,鞠成曉
(東莞城市學(xué)院商學(xué)院,廣東 東莞 523419)
在智能技術(shù)沖擊傳統(tǒng)產(chǎn)業(yè)的時(shí)代背景下,商業(yè)模式和管理模式被迫處于高速迭代變更狀態(tài)。產(chǎn)業(yè)需求的變化向上傳遞至專注于人才輸出的教育行業(yè),也驅(qū)動(dòng)著擁有商科專業(yè)的各類高校不得不思考如何在課程建設(shè)中進(jìn)行“數(shù)智化”轉(zhuǎn)型。除了硬件的導(dǎo)入和升級(jí),通過(guò)計(jì)算機(jī)強(qiáng)大的運(yùn)算能力及機(jī)器的理性決策,輔助教學(xué)人員完成商業(yè)概念和產(chǎn)業(yè)重要節(jié)點(diǎn)內(nèi)容的傳導(dǎo),使得“新商科”這個(gè)概念逐漸成為炙手可熱的話題[1-3]。2018年5月于北京召開(kāi)的教育部產(chǎn)學(xué)合作協(xié)同育人項(xiàng)目對(duì)接會(huì)上,首次提出了“新文科”概念。相對(duì)于傳統(tǒng)文科,新概念更加強(qiáng)調(diào)學(xué)科深度交叉融合,以促進(jìn)該領(lǐng)域新理論、新機(jī)制、新模式的形成。在服務(wù)國(guó)家應(yīng)對(duì)當(dāng)今更為錯(cuò)綜復(fù)雜的全球形勢(shì)的同時(shí),促進(jìn)國(guó)內(nèi)經(jīng)濟(jì)社會(huì)領(lǐng)域深化改革,幫助人們解決與精神價(jià)值相關(guān)的重大理論問(wèn)題?!靶律炭啤笔窃凇靶挛目啤斌w系下延展出的關(guān)于經(jīng)濟(jì)管理的教育門類分支。傳統(tǒng)商科對(duì)專業(yè)人才的塑造,不論是會(huì)計(jì)、財(cái)務(wù)管理,還是人力資源管理和市場(chǎng)營(yíng)銷,大多是基于學(xué)科內(nèi)容區(qū)分,幫助未來(lái)從業(yè)者完成在認(rèn)知層面的職能定位。但是,當(dāng)下復(fù)雜的經(jīng)濟(jì)環(huán)境要求商科專業(yè)人士能從商業(yè)手段、管理技巧及操作技能方面主動(dòng)回應(yīng)由于技術(shù)創(chuàng)新、社會(huì)變革所帶來(lái)的產(chǎn)業(yè)新需求。因此,“新商科”體系塑造出的專業(yè)人士一定是既懂經(jīng)濟(jì)、管理,又懂新技術(shù)應(yīng)用的跨學(xué)科、復(fù)合型人才。而這樣的多領(lǐng)域?qū)I(yè)認(rèn)知技能融會(huì)貫通的一個(gè)關(guān)鍵就在于新商科人才數(shù)據(jù)思維特征的培育[4]。王昕等[5]在探究數(shù)字經(jīng)濟(jì)時(shí)代新商科專業(yè)群的建設(shè)路徑問(wèn)題時(shí)指出,當(dāng)下的教學(xué)重心應(yīng)該逐步從占有知識(shí)轉(zhuǎn)向利用多種數(shù)字化技術(shù)和數(shù)據(jù)內(nèi)容解構(gòu)新商科跨專業(yè)領(lǐng)域(如科技金融、精準(zhǔn)營(yíng)銷、跨境電商等)的應(yīng)用知識(shí)層面。一方面是為了適應(yīng)市場(chǎng)變革,因?yàn)閿?shù)字化技術(shù)和數(shù)據(jù)要素不僅是深化數(shù)字經(jīng)濟(jì)迭代發(fā)展的引擎,同時(shí)也是驅(qū)動(dòng)商業(yè)模式進(jìn)化升級(jí)的關(guān)鍵;另一方面,加強(qiáng)對(duì)商科人才數(shù)據(jù)思維的培育,也能促進(jìn)我國(guó)人才市場(chǎng)對(duì)國(guó)際格局變化和社會(huì)科學(xué)中國(guó)化需求進(jìn)行有效回應(yīng)。
隨著全球化的技術(shù)迭代快速更新,知識(shí)密集型的經(jīng)濟(jì)模式正逐漸主導(dǎo)著社會(huì)的發(fā)展。知識(shí)經(jīng)濟(jì)帶來(lái)的關(guān)于技術(shù)創(chuàng)新、產(chǎn)品周期、客戶偏好、商業(yè)模式等爆炸式增長(zhǎng)的信息,極大地延長(zhǎng)了專業(yè)人士的認(rèn)知周期,同時(shí)也給他們?cè)谥R(shí)選擇上帶來(lái)了困難。為了幫助專業(yè)人士迅速地進(jìn)行新知識(shí)結(jié)構(gòu)的搭建,并快速實(shí)現(xiàn)信息檢索,專注于專業(yè)知識(shí)核心節(jié)點(diǎn)繪制、特征信息挖掘、關(guān)聯(lián)關(guān)系分析、知識(shí)計(jì)量生成和可視化展示的新興學(xué)科逐漸成為研究人員的討論熱點(diǎn)。這門包含著信息處理、計(jì)算機(jī)手段、統(tǒng)計(jì)算法、應(yīng)用數(shù)學(xué)模型、商科理論等眾多交叉領(lǐng)域?qū)I(yè)技術(shù)的學(xué)科被定義為“知識(shí)圖譜”[6]。知識(shí)節(jié)點(diǎn)的降維分類、節(jié)點(diǎn)內(nèi)容的關(guān)聯(lián)、相關(guān)重要性的計(jì)量及節(jié)點(diǎn)空間位置的可視化呈現(xiàn),能加深專業(yè)人員對(duì)自己研究領(lǐng)域在知識(shí)空間所處位置的了解。知識(shí)圖譜在空間上描述了特殊知識(shí)資源的整體概況。以知識(shí)圖譜為代表的大數(shù)據(jù)知識(shí)工程技術(shù)也為成就包含智能評(píng)估、智能決策的新型商業(yè)模式帶來(lái)全新的機(jī)遇[7]。
科技媒體作為覆蓋新概念、新技術(shù)、新產(chǎn)業(yè)最廣的內(nèi)容源之一,在其對(duì)外公開(kāi)的信息和數(shù)據(jù)中,存在大量的實(shí)體和關(guān)系。但是,它們之間通常缺乏確定的“邏輯指向”,這也造成專業(yè)人員或?qū)I(yè)學(xué)員無(wú)法有效地認(rèn)知科技概念并挖掘出相關(guān)潛在價(jià)值。相較于傳統(tǒng)的“關(guān)系型”數(shù)據(jù)庫(kù),建立知識(shí)圖譜數(shù)據(jù)庫(kù)更擅長(zhǎng)回應(yīng)復(fù)雜的關(guān)系網(wǎng)絡(luò)。在知識(shí)圖譜系統(tǒng)實(shí)現(xiàn)自動(dòng)化自我學(xué)習(xí)與優(yōu)化過(guò)程中存在一個(gè)關(guān)鍵問(wèn)題,即在先驗(yàn)階段通過(guò)人工干預(yù)生成初級(jí)知識(shí)圖譜各節(jié)點(diǎn)之后,面對(duì)某些節(jié)點(diǎn)存在眾多關(guān)聯(lián)的子節(jié)點(diǎn)的情況(圖1),如何通過(guò)價(jià)值分類,區(qū)分低價(jià)值子節(jié)點(diǎn)、高價(jià)值子節(jié)點(diǎn)。因?yàn)橹挥袑哟畏置?才會(huì)方便后續(xù)后臺(tái)服務(wù)器針對(duì)不同價(jià)值權(quán)重的子節(jié)點(diǎn)形成優(yōu)化的信息追蹤方案,并將有限的算力及存儲(chǔ)資源集中在高價(jià)值節(jié)點(diǎn),實(shí)現(xiàn)基于知識(shí)圖譜的智能系統(tǒng)作用最大化。目前,在確定知識(shí)圖譜各節(jié)點(diǎn)要素方面,大多是采用現(xiàn)有知識(shí)百科固有模板,通過(guò)條件隨機(jī)場(chǎng)模型的預(yù)測(cè)算法(CRF)對(duì)標(biāo)準(zhǔn)語(yǔ)料庫(kù)進(jìn)行學(xué)習(xí)及人工干預(yù)補(bǔ)充得到節(jié)點(diǎn)屬性。而節(jié)點(diǎn)權(quán)重價(jià)值則一般通過(guò)某節(jié)點(diǎn)所有鄰近關(guān)聯(lián)節(jié)點(diǎn)總數(shù)的導(dǎo)數(shù)[8],或者通過(guò)節(jié)點(diǎn)關(guān)聯(lián)特征向量的逆文檔頻率來(lái)確定[9-10]。不過(guò)這兩種方法的問(wèn)題在于,對(duì)于前者,由于在確定節(jié)點(diǎn)實(shí)體要素階段人工干預(yù)影響的不確定性,往往會(huì)對(duì)節(jié)點(diǎn)所有鄰近關(guān)聯(lián)節(jié)點(diǎn)總數(shù)產(chǎn)生較大影響,因此容易造成節(jié)點(diǎn)權(quán)重價(jià)值產(chǎn)生較大偏移;而后者,其初衷原本是抑制某一節(jié)點(diǎn)無(wú)意義高頻詞的負(fù)面影響,但高頻詞并不等于無(wú)意義詞,而低頻詞的偶然出現(xiàn)也容易被當(dāng)作高權(quán)值關(guān)鍵詞而納入節(jié)點(diǎn)的關(guān)鍵向量特征,從而過(guò)度放大包含大量生僻詞特征向量節(jié)點(diǎn)的重要性。因此這兩個(gè)指標(biāo)并不適合節(jié)點(diǎn)價(jià)值分析。節(jié)點(diǎn)價(jià)值的識(shí)別、分類和優(yōu)化是增強(qiáng)知識(shí)圖譜實(shí)用效力的基礎(chǔ)。如果僅通過(guò)擴(kuò)大人工干預(yù)的影響來(lái)實(shí)現(xiàn),受個(gè)體差異的影響,不同專業(yè)人員對(duì)節(jié)點(diǎn)價(jià)值判斷則難以相同。如何提供一種設(shè)備,使其能準(zhǔn)確、自動(dòng)化地從科技媒體消息來(lái)源、渠道、情報(bào)等因素中判斷出節(jié)點(diǎn)價(jià)值,從而構(gòu)造出更優(yōu)化的知識(shí)圖譜是一個(gè)難題。
圖1 行業(yè)知識(shí)圖譜示例
針對(duì)當(dāng)前技術(shù)的缺陷,本文提出了一種基于科技媒體情報(bào)的智能優(yōu)化新興科技行業(yè)知識(shí)圖譜系統(tǒng)繪制方案,其整體框架如圖2所示。方案包括依次相連的目標(biāo)行業(yè)數(shù)據(jù)采集&傳輸接口、與所述數(shù)據(jù)采集&傳輸接口連接的處理器、與所述處理器連接的存儲(chǔ)器。圖2所示的存儲(chǔ)器存儲(chǔ)行業(yè)知識(shí)圖譜節(jié)點(diǎn)內(nèi)容及知識(shí)圖譜節(jié)點(diǎn)情報(bào)價(jià)值數(shù)據(jù)庫(kù),行業(yè)知識(shí)圖譜節(jié)點(diǎn)內(nèi)容主要包括行業(yè)關(guān)鍵詞。行業(yè)知識(shí)圖譜節(jié)點(diǎn)情報(bào)價(jià)值數(shù)據(jù)庫(kù)包括節(jié)點(diǎn)情報(bào)長(zhǎng)度L、最新報(bào)道時(shí)間間隔I、關(guān)聯(lián)報(bào)道出現(xiàn)頻率F、關(guān)聯(lián)報(bào)道總長(zhǎng)度C和消息來(lái)源加權(quán)平均值W,五個(gè)指標(biāo)數(shù)據(jù)作為識(shí)別節(jié)點(diǎn)價(jià)值的指標(biāo),構(gòu)建LIFCW模型,如表1所示
表1 知識(shí)圖譜LIFCW模型各指標(biāo)
圖2 系統(tǒng)框架圖
表2 節(jié)點(diǎn)價(jià)值指標(biāo)數(shù)據(jù)
圖3具體描述了由數(shù)據(jù)預(yù)處理模塊和“建模+應(yīng)用”模塊組成的處理器。數(shù)據(jù)預(yù)處理模塊將接收上述數(shù)據(jù)并進(jìn)行預(yù)處理,包括數(shù)據(jù)規(guī)約、數(shù)據(jù)變換、缺失值和異常值識(shí)別、數(shù)據(jù)清洗與整理。
圖3 系統(tǒng)處理器操作流程圖
……
將所有數(shù)據(jù)對(duì)象分配完成后,計(jì)算每個(gè)聚類的均值,并與初始聚類中心比較。若發(fā)生變化,則重新定義聚類中心,并計(jì)算所有子節(jié)點(diǎn)數(shù)據(jù)點(diǎn)到各新聚類中心的距離,并將它們分配到新的距離最近的聚類中。重復(fù)以上步驟,直到聚類中心不再變化,這種劃分使得下式最小:
科技媒體作為覆蓋新概念、新技術(shù)、新產(chǎn)業(yè)最廣的內(nèi)容源之一,通常也是商科統(tǒng)計(jì)課程中數(shù)據(jù)和案例資料的重要來(lái)源。值得注意的是,在其對(duì)外公開(kāi)的信息和數(shù)據(jù)中存在大量的實(shí)體和關(guān)系。在用于教學(xué)的科技情報(bào)知識(shí)圖譜系統(tǒng)構(gòu)建過(guò)程中,若逐一關(guān)注體量龐大的實(shí)體及其關(guān)聯(lián)節(jié)點(diǎn),將會(huì)帶來(lái)很高的操作成本,有針對(duì)性的資源投放也難以開(kāi)展。這種情況下,如果采用傳統(tǒng)的自然語(yǔ)義分析方法來(lái)確定節(jié)點(diǎn)價(jià)值權(quán)重,容易過(guò)度放大帶有大量生僻詞特征向量節(jié)點(diǎn)的重要性。而若采取人工干預(yù),其經(jīng)驗(yàn)的不確定性也容易造成節(jié)點(diǎn)權(quán)重價(jià)值產(chǎn)生嚴(yán)重偏移。本文提出的知識(shí)圖譜繪制系統(tǒng),具有的效益在于更為深入、準(zhǔn)確地表達(dá)圖譜中子節(jié)點(diǎn)詞條對(duì)于上一節(jié)點(diǎn)詞條的重要性,并進(jìn)一步地為信息數(shù)據(jù)追蹤提供了判斷方案。處理器中的“建模+應(yīng)用”模塊對(duì)應(yīng)的LIFCW模型,相比傳統(tǒng)基于文檔詞頻的節(jié)點(diǎn)權(quán)重判斷方案,不僅不會(huì)過(guò)度放大包含大量生僻詞特征向量節(jié)點(diǎn)的重要性,而且由于新興媒體對(duì)新興行業(yè)所有特征的特殊敏感性,基于情報(bào)的價(jià)值判斷更有益于在繪制知識(shí)圖譜時(shí),有效識(shí)別出最有價(jià)值的節(jié)點(diǎn)群。通過(guò)突出高價(jià)值節(jié)點(diǎn)的位置,將方便后續(xù)后臺(tái)服務(wù)器針對(duì)不同價(jià)值權(quán)重的子節(jié)點(diǎn)形成優(yōu)化的信息追蹤方案,將有限算力及存儲(chǔ)資源集中在高價(jià)值節(jié)點(diǎn),進(jìn)而幫助專業(yè)人才在跟蹤與分析新興行業(yè)領(lǐng)域主要特征數(shù)據(jù)時(shí),更有效地判斷和掌握統(tǒng)計(jì)學(xué)理論的應(yīng)用價(jià)值。
新經(jīng)濟(jì)形勢(shì)對(duì)商科專業(yè)教學(xué)提出了新的挑戰(zhàn),大量的統(tǒng)計(jì)數(shù)據(jù)涉及社會(huì)經(jīng)濟(jì)和生產(chǎn)生活的各個(gè)方面。統(tǒng)計(jì)教學(xué)不僅是對(duì)數(shù)據(jù)的收集、整理與分析,更重要的是要引導(dǎo)學(xué)生擴(kuò)展知識(shí)面,運(yùn)用統(tǒng)計(jì)方法認(rèn)知和理解復(fù)雜問(wèn)題。結(jié)合知識(shí)圖譜工具應(yīng)用的教學(xué),將有助于提高學(xué)生對(duì)專業(yè)化理論的個(gè)性化認(rèn)知,在提升學(xué)生學(xué)習(xí)效率的同時(shí),對(duì)全面推行智慧型教學(xué)模式和個(gè)性化培養(yǎng)具有積極意義。