• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      以提升企業(yè)核心競(jìng)爭(zhēng)力為導(dǎo)向的數(shù)據(jù)集市構(gòu)建技術(shù)研究

      2024-01-23 08:07:14尹曉明徐紹倫王智泉
      中國(guó)科技縱橫 2023年22期
      關(guān)鍵詞:煙草行業(yè)集市卷煙

      尹曉明 徐紹倫 王智泉

      (山東威海煙草有限公司,山東威海 264200)

      0 引言

      近年來(lái),各級(jí)煙草公司都遇到了不同程度的發(fā)展瓶頸,面臨諸多與生存和發(fā)展相關(guān)的痛點(diǎn)和難點(diǎn)問(wèn)題。例如,在卷煙營(yíng)銷(xiāo)活動(dòng)中,常常要面對(duì)原有卷煙品牌的維護(hù)、新品牌的投放、滯銷(xiāo)品牌的退市等問(wèn)題。以往,都是憑借員工的工作經(jīng)驗(yàn)、專(zhuān)業(yè)知識(shí),收集一定量的市場(chǎng)數(shù)據(jù),進(jìn)行分析、判斷,在此基礎(chǔ)上策劃卷煙品牌的投放策略。但由于市場(chǎng)數(shù)據(jù)的抽樣樣本不足、人為因素的介入、營(yíng)商環(huán)境的干擾,往往不能科學(xué)規(guī)劃卷煙品牌布局,不能科學(xué)設(shè)計(jì)品牌投放策略,不能及時(shí)啟動(dòng)某些滯銷(xiāo)品牌的退市機(jī)制,使卷煙營(yíng)銷(xiāo)工作一直很被動(dòng)。與此同時(shí),國(guó)際四大煙草公司包括菲莫國(guó)際公司、英美煙草公司、日本煙草公司、帝國(guó)煙草公司,在卷煙品牌培育、品牌衍生、品牌溢價(jià)等方面進(jìn)行了大量探索和實(shí)踐,在國(guó)際煙草市場(chǎng)的份額合計(jì)約占50%,呈現(xiàn)壟斷格局。同時(shí),這些國(guó)際煙草巨頭也相繼發(fā)力中國(guó)市場(chǎng),外資煙草品牌在國(guó)內(nèi)市場(chǎng)逐步擴(kuò)張,市場(chǎng)占有份額逐步擴(kuò)大。2019 年全國(guó)煙草工作會(huì)議上,國(guó)家煙草專(zhuān)賣(mài)局提出了“136/345”發(fā)展目標(biāo);國(guó)家煙草專(zhuān)賣(mài)局還提出了建設(shè)大品牌、大企業(yè)、大市場(chǎng)的行業(yè)戰(zhàn)略目標(biāo),以及品牌要做大、規(guī)格要做精的具體要求;我國(guó)“十四五”規(guī)劃和2035 年遠(yuǎn)景目標(biāo)綱要都將“加快推動(dòng)數(shù)字產(chǎn)業(yè)化,推進(jìn)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型”明確規(guī)定為打造數(shù)字經(jīng)濟(jì)新優(yōu)勢(shì)的重要內(nèi)容。

      因此,煙草行業(yè)要引入先進(jìn)的互聯(lián)網(wǎng)技術(shù)、數(shù)據(jù)挖掘技術(shù)、人工智能技術(shù),實(shí)現(xiàn)煙草行業(yè)數(shù)字化轉(zhuǎn)型,解決煙草企業(yè)發(fā)展的痛點(diǎn)和難點(diǎn)問(wèn)題,是新時(shí)代下復(fù)雜的國(guó)際國(guó)內(nèi)競(jìng)爭(zhēng)形勢(shì)給煙草行業(yè)帶來(lái)的重大挑戰(zhàn)和機(jī)遇,也是提高煙草企業(yè)核心競(jìng)爭(zhēng)力,促進(jìn)煙草經(jīng)濟(jì)快速發(fā)展,提升我國(guó)煙草行業(yè)國(guó)際競(jìng)爭(zhēng)力的必然要求。

      為推動(dòng)煙草行業(yè)數(shù)字化,提高煙草企業(yè)的核心競(jìng)爭(zhēng)力,研究面向煙草企業(yè)的數(shù)據(jù)集市構(gòu)建技術(shù),并提出以提高企業(yè)核心競(jìng)爭(zhēng)力為導(dǎo)向的數(shù)據(jù)集市構(gòu)建框架圖,該框架主要包含數(shù)據(jù)收集、數(shù)據(jù)集市構(gòu)建、數(shù)據(jù)管理與分析和數(shù)據(jù)應(yīng)用等核心模塊。通過(guò)數(shù)據(jù)集市的構(gòu)建與應(yīng)用,為煙草產(chǎn)業(yè)深度賦能,推動(dòng)產(chǎn)業(yè)變革、產(chǎn)業(yè)技術(shù)升級(jí)和產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展,促進(jìn)煙草行業(yè)數(shù)字化轉(zhuǎn)型,化解煙草企業(yè)發(fā)展過(guò)程中的問(wèn)題,確保煙草公司的核心競(jìng)爭(zhēng)力,從而從容應(yīng)對(duì)經(jīng)濟(jì)新常態(tài)的挑戰(zhàn)。同時(shí),可以加速構(gòu)建卷煙“強(qiáng)國(guó)”,使我國(guó)煙草企業(yè)真正參與國(guó)際化競(jìng)爭(zhēng),減少?lài)?guó)際煙草企業(yè)對(duì)我國(guó)煙草市場(chǎng)的沖擊。此外,可以?xún)?yōu)化資源配置、促進(jìn)生產(chǎn)要素合理流動(dòng),確保煙草行業(yè)的高質(zhì)量發(fā)展。

      1 研究背景

      目前,中國(guó)煙草行業(yè)的數(shù)字化轉(zhuǎn)型得到了快速發(fā)展,不斷涌現(xiàn)出重要的研究文獻(xiàn)和研究成果。有研究者從市場(chǎng)狀態(tài)、終端需求強(qiáng)度、品牌貢獻(xiàn)度3 個(gè)維度設(shè)計(jì)卷煙品牌競(jìng)爭(zhēng)力評(píng)價(jià)指標(biāo)體系,構(gòu)建基于熵權(quán)法的品牌競(jìng)爭(zhēng)力模型,基于品牌競(jìng)爭(zhēng)力評(píng)價(jià)結(jié)果、品牌生態(tài)調(diào)優(yōu)模型結(jié)果,合理推薦卷煙品牌的發(fā)展建議[1]。有研究者認(rèn)為,依托線(xiàn)上線(xiàn)下融合的體驗(yàn)營(yíng)銷(xiāo)對(duì)于卷煙品牌培育有至關(guān)重要的作用,應(yīng)用增強(qiáng)現(xiàn)實(shí)技術(shù)(Augmented Reality,AR)等新型技術(shù),創(chuàng)新體驗(yàn)營(yíng)銷(xiāo)場(chǎng)景與體驗(yàn)策略,提升卷煙消費(fèi)者的產(chǎn)品感知度、體驗(yàn)度和友好度,有效增強(qiáng)其對(duì)卷煙品牌的認(rèn)同度[2]。也有研究者對(duì)卷煙目標(biāo)消費(fèi)者的特征及購(gòu)買(mǎi)行為進(jìn)行了深入分析,針對(duì)卷煙品牌培育存在的問(wèn)題,明確卷煙目標(biāo)消費(fèi)者理論對(duì)改善現(xiàn)狀的積極作用,并提出基于目標(biāo)消費(fèi)者的卷煙品牌培育策略。以推動(dòng)卷煙企業(yè)順應(yīng)市場(chǎng)化改革,為實(shí)現(xiàn)大品牌、大企業(yè)、大市場(chǎng)的行業(yè)戰(zhàn)略目標(biāo),增強(qiáng)中式卷煙品牌的競(jìng)爭(zhēng)力提供參考[3]。

      此外,近年來(lái)知識(shí)圖譜相關(guān)技術(shù)在各行各業(yè)也得到了快速發(fā)展與應(yīng)用。知識(shí)圖譜是一種語(yǔ)義網(wǎng)絡(luò),通過(guò)三元組形式對(duì)客觀(guān)世界進(jìn)行統(tǒng)一描述,其結(jié)點(diǎn)代表實(shí)體(Entity)或者概念(Concept),邊代表實(shí)體/概念之間的各種語(yǔ)義關(guān)系。實(shí)體是知識(shí)圖譜中最基本的元素,屬性是指一個(gè)實(shí)體指向它包含的屬性值,用實(shí)體、屬性、屬性值三元組刻畫(huà)實(shí)體的內(nèi)在特性,關(guān)系是指兩個(gè)實(shí)體之間的某種關(guān)聯(lián),用實(shí)體、關(guān)系、實(shí)體刻畫(huà)實(shí)體之間的相互關(guān)聯(lián)。知識(shí)圖譜有自頂向下和自底向上兩種構(gòu)建方式,針對(duì)自底向上的圖譜構(gòu)建技術(shù),主要包含數(shù)據(jù)清洗、信息抽取、知識(shí)融合、知識(shí)加工等幾個(gè)階段。

      知識(shí)圖譜具有廣泛的應(yīng)用場(chǎng)景。在人工智能領(lǐng)域,有研究者提出利用知識(shí)圖譜挖掘標(biāo)簽之間的語(yǔ)義關(guān)系,提升視頻和圖片分類(lèi)任務(wù)的準(zhǔn)確性。在煙草領(lǐng)域,為解決煙草行業(yè)各系統(tǒng)中的多源、異構(gòu)科研數(shù)據(jù)有效管理與利用問(wèn)題,有研究者設(shè)計(jì)了煙草科研知識(shí)實(shí)體及關(guān)系的數(shù)據(jù)模型,研發(fā)了煙草科研知識(shí)圖譜服務(wù)平臺(tái)[4]。此外,隨著卷煙企業(yè)的不斷發(fā)展,在日常的生產(chǎn)工作中產(chǎn)生了大量寶貴的經(jīng)驗(yàn)和極具研究?jī)r(jià)值的知識(shí),為預(yù)防卷煙企業(yè)知識(shí)和經(jīng)驗(yàn)的流失,有研究者提出將知識(shí)庫(kù)系統(tǒng)應(yīng)用到卷煙企業(yè)[5]。同時(shí),有研究者利用標(biāo)簽體系對(duì)零售客戶(hù)精準(zhǔn)畫(huà)像進(jìn)行分類(lèi),深入挖掘煙草企業(yè)內(nèi)部和企業(yè)外部數(shù)據(jù),設(shè)計(jì)了一套全域標(biāo)簽體系,極大助力了卷煙市場(chǎng)大戶(hù)管理、貨源精準(zhǔn)投放等工作[6]。

      2 以提升企業(yè)核心競(jìng)爭(zhēng)力為導(dǎo)向的數(shù)據(jù)集市構(gòu)建方案

      為推動(dòng)煙草行業(yè)數(shù)字化,提高煙草企業(yè)的核心競(jìng)爭(zhēng)力,解決煙草企業(yè)發(fā)展過(guò)程中遇到的諸多問(wèn)題,提出了數(shù)據(jù)集市構(gòu)建與應(yīng)用框架圖,如圖1 所示。該框架圖主要包含數(shù)據(jù)收集、數(shù)據(jù)集市構(gòu)建、數(shù)據(jù)管理與分析和數(shù)據(jù)應(yīng)用等幾個(gè)核心模塊。

      圖1 數(shù)據(jù)集市構(gòu)建框架圖

      2.1 數(shù)據(jù)收集

      為高效構(gòu)建實(shí)用性強(qiáng)的數(shù)據(jù)集市,在數(shù)據(jù)收集階段需充分調(diào)研與煙草行業(yè)相關(guān)的各類(lèi)數(shù)據(jù),確定合理有效的數(shù)據(jù)源。

      主要包含兩大類(lèi)數(shù)據(jù)來(lái)源,即企業(yè)數(shù)據(jù)和社會(huì)數(shù)據(jù)。企業(yè)數(shù)據(jù)包含主數(shù)據(jù)、生產(chǎn)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和財(cái)務(wù)數(shù)據(jù);社會(huì)數(shù)據(jù)包含社會(huì)經(jīng)濟(jì)、政府管理和其他合作企業(yè)等數(shù)據(jù),例如普查數(shù)據(jù)、年鑒等。主數(shù)據(jù)包含煙草局主數(shù)據(jù)和煙廠(chǎng)主數(shù)據(jù),是核心基礎(chǔ)數(shù)據(jù),例如煙草行業(yè)卷煙生產(chǎn)決策管理系統(tǒng)、省局營(yíng)銷(xiāo)平臺(tái)、市場(chǎng)信息采集系統(tǒng)、現(xiàn)代終端信息管理系統(tǒng)含有的數(shù)據(jù);生產(chǎn)數(shù)據(jù)主要包含工廠(chǎng)生產(chǎn)過(guò)程中需要采集的數(shù)據(jù),例如材料采購(gòu)、加工生產(chǎn)、卷煙存儲(chǔ)、能源供給、備品備件等數(shù)據(jù);業(yè)務(wù)數(shù)據(jù)包含運(yùn)輸配送、客戶(hù)銷(xiāo)售數(shù)據(jù)、客戶(hù)庫(kù)存數(shù)據(jù)、全方位用戶(hù)行為數(shù)據(jù)等與業(yè)務(wù)相關(guān)的多種數(shù)據(jù);消費(fèi)者數(shù)據(jù)包含消費(fèi)者性別、年齡、地址、消費(fèi)結(jié)構(gòu)等;財(cái)務(wù)數(shù)據(jù)包含預(yù)算數(shù)據(jù)、成本數(shù)據(jù)、績(jī)效薪酬等多種數(shù)據(jù)。

      總體而言,本文需采集的數(shù)據(jù)具有來(lái)源范圍廣、數(shù)據(jù)類(lèi)型多、數(shù)據(jù)體量大等特點(diǎn),同時(shí)涉及政府和企業(yè)內(nèi)部的核心關(guān)鍵數(shù)據(jù),故制定了符合法律法規(guī)要求的分布式數(shù)據(jù)采集和存儲(chǔ)機(jī)制。針對(duì)不同數(shù)據(jù)源的異構(gòu)數(shù)據(jù),解耦設(shè)計(jì)了多種符合需求的數(shù)據(jù)采集算法,并將算法分別部署在不同終端機(jī)器上,也將收集到的數(shù)據(jù)分別存儲(chǔ)于不同的終端機(jī)器。這種分布式數(shù)據(jù)采集和存儲(chǔ)機(jī)制可以按需分配計(jì)算和存儲(chǔ)資源,提高機(jī)器管理效率、數(shù)據(jù)共享效率和資源使用效率,在性能、可擴(kuò)展性和可靠性方面具有較大優(yōu)勢(shì)。比如,單機(jī)數(shù)據(jù)存儲(chǔ)可能會(huì)由于機(jī)器故障導(dǎo)致關(guān)鍵數(shù)據(jù)丟失,而分布式數(shù)據(jù)采集和存儲(chǔ),則可以有效應(yīng)對(duì)單機(jī)故障或者計(jì)算機(jī)網(wǎng)絡(luò)故障等突發(fā)問(wèn)題。

      2.2 數(shù)據(jù)集市構(gòu)建

      知識(shí)圖譜是一種由三元組構(gòu)成的語(yǔ)義網(wǎng)絡(luò),其結(jié)點(diǎn)代表實(shí)體或者概念,邊代表實(shí)體/概念之間的各種語(yǔ)義關(guān)系。知識(shí)圖譜有自頂向下和自底向上兩種構(gòu)建方式,為高效構(gòu)建大規(guī)模實(shí)用數(shù)據(jù)集市,本文采用自頂向下的構(gòu)建方式,主要涉及Schema 模型定義、數(shù)據(jù)獲取與清洗、數(shù)據(jù)集市構(gòu)建與演化更新、人機(jī)協(xié)同等多個(gè)核心步驟。

      首先,根據(jù)數(shù)據(jù)集市的構(gòu)建需要滿(mǎn)足實(shí)際應(yīng)用需求,構(gòu)建數(shù)據(jù)集市的初始Schema 模型,這是高效構(gòu)建高質(zhì)量數(shù)據(jù)集市的核心和基礎(chǔ)。Schema 模型規(guī)范化了數(shù)據(jù)集市中的數(shù)據(jù)表達(dá),即數(shù)據(jù)集市中應(yīng)該包含哪些節(jié)點(diǎn)、節(jié)點(diǎn)之間有哪些連邊關(guān)系,以及節(jié)點(diǎn)和邊的屬性、數(shù)據(jù)類(lèi)型的相關(guān)信息。一條數(shù)據(jù)只有滿(mǎn)足了Schema 模型的要求,才被允許更新到數(shù)據(jù)集市中。因此,初步抽象出數(shù)據(jù)集市應(yīng)該包含的多種不同類(lèi)型實(shí)體和各類(lèi)型實(shí)體間多種關(guān)系,以及相關(guān)的屬性等信息。例如,與卷煙銷(xiāo)售相關(guān)的實(shí)體可以包含香煙種類(lèi)、香煙等級(jí)、香煙品牌、香煙名稱(chēng)、生產(chǎn)公司、銷(xiāo)售區(qū)域、銷(xiāo)售周期、上市時(shí)間、銷(xiāo)量、利潤(rùn)、用戶(hù)性別、用戶(hù)年齡、用戶(hù)教育背景、用戶(hù)籍貫、用戶(hù)收入、用戶(hù)工作等。

      其次,收集的大量相關(guān)數(shù)據(jù)主要分為三類(lèi),一類(lèi)是相關(guān)數(shù)據(jù)庫(kù)中的結(jié)構(gòu)化數(shù)據(jù),一類(lèi)是文本、圖片、視頻等非結(jié)構(gòu)化數(shù)據(jù),一類(lèi)是網(wǎng)頁(yè)、百科等半結(jié)構(gòu)化數(shù)據(jù)。這些多源異構(gòu)數(shù)據(jù)難免存在數(shù)據(jù)重復(fù)、數(shù)據(jù)錯(cuò)誤、數(shù)據(jù)之間存在沖突等多種問(wèn)題。因此,需要通過(guò)數(shù)據(jù)挖掘、統(tǒng)計(jì)分析、預(yù)設(shè)規(guī)則等方法對(duì)數(shù)據(jù)進(jìn)行清洗和整理,保證數(shù)據(jù)的一致性,以形成規(guī)范化數(shù)據(jù),方便構(gòu)建數(shù)據(jù)集市。

      在數(shù)據(jù)清洗和整理過(guò)程中主要考慮以下幾個(gè)因素。一是處理數(shù)據(jù)中的無(wú)效值和缺失值,可以通過(guò)估算、變量刪除和成對(duì)刪除等方式完成,例如,通過(guò)平均值、最大值、最小值或概率估計(jì)等方式估算缺失值。二是檢查和刪除錯(cuò)誤數(shù)據(jù),例如,通過(guò)偏差分析發(fā)現(xiàn)可能的錯(cuò)誤或異常數(shù)據(jù),或者制定符合煙草行業(yè)數(shù)據(jù)特點(diǎn)的簡(jiǎn)單規(guī)則進(jìn)行錯(cuò)誤數(shù)據(jù)識(shí)別。三是刪除重復(fù)數(shù)據(jù)。四是檢查數(shù)據(jù)的一致性,包括數(shù)據(jù)的取值范圍是否合理、數(shù)據(jù)語(yǔ)義是否存在沖突等。

      數(shù)據(jù)集市的構(gòu)建和演化更新主要包含信息抽取、知識(shí)融合、知識(shí)加工等幾個(gè)關(guān)鍵階段。信息抽取是通過(guò)實(shí)體識(shí)別、關(guān)系抽取和屬性抽取等技術(shù)從多源數(shù)據(jù)中提取出符合數(shù)據(jù)集市Schema 模型要求的相關(guān)實(shí)體、屬性以及實(shí)體間的關(guān)聯(lián)關(guān)系。實(shí)體識(shí)別使利用基于規(guī)則的識(shí)別方法以及基于機(jī)器學(xué)習(xí)的識(shí)別方法。關(guān)系抽取是指識(shí)別圖譜中實(shí)體間關(guān)系,是構(gòu)建知識(shí)圖譜的重要環(huán)節(jié)。為高效抽取關(guān)系,聯(lián)合使用基于規(guī)則的關(guān)系抽取方法和聯(lián)合關(guān)系抽取方法。對(duì)于前者,本文設(shè)計(jì)了基于觸發(fā)詞模式的關(guān)系抽取模型。通過(guò)咨詢(xún)煙草行業(yè)的專(zhuān)業(yè)學(xué)者,依據(jù)煙草數(shù)據(jù)特點(diǎn),本文構(gòu)建了相關(guān)觸發(fā)詞庫(kù),用于抽取實(shí)體間關(guān)系。對(duì)于后者,通過(guò)模型直接完成三元組抽取,并非將任務(wù)拆分為實(shí)體識(shí)別和關(guān)系分類(lèi)兩個(gè)子任務(wù)。例如,利用Transformer 等預(yù)訓(xùn)練大模型完成實(shí)體識(shí)別和關(guān)系抽取,具體包含特征抽取模塊、實(shí)體抽取模塊、關(guān)系分類(lèi)模塊,關(guān)系分類(lèi)模型可以利用BERT[7]預(yù)測(cè)實(shí)體間關(guān)系。

      知識(shí)融合是指,由于通過(guò)不同數(shù)據(jù)源獲取的實(shí)體和關(guān)系存在重復(fù)、沖突、缺失等問(wèn)題,因此需要通過(guò)實(shí)體鏈接、實(shí)體對(duì)齊、實(shí)體消歧等技術(shù)整合提取的知識(shí),以消除矛盾和歧義,獲得統(tǒng)一的數(shù)據(jù)集市。知識(shí)加工主要是利用知識(shí)推理技術(shù)推理實(shí)體對(duì)之間可能存在的關(guān)系,用于知識(shí)圖譜的自動(dòng)化補(bǔ)全。同時(shí),根據(jù)新的需求和原始數(shù)據(jù)的更新,可以利用相關(guān)技術(shù)對(duì)圖譜進(jìn)行演化更新。其中,知識(shí)圖譜推理是構(gòu)建高質(zhì)量數(shù)據(jù)集市以及數(shù)據(jù)集市得以演化更新的重要途徑。

      知識(shí)圖譜推理是根據(jù)圖譜中已有的事實(shí)和關(guān)系推斷出未知的事實(shí)和關(guān)系,其在數(shù)據(jù)集市構(gòu)建的各個(gè)階段都能發(fā)揮重要作用。例如,在知識(shí)融合過(guò)程中的實(shí)體對(duì)齊、在知識(shí)補(bǔ)全過(guò)程中的鏈接預(yù)測(cè)、在處理圖譜沖突信息時(shí)的實(shí)體消歧等都涉及知識(shí)圖譜推理技術(shù)。為充分發(fā)揮知識(shí)圖譜推理的作用,采用基于歸納的知識(shí)圖譜推理技術(shù),其核心思想是通過(guò)分析和挖掘知識(shí)圖譜已有信息進(jìn)行分析推理,主要包含基于圖結(jié)構(gòu)的推理、基于規(guī)則學(xué)習(xí)的推理、基于表示學(xué)習(xí)的推理等方法,包含路徑排序算法(Path Ranking Algorithm,PRA)[8]、基于不完備知識(shí)庫(kù)的關(guān)聯(lián)規(guī)則挖掘算法(Association Rule Mining under Incomplete Evidence)[9]、Trans 系列算法(例如TransE[10])等算法。

      因?yàn)閿?shù)據(jù)規(guī)模大、數(shù)據(jù)集市體量大,完全依靠規(guī)則和算法構(gòu)建的數(shù)據(jù)集市難免存在低質(zhì)量信息或者錯(cuò)誤信息,所以通過(guò)人機(jī)協(xié)同方式提升數(shù)據(jù)集市的質(zhì)量。具體通過(guò)主動(dòng)學(xué)習(xí)技術(shù)對(duì)自動(dòng)抽取的知識(shí)進(jìn)行篩選,將算法不確定或可能預(yù)測(cè)錯(cuò)誤的結(jié)果進(jìn)行標(biāo)記,并輸入智標(biāo)注平臺(tái)進(jìn)行核對(duì)。本文提出了基于信息最大化的主動(dòng)采樣框架,由于沒(méi)有歷史標(biāo)注信息,通過(guò)最大化Fisher 信息實(shí)現(xiàn)。首先對(duì)標(biāo)注過(guò)程進(jìn)行建模,得到所有標(biāo)注結(jié)果的對(duì)數(shù)似然函數(shù)l(x),可據(jù)此計(jì)算得到如下Fisher 信息量:

      該信息量通常與樣本標(biāo)注結(jié)果無(wú)關(guān),僅取決于標(biāo)注樣本本身,因此對(duì)標(biāo)注噪聲魯棒。每次主動(dòng)采樣時(shí),需選擇使得Fisher 信息量最大的樣本進(jìn)行標(biāo)注。在該信息最大化問(wèn)題中,本文以譜圖論為基礎(chǔ),將其轉(zhuǎn)化為非歸一化的圖拉普拉斯算子(unnormalized graph Laplacian)的相關(guān)問(wèn)題進(jìn)行求解。

      本文最終采用Neo4j 圖數(shù)據(jù)庫(kù)作為數(shù)據(jù)集市的存儲(chǔ)方式。

      2.3 數(shù)據(jù)管理與分析

      數(shù)據(jù)管理主要利用數(shù)據(jù)集成管理工具從數(shù)據(jù)標(biāo)準(zhǔn)管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全管理、主數(shù)據(jù)管理等多個(gè)角度進(jìn)行高效安全的數(shù)據(jù)管理。并通過(guò)數(shù)據(jù)分析建模工具從關(guān)聯(lián)、因果等多個(gè)角度深層挖掘數(shù)據(jù)價(jià)值,從企業(yè)經(jīng)營(yíng)、生產(chǎn)運(yùn)行、工藝質(zhì)量、財(cái)務(wù)等多個(gè)層面對(duì)業(yè)務(wù)經(jīng)營(yíng)活動(dòng)進(jìn)行賦值。

      2.4 數(shù)據(jù)應(yīng)用

      數(shù)據(jù)應(yīng)用主要包含智能生產(chǎn)、智能物流、智能財(cái)務(wù)、智能營(yíng)銷(xiāo)、供應(yīng)鏈、智能質(zhì)量、智能管理、戰(zhàn)略決策等全方位立體化的應(yīng)用服務(wù)。例如,智能財(cái)務(wù)可以實(shí)現(xiàn)自動(dòng)化生成證財(cái)表、智能計(jì)算賦稅;智能營(yíng)銷(xiāo)可以實(shí)現(xiàn)主動(dòng)配貨,對(duì)客戶(hù)多維度分類(lèi),幫助零售戶(hù)提升、優(yōu)化卷煙營(yíng)銷(xiāo)管理能力;智能物流可以實(shí)現(xiàn)物流線(xiàn)路的優(yōu)化、智能化工商網(wǎng)配管理等;智能生產(chǎn)可以指導(dǎo)原輔料進(jìn)料、制絲生產(chǎn)、卷包生產(chǎn)、能源供給、備品備件物資供給直至卷煙成品打碼入庫(kù)的全生產(chǎn)過(guò)程。

      3 結(jié)語(yǔ)

      本文提出了以提升企業(yè)核心競(jìng)爭(zhēng)力為導(dǎo)向的數(shù)據(jù)集市構(gòu)建方案,旨在充分利用煙草行業(yè)相關(guān)的企業(yè)數(shù)據(jù)和社會(huì)數(shù)據(jù),構(gòu)建數(shù)據(jù)集市,充分分析和挖掘數(shù)據(jù)潛力,使其在煙草企業(yè)的發(fā)展和運(yùn)營(yíng)過(guò)程中充分發(fā)揮作用,為煙草企業(yè)充分賦能,促進(jìn)煙草行業(yè)的數(shù)字化轉(zhuǎn)型,提高煙草公司的核心競(jìng)爭(zhēng)力。

      猜你喜歡
      煙草行業(yè)集市卷煙
      熱鬧的集市
      煙草行業(yè)“兩項(xiàng)工作”信息管理平臺(tái)設(shè)計(jì)
      探訪(fǎng)于山“相親集市”
      海峽姐妹(2018年12期)2018-12-23 02:39:20
      關(guān)于強(qiáng)化煙草行業(yè)市場(chǎng)管理的優(yōu)化策略
      熱鬧的集市
      首個(gè)煙草行業(yè)標(biāo)準(zhǔn)通過(guò)技術(shù)審定
      卷煙包裝痕跡分析
      滑塊分揀系統(tǒng)在我國(guó)煙草行業(yè)中的應(yīng)用
      河南科技(2014年3期)2014-02-27 14:05:55
      我國(guó)卷煙需求預(yù)測(cè)研究述評(píng)
      卷煙引燃傾向測(cè)試方法的研究與改進(jìn)
      乌审旗| 新兴县| 镇康县| 辽宁省| 沙雅县| 陈巴尔虎旗| 区。| 镇江市| 阜南县| 宣汉县| 锡林浩特市| 楚雄市| 大同县| 巩义市| 牙克石市| 襄城县| 五家渠市| 原阳县| 陵水| 芮城县| 建德市| 高密市| 沁阳市| 丁青县| 东乌| 安新县| 法库县| 甘肃省| 定日县| 策勒县| 彭泽县| 孝义市| 阳谷县| 萝北县| 新巴尔虎左旗| 夏河县| 临泽县| 吴堡县| 柳州市| 鹤壁市| 永嘉县|