摘要:招商引資工作已經(jīng)成為全國(guó)各地經(jīng)濟(jì)工作的重點(diǎn),菏澤市貫徹落實(shí)山東省委、省政府的工作要求,在“雙招雙引”的上做了大量工作,取得了一定成績(jī),但仍存在一定的問(wèn)題。本文針對(duì)當(dāng)前問(wèn)題,提出基于大數(shù)據(jù)精準(zhǔn)招商的策略,其重要作用及突出貢獻(xiàn)主要體現(xiàn)在以下三個(gè)方面:1.整合政府各部門和互聯(lián)網(wǎng)企業(yè)掌握的相關(guān)招商分散數(shù)據(jù),建立招商引資大數(shù)據(jù)平臺(tái),為政府招商提供面向特定主題的專業(yè)分析和智能研判,有效打破“數(shù)據(jù)孤島”;2.通過(guò)數(shù)據(jù)爬蟲技術(shù),及時(shí)并不間斷的收集網(wǎng)絡(luò)上有關(guān)招商信息,實(shí)現(xiàn)數(shù)據(jù)的精確采集和自動(dòng)增量采集,拓寬招商信息獲取的渠道;3.利用大數(shù)據(jù)平臺(tái),從海量數(shù)據(jù)中挖掘和分析出數(shù)據(jù)之間的關(guān)聯(lián)程度,讓政府根據(jù)自身產(chǎn)業(yè)發(fā)展需要,篩選行業(yè)和企業(yè),實(shí)現(xiàn)政府精準(zhǔn)招商,高效招商。
關(guān)鍵詞:大數(shù)據(jù);精準(zhǔn)招商;數(shù)據(jù)爬取
一、基于大數(shù)據(jù)精準(zhǔn)招商的研究概況
1.1 研究背景
招商引資是指一個(gè)國(guó)家或者地區(qū)為了促進(jìn)發(fā)展擴(kuò)大開(kāi)放,而采取的一系列提供優(yōu)質(zhì)的生產(chǎn)要素包括基礎(chǔ)設(shè)施建立、投資環(huán)境創(chuàng)造等來(lái)吸引外來(lái)資金加入進(jìn)行經(jīng)營(yíng)的活動(dòng)[1]。在我們國(guó)家近幾十年的發(fā)展歷程中,招商引資對(duì)國(guó)家經(jīng)濟(jì)的發(fā)展起到了舉足輕重的作用;在推進(jìn)國(guó)家市場(chǎng)經(jīng)濟(jì)體制改革的過(guò)程中,承擔(dān)了至關(guān)重大的角色。招商引資在促進(jìn)經(jīng)濟(jì)發(fā)展的過(guò)程中可以起到連帶效應(yīng),對(duì)人才培養(yǎng)、技術(shù)發(fā)展、生產(chǎn)力轉(zhuǎn)型等都起到積極有效的作用。在基礎(chǔ)設(shè)施、醫(yī)療、教育、住房、服務(wù)及社會(huì)福利等多方面的建設(shè)中,都得到了明顯的改善,公共利益也能夠得到有效的維護(hù)。在傳統(tǒng)的招商引資模式中,政府起到了主導(dǎo)性作用。作為政府-制定政策、實(shí)施政策和監(jiān)督執(zhí)行的部門,他們具有權(quán)威性、指導(dǎo)性和話語(yǔ)權(quán),又具有較高的可信度,可以通過(guò)舉辦大型招商引資推介會(huì)吸引知名企業(yè),同時(shí)也使企業(yè)能有有效獲取最前沿、最確切的政策信息,享受相關(guān)地方政府提供的相關(guān)扶持政策。
招商引資、招才引智是對(duì)外開(kāi)放的核心內(nèi)容,也是全國(guó)各地經(jīng)濟(jì)工作的重點(diǎn)。山東省委省政府在落實(shí)推進(jìn)新舊能轉(zhuǎn)換的工作中提出要高度重視“雙招雙引”工作,近年來(lái),菏澤市在“雙招雙引”上做了大量工作,召開(kāi)系列會(huì)議推出系列舉措并取得了一定成績(jī),但與先進(jìn)地區(qū)還具有一定差距,存在一些問(wèn)題[2]。我市產(chǎn)業(yè)規(guī)劃、項(xiàng)目策劃還不夠清晰、不夠精準(zhǔn),招商的方向和重點(diǎn)不明確;需要招哪些項(xiàng)目、怎么招來(lái)項(xiàng)目這些方面,我們的方法不多,思想還不夠解放。
大數(shù)據(jù)是繼云計(jì)算、物聯(lián)網(wǎng)之后IT產(chǎn)業(yè)又一次顛覆性的技術(shù)革命,它將會(huì)對(duì)政府和企業(yè)的數(shù)據(jù)中心產(chǎn)生顛覆性影響[3]。因此,新形勢(shì)下的招商引資不是過(guò)去的翻版,而是具有高質(zhì)量、高精度和專業(yè)化為主要特征的“升級(jí)版”。在信息爆炸式增長(zhǎng)的大數(shù)據(jù)時(shí)代,菏澤作為經(jīng)濟(jì)欠發(fā)達(dá)的地區(qū),要在全省激烈的招商競(jìng)爭(zhēng)有所突破,政府招商部門就需要充分運(yùn)用互聯(lián)網(wǎng)思維、大數(shù)據(jù)技術(shù)創(chuàng)新招商模式,將招商引資工作提升到一個(gè)新的戰(zhàn)略高度。
1.2 研究現(xiàn)狀
目前,各地采用的招商引資形式多式多樣各有側(cè)重點(diǎn),成效各有所長(zhǎng)各有千秋,但同時(shí)也面臨一些共性問(wèn)題:由于對(duì)資源的分析深度有限從而造成信息的不對(duì)稱[4];對(duì)引進(jìn)目標(biāo)項(xiàng)目的方向不明確、潛力發(fā)掘不深入。這些問(wèn)題很大程度上削減了招商引資的成效,降低了招商引資的效率。
“大數(shù)據(jù)”的到來(lái)對(duì)當(dāng)今社會(huì)的政治、經(jīng)濟(jì)生活已經(jīng)產(chǎn)生了巨大變革,尤其對(duì)政務(wù)工作的開(kāi)展也產(chǎn)生了深遠(yuǎn)影響。目前,北京、上海、深圳經(jīng)濟(jì)發(fā)達(dá)地區(qū)已經(jīng)率先運(yùn)用大數(shù)據(jù)思維開(kāi)展招商引資工作。廣西貴州、浙江桐鄉(xiāng)、重慶國(guó)內(nèi)諸多城市和地區(qū)也逐步建立了在線平臺(tái)進(jìn)行信息的共享以及數(shù)據(jù)的深入分析,實(shí)現(xiàn)招商引資的精準(zhǔn)化、智能化。在當(dāng)前經(jīng)濟(jì)發(fā)展常態(tài)化的環(huán)境下,菏澤市政府應(yīng)盡早開(kāi)展大數(shù)據(jù)招商方面的研究和試點(diǎn),以提高招商引資精準(zhǔn)度和效率。
1.3 研究的意義及重要性
研究本課題的主要意義及重要性體現(xiàn)為以下四個(gè)方面:
1. 響應(yīng)國(guó)家提出的大數(shù)據(jù)戰(zhàn)略。黨的十八屆五中全會(huì)提出“實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略”,黨中央、國(guó)務(wù)院高度重視大數(shù)據(jù)在經(jīng)濟(jì)社會(huì)發(fā)展中的作用[2]。利用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)政府精準(zhǔn)招商,從而使政府招商工作實(shí)現(xiàn)智慧化和專業(yè)化。
2. 充分利用大數(shù)據(jù)資源確保招商精準(zhǔn)化。大數(shù)據(jù)精準(zhǔn)招商就是依托大數(shù)據(jù)技術(shù)獲取有效的信息資源,為菏澤市打造具有區(qū)域特色的大數(shù)據(jù)平臺(tái),挖掘適合自身產(chǎn)業(yè)發(fā)展的資源價(jià)值,精準(zhǔn)鎖定目標(biāo)企業(yè),精準(zhǔn)挖掘投資線索,從而實(shí)現(xiàn)高質(zhì)量發(fā)展[2]。
3. 加強(qiáng)高校與地方的產(chǎn)學(xué)研合作,服務(wù)地方經(jīng)濟(jì)發(fā)展。菏澤學(xué)院計(jì)算機(jī)學(xué)院致力于大數(shù)據(jù)技術(shù)的研究、開(kāi)發(fā)與應(yīng)用,具有豐富的教育資源、科技資源以及大量人才,能為政府的宏觀調(diào)控供理論論證、技術(shù)支持,加強(qiáng)地方政府和高校雙方的合作能夠帶來(lái)巨大的社會(huì)價(jià)值[2]。
二、實(shí)施策略的主要方法及設(shè)計(jì)目標(biāo)
2.1 主要方法
要?jiǎng)?chuàng)建具有區(qū)域特色的大數(shù)據(jù)平臺(tái),并從中挖掘適合自身產(chǎn)業(yè)發(fā)展的資源價(jià)值,最重要的是要研究分析建立哪些數(shù)據(jù)庫(kù),如何進(jìn)行相關(guān)數(shù)據(jù)的采集以及如何進(jìn)行數(shù)據(jù)整合,如何利用大數(shù)據(jù)技術(shù)挖掘有價(jià)值的資源、實(shí)現(xiàn)精準(zhǔn)招商。因此,本課題主要通過(guò)以下三種方法進(jìn)行具體任務(wù)的實(shí)施。
1. 收集資料。收集和整理相關(guān)資料是招商引資工作中一項(xiàng)十分艱巨繁重的任務(wù),對(duì)所有環(huán)節(jié)都起著舉足輕重的作用。要實(shí)現(xiàn)精準(zhǔn)招商就要做到與時(shí)俱進(jìn)、時(shí)刻關(guān)注新業(yè)態(tài)。當(dāng)前,我們利用數(shù)據(jù)爬蟲技術(shù)提升搜集資料和文獻(xiàn)工作的高質(zhì)高效性,同時(shí),還可以利用數(shù)據(jù)挖掘及數(shù)據(jù)分析技術(shù),研究分析政策法規(guī),總結(jié)探討新興業(yè)態(tài)發(fā)展趨勢(shì),為開(kāi)展下一步工作夯實(shí)基礎(chǔ)。
2. 座談與實(shí)地調(diào)研。召集市發(fā)改、經(jīng)信、招商、市場(chǎng)監(jiān)管等有關(guān)政府部門,進(jìn)行座談溝通,建立部門間數(shù)據(jù)交換機(jī)制;深入各部門現(xiàn)場(chǎng),收集有關(guān)部門掌握的企業(yè)和項(xiàng)目數(shù)據(jù),通過(guò)座談和調(diào)研實(shí)現(xiàn)部門之間數(shù)據(jù)的整合,各項(xiàng)政策的無(wú)縫對(duì)接;多方聯(lián)動(dòng)有效促進(jìn)建設(shè)大數(shù)據(jù)招商平臺(tái)。
3. 理論與實(shí)驗(yàn)相結(jié)合。對(duì)研究的重點(diǎn)和難點(diǎn)算法進(jìn)行充分論證,提出可行的方法和理論模型,然后通過(guò)計(jì)算機(jī)程序語(yǔ)言進(jìn)行試驗(yàn)驗(yàn)證,評(píng)估算法執(zhí)行的效果,不斷改進(jìn)和優(yōu)化算法,以達(dá)到課題研究要求。
2.2 重點(diǎn)難點(diǎn)及分析
2.2.1. 重點(diǎn)
1.研究政府部門、企業(yè)、行業(yè)、網(wǎng)絡(luò)等各類分散數(shù)據(jù)如何實(shí)現(xiàn)有效整合。2. 研究基于人工智能、機(jī)器學(xué)習(xí)的數(shù)據(jù)爬蟲技術(shù),設(shè)計(jì)智能爬取數(shù)據(jù)的算法。3. 利用海量數(shù)據(jù)多角度、多維度為招商決策提供基于數(shù)據(jù)挖掘的智能推薦引擎的設(shè)計(jì)。
2.2.2. 難點(diǎn)
2.抽象數(shù)據(jù)建模,設(shè)計(jì)和建立數(shù)據(jù)庫(kù)。2. 數(shù)據(jù)爬蟲智能算法的設(shè)計(jì)和實(shí)現(xiàn)。3. 針對(duì)不同的招商需求,設(shè)計(jì)相匹配的數(shù)據(jù)挖掘算法。
2.3 設(shè)計(jì)目標(biāo)
針對(duì)當(dāng)前地方政府在招商引資過(guò)程出現(xiàn)的問(wèn)題及面臨困難,本文實(shí)現(xiàn)以下三個(gè)設(shè)計(jì)目標(biāo):
1. 目前招商數(shù)據(jù)掌握在政府各部門和互聯(lián)網(wǎng)企業(yè)中,呈各自分散的數(shù)據(jù)孤島,通過(guò)招商大數(shù)據(jù)平臺(tái)整合分散數(shù)據(jù),可以為政府招商提供面向特定主題的專業(yè)分析和智能研判,有效打破“數(shù)據(jù)孤島”,提高政府效能。
2. 通過(guò)數(shù)據(jù)爬蟲技術(shù),可以不間斷、及時(shí)收集到網(wǎng)絡(luò)上有關(guān)招商信息,實(shí)現(xiàn)了數(shù)據(jù)的精確采集和自動(dòng)增量采集,大大減輕了招商信息收集的困難程度,拓寬了招商信息獲取的渠道。
3. 利用大數(shù)據(jù)平臺(tái),可以從海量數(shù)據(jù)中挖掘和分析出數(shù)據(jù)之間的關(guān)聯(lián)程度,讓政府可以根據(jù)自身產(chǎn)業(yè)發(fā)展需要,篩選行業(yè)和企業(yè),有效解決招什么,去哪里招,怎么招的問(wèn)題,實(shí)現(xiàn)政府精準(zhǔn)招商,高效招商。
三、精準(zhǔn)招商數(shù)據(jù)庫(kù)的構(gòu)建
3.1獲取數(shù)據(jù)的方法與途徑
3.1.1 招商部門與各政府部門協(xié)調(diào)合作
要保證招商引資工作的有效運(yùn)行,需要整合多部門的數(shù)據(jù):政府?dāng)?shù)據(jù)、企業(yè)數(shù)據(jù)以及市場(chǎng)數(shù)據(jù)等。隨著政府部門信息化建設(shè)的不斷推進(jìn),發(fā)展與改革委員會(huì)、經(jīng)濟(jì)和信息化委員會(huì)、工商行政管理局,各地市的稅務(wù)局、統(tǒng)計(jì)局等部門都基本形成了服務(wù)于本單位工作職能的數(shù)據(jù)庫(kù),并建立有效的綜合數(shù)據(jù)平臺(tái),但目前這些數(shù)據(jù)是各自獨(dú)立的,不能形成一個(gè)具有統(tǒng)一結(jié)構(gòu)的和服務(wù)多部門能力的綜合數(shù)據(jù)庫(kù)[2]。因此,有必要將招商部門和各政府部門之間進(jìn)行綜合協(xié)調(diào),形成不同部門之間的聯(lián)動(dòng)機(jī)制,以實(shí)現(xiàn)數(shù)據(jù)的互聯(lián)互通。只有通過(guò)各部門的協(xié)同合作,才能構(gòu)建好大數(shù)據(jù)平臺(tái),實(shí)現(xiàn)數(shù)據(jù)價(jià)值的最大化。
3.1.2 通過(guò)大數(shù)據(jù)爬蟲技術(shù)對(duì)相關(guān)數(shù)據(jù)進(jìn)行爬取
在招商引資過(guò)程中,政府需要充分掌握企業(yè)和項(xiàng)目的相關(guān)信息,不能再停留在使用傳統(tǒng)搜索引擎的方式來(lái)搜索數(shù)據(jù)。大數(shù)據(jù)爬取技術(shù)的原理是按照某種算法規(guī)則,自動(dòng)地爬取頁(yè)面信息,將爬取到的頁(yè)面內(nèi)容作為大數(shù)據(jù)招商平臺(tái)的數(shù)據(jù)來(lái)源,同時(shí)也可以為招商數(shù)據(jù)的分析提供數(shù)據(jù)源,并提取關(guān)鍵有用的數(shù)據(jù)來(lái)實(shí)現(xiàn)招商信息的精準(zhǔn)獲取。
3.2 建立招商引資數(shù)據(jù)庫(kù)
根據(jù)設(shè)計(jì)目標(biāo),精準(zhǔn)招商大數(shù)據(jù)平臺(tái)的設(shè)計(jì)主要包括四個(gè)模塊:
1. 建立基本信息數(shù)據(jù)庫(kù):這些數(shù)據(jù)主要來(lái)源于政務(wù)信息資源庫(kù)中招商引資相關(guān)政策,同時(shí)還可以從政務(wù)信息庫(kù)中獲取企業(yè)注冊(cè)信息、項(xiàng)目審批信息、企業(yè)財(cái)稅數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)等數(shù)據(jù),從政務(wù)信息資源庫(kù)中獲得的數(shù)據(jù)經(jīng)過(guò)整合后,從其中抽取和招商引資密切聯(lián)系的數(shù)據(jù),匯總成招商基本信息庫(kù),在開(kāi)展招商引資活動(dòng)時(shí),能夠依托基本信息數(shù)據(jù)庫(kù)第一時(shí)間掌握政策大風(fēng)向[2]。
2. 建立項(xiàng)目數(shù)據(jù)庫(kù):項(xiàng)目庫(kù)主要承載著項(xiàng)目的征集、包裝、洽談、簽約、審核、落地等一系列活動(dòng)的信息和狀態(tài)掌握,重點(diǎn)記錄各縣區(qū)和市直部門集中簽約和自主簽約的項(xiàng)目,從項(xiàng)目簽約、落地、建設(shè)、投產(chǎn)等各個(gè)環(huán)節(jié)進(jìn)行跟蹤記錄[2]。
3. 建立重點(diǎn)企業(yè)數(shù)據(jù)庫(kù):動(dòng)態(tài)收集并梳理篩選世界500強(qiáng)企業(yè)、中國(guó)500強(qiáng)企業(yè)、中國(guó)500強(qiáng)民營(yíng)企業(yè)信息,綜合考慮是否已在本地投資、行業(yè)準(zhǔn)入限制、產(chǎn)能情況等其他因素,將其中一部分曾有過(guò)接觸或者曾來(lái)考察的企業(yè)列為重中之重[2]。
4. 建立投資人信息數(shù)據(jù)庫(kù):動(dòng)態(tài)掌握重點(diǎn)投資人信息,將在全市舉辦各種招商引資會(huì)展活動(dòng)或參加大型國(guó)際、國(guó)家和省內(nèi)外政府展會(huì)、商業(yè)展會(huì)、行業(yè)專業(yè)展會(huì)等活動(dòng)的商業(yè)領(lǐng)域優(yōu)強(qiáng)企業(yè)和領(lǐng)軍人才納入投資人信息庫(kù);同時(shí)對(duì)與市領(lǐng)導(dǎo)會(huì)見(jiàn)、與有關(guān)招商部門日常工作聯(lián)系緊密的投資企業(yè)或投資人進(jìn)行重點(diǎn)記錄,并適時(shí)進(jìn)行更新維護(hù)[2]。
3.3通過(guò)大數(shù)據(jù)分析提供招商決策
1. 利用海量數(shù)據(jù)挖掘預(yù)測(cè)性線索并構(gòu)建招商通路。根據(jù)我市自身發(fā)展的需要,對(duì)行業(yè)和企業(yè)進(jìn)行篩選,自主挖掘招商線索,以實(shí)現(xiàn)高效招商[2]。
2. 利用大數(shù)據(jù)技術(shù)實(shí)時(shí)跟蹤和督導(dǎo)全市招商引資項(xiàng)目開(kāi)發(fā)、項(xiàng)目簽約、項(xiàng)目落地全過(guò)程,并針對(duì)項(xiàng)目推進(jìn)的共性和個(gè)性化需求提供針對(duì)性的服務(wù)[2]。
3. 在大數(shù)據(jù)的支持下,通過(guò)建立經(jīng)濟(jì)模型,可以有效掌握地方資源和企業(yè)的匹配度,針對(duì)性分析特定投資人的需求,精準(zhǔn)的篩選出潛在投資企業(yè),并量身定制招商方案,從而快速提升招商效率,促進(jìn)項(xiàng)目落地[2]。
四、關(guān)鍵技術(shù)的突破與實(shí)現(xiàn)
4.1 智能爬取算法的實(shí)現(xiàn)
要實(shí)現(xiàn)精準(zhǔn)招商,最重要的環(huán)節(jié)是獲取企業(yè)的信息,并對(duì)爬取到的企業(yè)信息主題詞進(jìn)行分析。首先,確定抓取的主題信息是否滿足政府招商引資的相關(guān)要求,同時(shí)分析抓取到的URL和頁(yè)面內(nèi)容的關(guān)聯(lián)度,并刪除URL重復(fù)和相似度高的網(wǎng)頁(yè)數(shù)據(jù),使抓取的數(shù)據(jù)更精準(zhǔn)高效。本課題采用的是基于美國(guó)哈佛大學(xué)Rabin教授提出的Rabin指紋方法為基本思想的智能爬取算法[5],該算法主要主要包括三個(gè)階段:
1.按照爬取策略獲取若干URL并對(duì)其去重;
2.遍歷爬取的URL計(jì)算頁(yè)面相似度;
3頁(yè)面相似度達(dá)到閾值進(jìn)行聚類。
4.1.1 URL去重方法
對(duì)URL 進(jìn)行去重的基本步驟如下:
1.創(chuàng)建列表X存放URL指紋映射,并標(biāo)記是否被訪問(wèn);
2.創(chuàng)建列表U,被標(biāo)記訪問(wèn)標(biāo)識(shí)的URL存入U(xiǎn)中;
3.遍歷并計(jì)算每個(gè)URL的指紋值,存入列表X中。如果X[r]=0,則設(shè)置X[r]=1并存入U(xiǎn)中;如果X[r]=1,丟棄。
4.1.2 頁(yè)面相似度計(jì)算方法
各地政府在部門網(wǎng)站中發(fā)布的招商引資需求和咨詢有很多的相似之處,而且知名企業(yè)的基本數(shù)據(jù)信息也會(huì)在互聯(lián)網(wǎng)廣泛的發(fā)布和宣傳,這會(huì)為政企對(duì)接合作帶來(lái)一定的難度。因此本文在爬取數(shù)據(jù)是要進(jìn)行頁(yè)面相似度計(jì)算,挖掘出與主題最相近的頁(yè)面信息,以保證提取到最有價(jià)值的信息。該方法的好處是一方面能夠有效提高提取相關(guān)信息的有效性,另一方面將屏蔽掉相似度較高的頁(yè)面進(jìn)而節(jié)約下載流量。對(duì)于頁(yè)面相似度的計(jì)算,本文采用基于文本的頁(yè)面相似度算法。該算法的基本思想是:1.對(duì)文本建模和表示;2.對(duì)文本進(jìn)行分詞處理;3.計(jì)算分詞權(quán)重;4.用余弦向量計(jì)算相似度,相似度高于設(shè)置閾值,將判定為網(wǎng)頁(yè)具有相同內(nèi)容。
4.1.3 聚合式層次聚類方法
聚類可以作為數(shù)據(jù)挖掘過(guò)程中對(duì)數(shù)據(jù)進(jìn)行預(yù)處理的方法,采用聚類算法有助于在爬取數(shù)據(jù)的過(guò)程中將同類信息進(jìn)行分類。層次聚類方法是聚類方法中的一種,主要包括聚合式層次聚類和分列式層次聚類。本文采用聚合式層次聚類方法將相似結(jié)構(gòu)的網(wǎng)頁(yè)聚合到同一類中,選擇其中一個(gè)作為代表性URL。
基本的算法思想為:1.將重復(fù)的URL刪除,得到聚類之后的對(duì)象列表;2.設(shè)置閾值K,作為初始相似度值;3. 將大于閾值K的URL頁(yè)面劃分到不同的子類中;小于閾值K的URL頁(yè)面繼續(xù)從列表中獲取值直至結(jié)束;4.獲取沒(méi)有重復(fù)和相似的URL頁(yè)面。
4.2 數(shù)據(jù)分析算法的實(shí)現(xiàn)
通過(guò)數(shù)據(jù)爬取技術(shù)獲取數(shù)據(jù)并存入招商引資數(shù)據(jù)庫(kù)中并不是本課題的最主要的目的,而是在此基礎(chǔ)上進(jìn)一步挖掘出政策、企業(yè)、項(xiàng)目等信息之間的聯(lián)系,對(duì)信息進(jìn)行匹配、對(duì)接、整合,進(jìn)一步提高招商效率,才是研究本課題最重要的意義。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中最常用的類型,它可以分析某些重要數(shù)據(jù)信息并分析其關(guān)聯(lián)數(shù)據(jù),從而反映某些信息與其他信息之間的相關(guān)性和相互依賴性。
五、研究總結(jié)與展望
本課題的主要思想是以政府各部門政務(wù)信息為基礎(chǔ),借助數(shù)據(jù)爬蟲技術(shù)爬取社會(huì)化數(shù)據(jù)并挖掘?qū)φ猩逃袃r(jià)值的數(shù)據(jù)資源,利用先進(jìn)的大數(shù)據(jù)技術(shù),建立一個(gè)大容量、功能強(qiáng)大、信息豐富、安全可靠的綜合型的招商引資大數(shù)據(jù)平臺(tái)。通過(guò)對(duì)大數(shù)據(jù)的分析、預(yù)測(cè)和統(tǒng)計(jì),可以實(shí)現(xiàn)數(shù)據(jù)尋商、數(shù)據(jù)引商、數(shù)據(jù)助商,暢通招商引資的途徑和渠道,以實(shí)現(xiàn)招商引資工作的智能化、專業(yè)化和精準(zhǔn)化[2]。本課題提出了實(shí)現(xiàn)精準(zhǔn)招商的研究策略,距離實(shí)施運(yùn)行還存在一定的距離。尤其在招商基礎(chǔ)數(shù)據(jù)的爬取與采集、數(shù)據(jù)價(jià)值的挖掘、數(shù)據(jù)可視化和界面友好化還存在較大的研究空間。本課題下一步工作的重點(diǎn)將在這幾個(gè)方面進(jìn)行研究,以實(shí)現(xiàn)大數(shù)據(jù)精準(zhǔn)招商平臺(tái)的落地實(shí)施。
參考文獻(xiàn)
[1]杜林. 新常態(tài)下招商引資方式的創(chuàng)新研究[J].宿州教育學(xué)院學(xué)報(bào),2016,19(5)
[2]張瑞藜. 基于大數(shù)據(jù)的精準(zhǔn)招商策略的研究與應(yīng)用[J].科學(xué)大眾,2020(8).
[3]趙倩倩,程國(guó)建,冀乾宇,戎騰學(xué).大數(shù)據(jù)崛起與數(shù)據(jù)挖掘芻議[J].電腦知識(shí)與技術(shù),2014,10(33).
[4]宋林霖,何成祥. 從招商引資至優(yōu)化營(yíng)商環(huán)境:地方政府經(jīng)濟(jì)職能履行方式的重大轉(zhuǎn)向[J]. 上海行政學(xué)院學(xué)報(bào),2019.
[5]梁正友,張林才. 基于Rabin指紋方法的URL去重算法[J].計(jì)算機(jī)應(yīng)用,2008,12(28).
[6]P. Sumathia,R. Manickachezianb. Semantic Web Mining using Web Crawler and DOM Tree with EsvmModified SOM for Advanced Medical Information Retrieval System.[J].2017(12).
[7]郭濤,張代遠(yuǎn). 基于關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘 Apriori 算法的研究與應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展 2011(06):101-103+107.
[8]謝志明. 基于“云”環(huán)境下的數(shù)據(jù)挖掘并行關(guān)聯(lián)規(guī)則算法研究與實(shí)現(xiàn)[J].長(zhǎng)沙:湖南大學(xué),2015.
基金項(xiàng)目:2019年菏澤市社會(huì)科學(xué)規(guī)劃課題立項(xiàng)“基于大數(shù)據(jù)的精準(zhǔn)招商策略的研究與應(yīng)用”(2019-自籌-41)