蔣鵬
(廣東技術(shù)師范學(xué)院,廣東廣州510665)
基于云計算的高校就業(yè)信息化平臺模型研究*
蔣鵬
(廣東技術(shù)師范學(xué)院,廣東廣州510665)
針對高校就業(yè)信息化面臨的諸多問題,借助云計算和大數(shù)據(jù)技術(shù),提出了一種基于云計算的高校就業(yè)信息化平臺模型,并對模型的整體架構(gòu)和功能設(shè)計進行了深入探討。本模型整合各高校和網(wǎng)上的就業(yè)信息資源,避免重復(fù)建設(shè),為高校提供個性化、智能化、可共享的就業(yè)信息服務(wù)。
云計算;大數(shù)據(jù)技術(shù);就業(yè)信息化;SaaS;智能分析
伴隨著我國高校就業(yè)工作向服務(wù)型、社會化和網(wǎng)絡(luò)化的發(fā)展,基于互聯(lián)網(wǎng)的高校就業(yè)信息化平臺成為一種日趨常見和普遍的模式。[1]目前高校就業(yè)信息化建設(shè)過程中也普遍存在以下幾個方面問題:就業(yè)信息化技術(shù)人才缺乏;重應(yīng)用輕理論,缺乏系統(tǒng)性和個性化的研究;缺乏統(tǒng)一規(guī)劃,信息孤島現(xiàn)象嚴重,無法共享;系統(tǒng)的管理維護困難,不便于整合和再開發(fā)。[2]這些局限與不足限制了高校就業(yè)信息化的發(fā)展與深入。
云計算作為一種基于Internet以服務(wù)方式提供的新型計算模式,正在深刻改變著傳統(tǒng)的用信息技術(shù)解決管理問題的方法。[3]基于云技術(shù)的高校就業(yè)信息化平臺模型具有以下特點:
(1)實現(xiàn)了就業(yè)信息系統(tǒng)開發(fā)和應(yīng)用的分離,各高校只需關(guān)注業(yè)務(wù)創(chuàng)新與系統(tǒng)應(yīng)用;
(2)實現(xiàn)了統(tǒng)一規(guī)劃,可以實現(xiàn)區(qū)域高校與高校、高校內(nèi)部、高校與社會的數(shù)據(jù)共享;
(3)支持系統(tǒng)的持續(xù)整合與改進。
基于云技術(shù)的可定制的就業(yè)信息系統(tǒng),還具有開發(fā)成本低、使用維護簡單、軟件項目部署周期短、風(fēng)險低等優(yōu)點,為進一步提升我國高校就業(yè)服務(wù)水平提供了直接和有效的方法與技術(shù)。
建立一個基于云技術(shù)的就業(yè)信息化平臺。首先需要通過云計算平臺搭建一個開放的、基于網(wǎng)絡(luò)的基礎(chǔ)設(shè)施環(huán)境,然后提供一整套包括分布式數(shù)據(jù)存儲、大數(shù)據(jù)處理、就業(yè)信息檢索、就業(yè)信息推薦、個性化咨詢、信息反饋的基礎(chǔ)服務(wù)平臺。以滿足用戶彈性訪問的需求,還要提供與高校和企業(yè)進行數(shù)據(jù)交互的系統(tǒng)接口服務(wù)、供內(nèi)部開發(fā)運維人員使用的開發(fā)管理運維服務(wù)。最后高校和企業(yè)以租用的方式申請這些服務(wù),管理自己的就業(yè)服務(wù),從而節(jié)省了開發(fā)運維、基礎(chǔ)設(shè)施等方面的成本。其整體架構(gòu)模型如圖1所示。共分為三層,從下到上依次為云基礎(chǔ)設(shè)施層、基礎(chǔ)服務(wù)層、自定義展示層。云基礎(chǔ)設(shè)施層是平臺的基礎(chǔ),提供硬件支持;基礎(chǔ)服務(wù)層是平臺的核心,負責(zé)數(shù)據(jù)的存儲和處理;自定義展示層是平臺的前端和入口,用戶定制自己的個性化服務(wù)。
圖1 高校就業(yè)信息化平臺整體架構(gòu)模型
1.云基礎(chǔ)設(shè)施層
為滿足多個高校與企業(yè)租賃高校就業(yè)信息化服務(wù),平臺需要承擔(dān)海量的數(shù)據(jù)、文件、數(shù)據(jù)庫里數(shù)據(jù)的存儲和計算等。這就必然需要可擴展的、廉價的、可靠的和高性能的硬盤,高速的內(nèi)存Cache系統(tǒng),具有彈性計算能力的CPU等硬件資源,以減少業(yè)務(wù)系統(tǒng)的響應(yīng)時間,云計算平臺就可以解決這些問題。亞馬遜的EC2(Amazon Elastic Compute Cloud)、阿里巴巴的ECS(Elastic Compute Service)是國內(nèi)外兩個最常用的商用云計算平臺,用戶根據(jù)自己的需求租賃云服務(wù)器。[4]云服務(wù)器是一種處理能力可彈性伸縮的計算服務(wù),其管理方式比物理服務(wù)器更簡單高效。用戶只需專注于構(gòu)建應(yīng)用,而將運維工作交給這些專業(yè)的廠商。除了商用的云計算平臺,也可以選擇開源的云計算技術(shù)搭建私有云計算平臺,加州大學(xué)研發(fā)的Euclyptus、NASA研發(fā)的OpenStack均屬于這類技術(shù)。[5]
2.基礎(chǔ)服務(wù)層
基礎(chǔ)服務(wù)層是就業(yè)信息化平臺的核心,它的三大功能包括分布式數(shù)據(jù)存儲、大數(shù)據(jù)處理與就業(yè)信息檢索、就業(yè)信息智能分析。就業(yè)信息主要分為聘用單位信息、招聘信息、畢業(yè)生信息、學(xué)校信息四類。將這四類信息有關(guān)數(shù)據(jù)存儲在分布式的存儲系統(tǒng)中,便于整個平臺的橫向擴展。就業(yè)的數(shù)據(jù)量很大,傳統(tǒng)的串行處理方式就會成為系統(tǒng)的瓶頸,需要用到以MapReduce為代表的并行大數(shù)據(jù)處理技術(shù)。一個平臺的就業(yè)信息難免不全面,通過就業(yè)信息檢索來獲取其他平臺的就業(yè)數(shù)據(jù),為學(xué)生提供更多的就業(yè)信息。傳統(tǒng)的就業(yè)信息系統(tǒng)將最近的就業(yè)信息全部展示,作為數(shù)據(jù)量很大的就業(yè)信息化平臺,使用智能分析模型,結(jié)合學(xué)生的專業(yè)、興趣和企業(yè)的崗位要求為學(xué)生推薦最適合的就業(yè)信息。
3.自定義展示層
引入基于SaaS的多租戶技術(shù),實現(xiàn)高校就業(yè)信息化平臺能夠做到“一套網(wǎng)站代碼,多個網(wǎng)站實例”的共享程度,而且這個共享不能以犧牲租戶的個性需求為代價。[6]根據(jù)租戶的這些個性差異化需求,多租戶網(wǎng)站自定義技術(shù)解決頁面組織、頁面風(fēng)格、業(yè)務(wù)字段、業(yè)務(wù)種類重組、工作流程可配置定義。[7]
如圖2所示,基于這個平臺,有專門的運營商負責(zé)技術(shù)、運維,而將就業(yè)信息化作為一種服務(wù)提供給各個高校和企業(yè)。各個高校只能訪問自己專有和共享的服務(wù),按照自己的需求配置個性化的Web界面。
1.云計算平臺
隨著云計算成為十二五規(guī)劃的重要部分,將云計算應(yīng)用到高校就業(yè)信息服務(wù)平臺很有必要。每年的9-11月份和3-6月份是用人單位集中招聘期,同時畢業(yè)生也集中在這幾個月份求職。畢業(yè)生,用人單位都是集中在某一個時間段去訪問高校就業(yè)服務(wù)平臺,這就會給系統(tǒng)帶來很大的壓力,系統(tǒng)經(jīng)常會崩潰。如果按照系統(tǒng)的最大訪問量去配置硬件資源,在招聘的淡季就會浪費很多的資源,同時也需要人員去維護這些硬件。而云計算技術(shù)就是為了解決這些問題應(yīng)運而生的,將高校就業(yè)服務(wù)平臺部署到云計算平臺里,云計算平臺就會根據(jù)系統(tǒng)的訪問量去動態(tài)地增加或者減少硬件資源,這樣既可以保證系統(tǒng)的穩(wěn)定性也避免了資源的浪費。
圖2 高校就業(yè)信息化平臺訪問模型
2.分布式存儲系統(tǒng)
目前高校的就業(yè)信息系統(tǒng)都以集中存儲的方式組織數(shù)據(jù)。集中式存儲雖然便于管理但是讀取和寫入數(shù)據(jù)只有一個入口,因為每一種數(shù)據(jù)庫的可用連接數(shù)都是固定的,隨著訪問量的增大這種模式也會成為系統(tǒng)的瓶頸。越來越多的數(shù)據(jù)需要存入系統(tǒng),按照集中式存儲,當(dāng)存儲資源不足時只能增加內(nèi)存和硬盤資源。如果將畢業(yè)生信息、學(xué)校信息、企業(yè)信息、招聘信息等分布式地存儲起來,當(dāng)存儲資源不足時只需線性地增加存儲器。當(dāng)前流行的解決方案就是Hadoop的HDFS分布式存儲系統(tǒng)。
3.大數(shù)據(jù)處理服務(wù)
數(shù)據(jù)量急增是傳統(tǒng)的IT系統(tǒng)處理時就會遇到三個瓶頸:一是數(shù)據(jù)展現(xiàn)非常慢;二是數(shù)據(jù)運算速度難以忍受;三是采用傳統(tǒng)的ETL(數(shù)據(jù)抽取、轉(zhuǎn)換、裝載),數(shù)據(jù)更新慢。當(dāng)前常用的MapReduce大數(shù)據(jù)計算框架(見圖3)就可解決這三大問題。MapReduce處理大數(shù)據(jù)時,不是將數(shù)據(jù)移動到計算節(jié)點,而是將計算推向數(shù)據(jù)節(jié)點。MapReduce的原理就是計算數(shù)據(jù)時,主機會啟動一個任務(wù),先會對這些數(shù)據(jù)進行分割,再將大任務(wù)切分成多個小任務(wù)。再將這些小任務(wù)分配到集群上,每一個任務(wù)處理其所在節(jié)點上數(shù)據(jù),最后將數(shù)據(jù)匯總到一個節(jié)點最后輸出。
4.就業(yè)信息檢索服務(wù)
任何一個就業(yè)平臺都無法收納所有的就業(yè)信息。國內(nèi)三個大型的招聘網(wǎng)站——智聯(lián)招聘、51Job、大街網(wǎng),每一個網(wǎng)站都有其他網(wǎng)站不具備的招聘信息。對于高校就業(yè)信息化平臺,僅依靠企業(yè)和高校發(fā)布招聘信息的方式,信息量難以滿足數(shù)量龐大的畢業(yè)生。所以新的高校就業(yè)信息化平臺必須要有一個就業(yè)信息檢索服務(wù),能夠檢索互聯(lián)網(wǎng)上重要的就業(yè)信息。
圖3 大數(shù)據(jù)并行處理架構(gòu)圖
5.智能分析模型
傳統(tǒng)的高校就業(yè)信息化平臺以高校和企業(yè)發(fā)布信息為主,學(xué)生從海量的招聘信息中去查看自己感興趣的招聘信息。這種方式需要學(xué)生投入很大的精力去逐條查看招聘信息,同時也有可能漏掉一些重要的信息。新的高校就業(yè)信息化平臺需要有一個智能分析模型,這個模型包括就業(yè)信息推薦、個性化咨詢服務(wù)、就業(yè)信息反饋。在就業(yè)信息推薦服務(wù)中,根據(jù)學(xué)生的技能和感興趣的工作結(jié)合企業(yè)的招聘信息,為學(xué)生做個性化的就業(yè)信息推薦。為了能夠及時地提高推薦的準確度,也需要學(xué)生反饋推薦的就業(yè)信息是否準確,以及是否適合該學(xué)生。
就業(yè)信息的數(shù)量很多,作為高校就業(yè)信息化平臺的主要用戶學(xué)生,只需要和自己專業(yè)、技能、興趣有關(guān)的就業(yè)信息。這就需要為每一個學(xué)生個性化地推薦就業(yè)信息。本系統(tǒng)針對學(xué)生進行就業(yè)推薦,為此在學(xué)生注冊的時候,系統(tǒng)要求學(xué)生填寫其掌握的專業(yè)技能、興趣等信息,同時在企業(yè)發(fā)布招聘信息時,系統(tǒng)同樣要求企業(yè)填寫相應(yīng)崗位的技能要求。根據(jù)這兩組數(shù)據(jù),就可以從中抽象出學(xué)生和招聘信息的特征向量。舉例來說,特征向量為(java,c,c++,htm l),某學(xué)生具備java和htm l技能,則該學(xué)生可抽象為A=(1,0,0,1),某企業(yè)招聘崗位要求掌握java,c++,則該招聘信息可以抽象為B=(1,0,1,0)。顯然,特征向量為(0,1)離散的的向量,因此根據(jù)此特點選用余弦相似系數(shù)來計算相似度。其計算公式為:
作為一個基于云計算的高校就業(yè)信息化平臺,必須要提供就業(yè)信息服務(wù)自定義的功能。高??梢愿鶕?jù)自己的需要定制不同的功能,也可以自定義自己網(wǎng)站的主題、樣式等。國外的ERP巨頭Salesforce的ERP產(chǎn)品就允許用戶自定義,用戶付費購買功能服務(wù),也可根據(jù)自己的個性化需求定制服務(wù)。就業(yè)信息化平臺需要外部的數(shù)據(jù),例如畢業(yè)生的信息、企業(yè)招聘信息等。依靠人工的錄入是很費時間的,所以就業(yè)信息化平臺需要將數(shù)據(jù)的導(dǎo)入、個性化的咨詢作為接口提供給高校。
本文針對我國高校就業(yè)信息化所存在的問題,基于云計算和大數(shù)據(jù)技術(shù),提出了一種基于云計算的高校就業(yè)信息化平臺模型。并對模型的整體架構(gòu)和功能設(shè)計進行了深入探討。本模型整合各高校和網(wǎng)上的就業(yè)信息資源,避免重復(fù)建設(shè),為高校提供個性化的、智能化的、可共享的就業(yè)信息服務(wù)。在未來工作中,應(yīng)該對文中所提的架構(gòu)進行驗證并且上升到就業(yè)信息服務(wù)平臺層次,以求更好地指導(dǎo)以后類似平臺的開發(fā),最終達到大幅提升我國高校就業(yè)信息化水平的目的。
[1]方偉.大學(xué)生就業(yè)工作信息化新探索[J].中國大學(xué)生就業(yè),2013(4):45-46.
[2]蔣鵬.高校就業(yè)信息化建設(shè)研究[J].廣東技術(shù)師范學(xué)院學(xué)報,2015(8):55-57.
[3]劉鵬.云計算[M].北京:電子工業(yè)出版社,2011.
[4]陳康,鄭緯民.云計算:系統(tǒng)實例與研究現(xiàn)狀[J].軟件學(xué)報,2009(5):1337-1348.
[5]陳全,鄧倩妮.云計算及其關(guān)鍵技術(shù)[J].計算機應(yīng)用,2009(9):2562-2564.
[6]劉士軍,張勇,楊成偉.基于SaaS服務(wù)的中小企業(yè)業(yè)務(wù)協(xié)同系統(tǒng)[J].東南大學(xué)學(xué)報(自然科學(xué)版),2011(3): 458-462.
[7]王卓昊,趙卓峰,房俊,王希誠.一種SaaS模式下的服務(wù)社區(qū)模型及其在全國科技信息服務(wù)網(wǎng)中的應(yīng)用[J].計算機學(xué)報,2010(11).
(編輯:王天鵬)
G473.8
A
1673-8454(2017)09-0091-03
廣東省教育廳重點資助課題(2011ZZ018)。