方利勝
摘 要: 隨著互聯(lián)網(wǎng)的廣泛應(yīng)用,利用網(wǎng)絡(luò)平臺進行招聘已經(jīng)成為用人單位的主流招聘形式。面對海量的應(yīng)聘簡歷,有效的提取并篩選應(yīng)聘信息成為用人單位招聘工作的重點和難點。文章從用人單位制作招聘信息表及后續(xù)應(yīng)聘大數(shù)據(jù)篩選兩個方面著手,應(yīng)用Matrixlaboratory(MATLAB)編程語言對應(yīng)聘信息進行提取和篩選,從而快速統(tǒng)計不同需求所關(guān)注的應(yīng)聘信息。
關(guān)鍵詞:應(yīng)聘;大數(shù)據(jù);信息提取
中圖分類號:TP311 文獻標(biāo)志碼:A 文章編號:2095-2945(2018)33-0031-02
Abstract: With the wide use of the Internet, using the network platform for recruitment has become the mainstream form of recruitment. In the face of a large number of resumes, the effective extraction and screening of information has become the focus and difficulty of the recruitment work of employers. This paper starts from the following two aspects: making the recruitment information form and screening big data, using the Matrixlaboratory (MATLAB) programming language to extract and screen the application information, so as to quickly count the application information of different needs.
Keywords: application; big data; information extraction
引言
隨著互聯(lián)網(wǎng)的廣泛應(yīng)用,利用網(wǎng)絡(luò)平臺進行招聘已經(jīng)成為用人單位的主流招聘形式。面對海量的應(yīng)聘簡歷,有效的提取并篩選應(yīng)聘信息成為用人單位招聘工作的重點和難點。Matlab 是美國MathWorks 公司推出的一套高性能的數(shù)值計算和可視化科學(xué)計算軟件,是目前國內(nèi)外高校和研究部門進行科學(xué)研究的重要工具。Matlab包含數(shù)百個內(nèi)部核心函數(shù)[1],是目前用于信息統(tǒng)計的主要手段之一。本文應(yīng)用(MATLAB)編程語言對應(yīng)聘信息進行提取和篩選,從而快速統(tǒng)計應(yīng)聘信息。
1 招聘信息表
為了保證后續(xù)招聘信息的提取,建議先將招聘所需要的關(guān)鍵信息制作成規(guī)范表格,主要內(nèi)容應(yīng)包括姓名、出生年月、性別、政治面貌、籍貫、畢業(yè)學(xué)校及專業(yè)、聯(lián)系方式。同時,在網(wǎng)絡(luò)招聘平臺上,招聘單位應(yīng)注明不按標(biāo)準(zhǔn)格式提交基本信息表不予入圍,如表1所示。
待應(yīng)聘者提交表格后,利用xlsread[2]及dlmwrite[3]命令將所有應(yīng)聘者關(guān)鍵信息統(tǒng)計到一個excel表格中,如表2所示。
2 簡歷篩選
為了方便后續(xù)統(tǒng)計應(yīng)聘人數(shù)及篩選人員,應(yīng)要求應(yīng)聘者用姓名命名簡歷。由于有的應(yīng)聘者未按標(biāo)準(zhǔn)格式提供基本信息表,這部分人員的信息將不會統(tǒng)計到表2中,因此,會出現(xiàn)基本信息表中的人員與簡歷個數(shù)不一致的情況,需要將未統(tǒng)計入表的人員簡歷刪除。利用dir命令讀取簡歷的文件名,用xlsread命令讀取信息表中人名,通過for[3]循環(huán)確定簡歷人名是否在信息表中,若在,提取信息表中的序號,用copyfile[3]重新命名簡歷文件,新文件名為“序號 人名”,若不在,則簡歷新文件名為“nonum人名”。在編程過程中,應(yīng)注意,由于人名存在2個字、3個字甚至4個字的情況,因此在人名對應(yīng)時,應(yīng)先用if[3]命令判斷人名字符數(shù),再進行比對。執(zhí)行命令語句后,在目標(biāo)文件夾檢查篩選后的簡歷,有如下兩種情況,第一,簡歷名稱為“nonum 人名”,直接刪除該簡歷;第二,簡歷名稱前的序號中斷,導(dǎo)致這種情況發(fā)生的原因有兩個,一是信息表中對應(yīng)缺失序號人員的簡歷未下載,二是存在應(yīng)聘者重名現(xiàn)象,這種情況需要根據(jù)信息表中的序號重新命名。在信息表信息與簡歷信息一一對應(yīng)后,打印簡歷的排序即為信息表人員的排序,方便以后對應(yīng)查詢。
3 特定信息提取
有時需統(tǒng)計所有應(yīng)聘人員的特定信息,如統(tǒng)計本次招聘共涉及到的學(xué)校數(shù)量、專業(yè)類別、男女比例等。利用xlsread命令讀取相應(yīng)關(guān)鍵信息列,對于學(xué)校及專業(yè)列,通過if命令識別“大學(xué)”或“學(xué)院”字符來間隔單元格內(nèi)信息,最后將提取的信息用xlswrite命令寫到新表格中。
4 結(jié)束語
目前利用網(wǎng)絡(luò)平臺進行招聘已經(jīng)成為用人單位的主流招聘形式。面對海量的應(yīng)聘簡歷,有效的提取并篩選應(yīng)聘信息成為用人單位招聘工作的重點和難點。從應(yīng)聘者提供的電子簡歷到對應(yīng)聘者進行面試,中間的工作量巨大。簡化工作內(nèi)容并提供關(guān)鍵信息成為用人單位關(guān)注的重點。另外,對于每次招聘,用人單位也希望從各個角度分析招聘工作存在的不足,因此,特定信息的統(tǒng)計成為招聘工作必不可少的環(huán)節(jié)。本文從用人單位制作招聘信息表及后續(xù)應(yīng)聘大數(shù)據(jù)篩選兩個方面著手,應(yīng)用(MATLAB)編程語言對應(yīng)聘信息進行提取和篩選,從而快速統(tǒng)計不同需求關(guān)注的應(yīng)聘信息。本文應(yīng)用的基礎(chǔ)在于應(yīng)聘者應(yīng)按照招聘單位的要求提供信息,對于重復(fù)規(guī)律性的工作,利用計算機編程語言可以大大提供工作效率,隨著各個行業(yè)大數(shù)據(jù)的產(chǎn)生,結(jié)合計算機簡化工作內(nèi)容必將成為各行各業(yè)發(fā)展的趨勢。
參考文獻:
[1]鄭喜英,孔波.基于Matlab的概率統(tǒng)計教學(xué)研究[J].河南教育學(xué)院學(xué)報:自然科學(xué)版,2014,23(1):56-60.
[2]寇金寶,洪林,李德勝.實現(xiàn)MATLAB與Excel數(shù)據(jù)交互的一種可行方法[J].天津職業(yè)大學(xué)學(xué)報,2010,19(2):93-95.
[3]張志涌,楊祖櫻.MATLAB教程:R2010A[M].北京航空航天大學(xué)出版社,2010.