白高洪 楊鵬程 島寧
摘要:介紹了SPSS在市場調(diào)研中數(shù)據(jù)錄入的方法,以及對于錄入數(shù)據(jù)中遇到的問題和麻煩提供了解決的方法,為人們進(jìn)一步對于SPSS在數(shù)據(jù)錄入上提供了方法。
關(guān)鍵詞:問卷錄入方式;數(shù)據(jù)錄入;數(shù)據(jù)驗證
一、認(rèn)識SPSS軟件
SPSS為IBM公司推出的一系列用于統(tǒng)計學(xué)分析運算、數(shù)據(jù)挖掘、預(yù)測分析和決策支持任務(wù)的軟件產(chǎn)品及相關(guān)服務(wù)的總稱。SPSS對于調(diào)查問卷數(shù)據(jù)的錄入和分析,更加準(zhǔn)確直觀的看出數(shù)據(jù)給我們的信息。利用SPSS錄入問卷數(shù)據(jù)的有很多種不一樣的情況,多選題、單選題、開放性問題、半開放問題等,選用不同的錄入方法的時候要考慮到不同的功能和特點。
二、數(shù)據(jù)結(jié)構(gòu)設(shè)計
在錄入數(shù)據(jù)之前,首先要在變量視圖中設(shè)計調(diào)研問卷的數(shù)據(jù)結(jié)構(gòu)。調(diào)研問題的類型可分為開放性問題、半開放性問題、單選題、多選題,在數(shù)據(jù)結(jié)構(gòu)設(shè)計中需要采取不同的方法來處理。
(1)開放性問題的變量設(shè)計。
開放性問題是指允許被調(diào)研者自己填寫答案,而不提供選擇項。
例如:你的姓名?( )
開放性問題的變量設(shè)計只需要設(shè)計一個變量來存儲問題的答案,變量的類型根據(jù)答案的內(nèi)容可以設(shè)置為字符型、數(shù)值型或日期型。變量寬度也根據(jù)答案內(nèi)容來確定,一個漢字為2個字符,一個數(shù)字或字母為一個字符。因為變量的內(nèi)容需要被調(diào)研者自行錄入,所以值標(biāo)簽不需要設(shè)置。度量標(biāo)準(zhǔn)一般為名義類型。
(2)半開放問題的變量設(shè)計
半開放題指有選項,并且最后一個是開放性的選項,
例如:你的職業(yè)是(A、教師,B、學(xué)生,C、其他,——)
這一類題目在錄入時可以用兩個變量對其進(jìn)行定義,在第一個變量中,“其他,——”為選項之一;第二個變量將“其他,——”的具體內(nèi)容看做一個獨立的開放題,按照開放題的錄入方式進(jìn)行數(shù)據(jù)錄入,沒有選擇該選項的數(shù)據(jù)作為缺失值處理。
(3)單選題的變量設(shè)定
單選題的數(shù)據(jù)錄入只需要設(shè)置一個變量,然后將變量的標(biāo)簽值設(shè)置為每一個選項。
例如:你所在的城市是(A.成都、B.重慶、C.昆明)。
這里我們對于選項的編輯上,為了方便我們后期的數(shù)據(jù)的錄入一般會對數(shù)據(jù)進(jìn)行編輯,比如1代表成都,2代表重慶,3代表昆明,這樣就可以錄入到數(shù)據(jù)視圖里面。單選題的錄入有三種方式,但是為了方便問卷后期的計算,一般我們采用數(shù)值代碼+值標(biāo)簽的形式。
(4)多選題的變量設(shè)定
多選題是調(diào)查問卷中極為常見的一種問題類型。多選題的答案至少為兩項,選出的結(jié)果不同當(dāng)然這就需要設(shè)置多個變量來存儲答案,多選題的變量設(shè)定方法有兩種,多重二分法和多重分類法
第一種方法多重二分法適用于不限定最多選項數(shù)量的問題。多重二分法是把多選題的每一個選項的選擇是否都進(jìn)行記錄,所以變量的數(shù)量與選項數(shù)量相等。如:你有貸款嘛?(A.車貸、B.房貸、C、其它貸款)這時候可以把這個問題拆分成三個問題,你有車貸嗎?(是 否)你有房貸嗎?(是 否)你有其他貸款嗎?(是 否)。然后設(shè)置三個變量來存儲調(diào)研的答案。
第二種方法多重分類法適用于選項多,但有最多選項數(shù)量限制的問題,例如一個有8個選項的多選題,要求最多選兩項。針對這類問題就可以采用多重分類法來設(shè)置變量。變量的數(shù)量與最多選擇選項數(shù)量相等的變量相同,一個變量錄入一個答案即可。若變量數(shù)大于選項數(shù),對缺少的選項對應(yīng)的變量采用空值處理。
三、在數(shù)據(jù)視圖里面錄入調(diào)研獲得的數(shù)據(jù)
在SPSS錄入變量的時候,對于值標(biāo)簽的設(shè)定是很有必要的。標(biāo)簽量和值的設(shè)定下我們可以更好地去錄入數(shù)據(jù),可以減少對于文字的編輯量。還可以采用Excle文件來采集數(shù)據(jù),然后復(fù)制粘貼到SPSS中,降低錄入數(shù)據(jù)的難度。
四、設(shè)置驗證條件
檢驗錄入數(shù)據(jù)是否符合業(yè)務(wù)規(guī)則,查找出不合規(guī)的數(shù)據(jù)。首先需要設(shè)置變量驗證規(guī)則,驗證規(guī)則分為單變量驗證規(guī)則和多變量交叉驗證規(guī)則。單變量驗證規(guī)則可以設(shè)置錄入數(shù)據(jù)的值范圍或值列表。例如:年齡數(shù)據(jù)的錄入范圍可以設(shè)定為最大值100,最小值0。多變量交叉驗證規(guī)則是用來約束變量之間的關(guān)系,例如在多選題的多個變量中,不能出現(xiàn)重復(fù)值。
檢查異常值(重復(fù)值、空值)對于異常值和極端值,最好的方法通過頻數(shù)表來觀察有無異常值,但是這樣過于繁瑣不便于很快的找出是哪一條記錄的問題,最簡單的方法是選擇根據(jù)自己的需要選擇變量進(jìn)行排序,這樣就可以更好的看出哪一條數(shù)據(jù)出現(xiàn)了問題,也可以快速的對于這條記錄進(jìn)行修改。
五、數(shù)據(jù)錄入格式的規(guī)則
(1)每一個個案在不同的記錄中出現(xiàn),即每一個個案的數(shù)據(jù)應(yīng)該占據(jù)一行。
(2)每一個測量指標(biāo)/影響因數(shù)只能占據(jù)一列的位置,即同一個指標(biāo)的測量數(shù)據(jù)應(yīng)當(dāng)錄入到
同一個變量中去。
六、變量視圖的幾種情況
(1)認(rèn)識變量視圖
名稱:代表這個變量的代號
類型:數(shù)值型:是用0——9的數(shù)字和其他的特殊的符號組成的類型。字符型:字符型數(shù)據(jù)以字符串方式存儲,不能做四則運算,但可以拆分、合并、檢索等操作。日期型:日期型數(shù)據(jù)用來存儲日期和時間。
測量尺度:統(tǒng)計分析中只有變量的存儲類型是不夠的,很多時候不能說明變量的一些特征,這時候就需要有測量尺度。名義尺度是按照事物的某種屬性對其進(jìn)行分類或分組,變量的取值僅代表類別差異,不能比較各類大小。有序尺度是對事物之間等級或順序的差別的一種測量,可以比較優(yōu)劣或排序。定距尺度是對事物類別或次序之間間距的測量。定比尺度是能夠測算兩個測度值之間的比值的一種計量尺度。等距尺度和定比尺度統(tǒng)稱為“標(biāo)度”。
標(biāo)簽:可以對變量含義進(jìn)行詳細(xì)說明
值:可以對變量的取值的含義加以說明。
缺失值:用于設(shè)定自定義缺失值,主要用于問卷數(shù)據(jù)
參考文獻(xiàn)
[1]張文彤,鄺春偉著 《SPSS統(tǒng)計分析基礎(chǔ)教程》第2版
[2]方穎《利用SPSS軟件處理臨床治療率》[J]《醫(yī)學(xué)理論與實踐》2011
作者簡介:白高洪(1996.09-)男,研究方向:數(shù)據(jù)營銷;楊鵬程(1997.06)男,研究方向:數(shù)據(jù)營銷;島寧(1978.05-)女,講師,研究方向:數(shù)據(jù)營銷。
科學(xué)與技術(shù)2018年6期