入伍新兵心理選拔效度驗證中的效標(biāo)

2022-11-23 14:01:55屠志浩李海立何靜文趙后雨瞿靖芮沈興華

第二軍醫(yī)大學(xué)學(xué)報 2022年6期

關(guān)鍵詞：實(shí)際操作我軍效度

屠志浩，李海立，何靜文，趙后雨，瞿靖芮，沈興華*

1. 海軍軍醫(yī)大學(xué)（第二軍醫(yī)大學(xué)）心理系航海心理學(xué)教研室，上海 200433

2. 海軍潛艇學(xué)院潛艇兵訓(xùn)練基地，青島 266042

3. 海軍軍醫(yī)大學(xué)（第二軍醫(yī)大學(xué)）心理系醫(yī)學(xué)心理學(xué)教研室，上海 200433

4. 海軍軍醫(yī)大學(xué)（第二軍醫(yī)大學(xué)）海軍特色醫(yī)學(xué)中心人因工程與新概念武器防護(hù)研究室，上海 200433

軍事人員的心理選拔是指根據(jù)軍隊的特殊需要，運(yùn)用心理學(xué)的方法，由各類職業(yè)專家和心理學(xué)專家共同對士兵、軍官以及各特殊軍隊群體候選者的心理素質(zhì)進(jìn)行檢測與評定，選拔那些心理素質(zhì)適合軍隊各職業(yè)的候選者，淘汰心理素質(zhì)不適合的候選者［1］。選拔的關(guān)鍵是預(yù)測，本質(zhì)上是根據(jù)選拔過程中一系列心理測驗的結(jié)果來預(yù)測候選者未來的表現(xiàn)。因此從心理測量學(xué)的角度來講，心理選拔作為一種心理測驗最應(yīng)該關(guān)注的效度是其預(yù)測效度。預(yù)測效度是效標(biāo)效度的一種，而評價效標(biāo)效度的關(guān)鍵是效標(biāo)的選擇。本文將分別介紹美軍與我軍對入伍新兵在心理選拔效度驗證中使用的效標(biāo)，并對我軍的心理選拔工作作出反思與展望。

1 美軍心理選拔效度驗證中的效標(biāo)選擇

武裝部隊職業(yè)能力傾向測試（armed services vocational aptitude battery，ASVAB）是美軍自1976 年開始全面實(shí)施，并一直使用至今的軍事心理選拔與分類系統(tǒng)。任何美國公民進(jìn)入武裝部隊之前都必須參加此項測試，只有測驗成績達(dá)到一定標(biāo)準(zhǔn)的候選者才能被批準(zhǔn)入伍，并且美國軍方會根據(jù)測試結(jié)果將候選者分配至不同職業(yè)崗位。自正式實(shí)施以來，ASVAB 的得分迅速上漲，但是測驗分?jǐn)?shù)并沒有被正確校正，導(dǎo)致入選標(biāo)準(zhǔn)非人為地降低，使數(shù)以萬計的不合格者進(jìn)入軍隊［2］。為此，美國國會要求美國國防部調(diào)查征兵標(biāo)準(zhǔn)與工作績效之間的聯(lián)系，即工作績效測量計劃（Job Performance Measurement Project，JPM）。另外，美軍著名的陸軍選拔與分類項目（Army Selection and Classification Project，Project A）的主要內(nèi)容就是對基于ASVAB 的選拔與分類方法的有效性進(jìn)行判定［3］。Project A 完成之后，美軍在21 世紀(jì)開啟了1 項新的研究，名為未來戰(zhàn)士選拔與分配的新預(yù)測因子項目（New Predictors for Selecting and Assigning Future Force Soldiers，Select21）［4］。該研究試圖明確21 世紀(jì)新型陸軍所需要的知識、技能與特質(zhì)，并基于這些新的知識、技能與特質(zhì)開發(fā)與ASVAB 不同的針對未來戰(zhàn)爭的入伍戰(zhàn)士選拔與分配系統(tǒng)［5］。為了驗證新型選拔系統(tǒng)的有效性，Select21 也進(jìn)行了大量的效度驗證［6-7］。以下主要介紹美軍Project A 與Select21 這2 個最具代表性的軍人心理選拔效度驗證研究中的效標(biāo)選擇。

1.1 學(xué)校最終評分（finalschool grade，F(xiàn)SG） FSG是指學(xué)生在學(xué)校所有科目的平均成績［8］。美軍以學(xué)校FSG 效標(biāo)分別在陸軍、海軍、海軍陸戰(zhàn)隊及空軍部隊的軍事學(xué)校中對ASVAB 的效度進(jìn)行檢驗。

1.2 完成時間（time-to-completion，TTC）TTC 主要由海軍使用，代表1 個新兵完成自定進(jìn)度初級技術(shù)訓(xùn)練項目所需要的時間［8］。研究發(fā)現(xiàn)使用該效標(biāo)時，ASVAB 效度低下?？赡艿脑蚴悄切┞斆鞯膶W(xué)員并沒有動力去盡快完成自定進(jìn)度的初級技術(shù)訓(xùn)練項目，因為如果早早地完成該項目，他們就得待在宿舍等待下一階段訓(xùn)練的開始，在此期間還可能被安排出公差或打掃衛(wèi)生［8］。因此TTC 并不能反映新兵的能力。

1.3 工作績效在Project A 進(jìn)行效度驗證之前并沒有研究者一致認(rèn)可的工作績效測量方法，因此研究者們不得不自行開發(fā)和實(shí)施此類測量［9］。同樣的問題也出現(xiàn)在Select21 中，經(jīng)過Project A 后近20 年的快速發(fā)展，原先的工作績效測量內(nèi)容已經(jīng)不適用于當(dāng)時的美國陸軍；而且Select21 的目標(biāo)是預(yù)測入伍士兵在未來戰(zhàn)爭條件下的表現(xiàn)，研究者必須解決在“現(xiàn)在”測量士兵“未來”表現(xiàn)的問題［10］。

1.3.1 實(shí)際操作測試（hands-ontest）實(shí)際操作測試是最主要的工作績效測量工具，其內(nèi)容效度遠(yuǎn)遠(yuǎn)高于其他測量方式［11］。實(shí)際操作測試在JPM 中被各軍種選為工作績效測量工具，在Project A 中也是工作績效測量方式之一［12］。在Project A 中，每個軍事職業(yè)會選出15 項具有代表性的任務(wù)進(jìn)行實(shí)際操作測試。然而，實(shí)際操作測試也有一定的局限性：（1）它缺乏評分精確性。實(shí)際操作測試要求測試評分員本身就是執(zhí)行該任務(wù)的專家，并對受測者的表現(xiàn)進(jìn)行準(zhǔn)確的評價。但是，在評分過程中評分員難免會帶有主觀判斷。（2）進(jìn)行實(shí)際操作測試時，被試知道自己正在被評估，一般會以自己的最高水平來完成測試。因此，雖然實(shí)際操作測試能夠提供個人任務(wù)熟練度最高水平的信息，但是卻不能反映個人日常工作績效。即實(shí)際操作測試能夠反映“能做”，而不能反映“愿做”［9］。

1.3.2 書面知識測試（writtenknowledge test）書面知識采用紙筆測試與多項選擇題的范式。在測試中，項目按照個人執(zhí)行任務(wù)時出現(xiàn)的順序進(jìn)行排列，并提供所需的工具如地圖、分度器、草稿紙等。在Project A 中，每個軍事職業(yè)都會有30 項代表性任務(wù)采用書面知識測試的方式進(jìn)行測試［12］。專注于理論的書面知識測試往往因其內(nèi)容效度低而遭人非議。但是，建立一套內(nèi)容效度高的書面知識測試費(fèi)時又費(fèi)力，且相當(dāng)昂貴［13］。首先，需要專家提供測試內(nèi)容。然后，需要另一部分專家去評判測試項目是否測量了工作中需要的知識與技能。此外，還需要具有代表性的軍人參加并評價測試，以確保測試的用詞是合適的。當(dāng)然，書面知識測試也有優(yōu)點(diǎn)，它是工作績效測量中必不可少的一部分，能夠提供實(shí)際操作測試無法測量的任務(wù)方面的信息，例如某些和平時期不易遇到的任務(wù)［9］。

1.3.3 任務(wù)績效評定表（taskperformance rating scale）任務(wù)績效評定表主要由同級及上級評定個人的表現(xiàn)［12］。評定表上的問題類似于“與其他同級別的士兵相比，該士兵執(zhí)行該項任務(wù)時的表現(xiàn)如何”，同事或上級需要根據(jù)士兵的實(shí)際表現(xiàn)在七點(diǎn)量表上打分，1 分代表“最差”，7 分代表“最好”。任務(wù)績效評定表的評定內(nèi)容與實(shí)際操作測試一致，是由專家選定的每個軍事職業(yè)具有代表性的15 項任務(wù)。任務(wù)績效評定表是由熟悉被試個人日常表現(xiàn)的同級與上級評估，相較于實(shí)際操作測試更能夠?qū)Ρ辉嚨娜粘？冃ё龀銮逦脑u估，這類績效被認(rèn)為是個人工作水平與動機(jī)兩方面因素的結(jié)合，是對“能做”與“愿做”的綜合反映［12］。

1.3.4 行為錨定評定量表（behaviorallyanchored rating scale，BARS） BARS 由Smith 與Kendall［14］創(chuàng)立。在Project A 中，美軍的研究者分別建立了3 個不同的BARS：工作特定量表、陸軍量表和作戰(zhàn)表現(xiàn)預(yù)測量表［12］。每個BARS 的建立方式基本一致：首先，要求1 個工作組的陸軍軍士與軍官針對1 項工作建立有效與無效表現(xiàn)的關(guān)鍵事件池；然后，對池中的所有事件進(jìn)行分類，建立維度；最后，對每種事件所代表的水平進(jìn)行評定。

1.4 行政與檔案記錄（administrative/archival records）Project A 中，美軍研究者檢查了3 種資料：入伍資料（enlisted master file，EMF）、正式軍事人員檔案（official military personnel file，OMPF）和軍事人員記錄本（military personnel records jacket，MPRJ 或 201 Files）［12］。EMF 是每名美國陸軍工資清單上的軍人都有的個人數(shù)據(jù)、入伍情況和軍事經(jīng)歷電子清單。OMPF 是每名軍人服役經(jīng)歷官方記錄。MPRJ 是最為完整的個人服役經(jīng)歷信息保存系統(tǒng)。最后，研究者從這3 種資料中提煉出以下7 種最有意義的信息：延長服役資格、表揚(yáng)信的數(shù)量、獎狀數(shù)量、軍事訓(xùn)練課程數(shù)目、違紀(jì)行為、M16 射擊水平、晉升率（晉升級別/年）。

1.5 訓(xùn)練績效訓(xùn)練績效是軍事選拔與分類的傳統(tǒng)效標(biāo)［13］。在Project A 中，建立訓(xùn)練績效測試需要以下8 個步驟［12］：（1）準(zhǔn)備項目預(yù)算；（2）建立最初的項目池；（3）在崗工作人員對項目池進(jìn)行檢查；（4）學(xué)校教員對項目池進(jìn)行檢查；（5）對受訓(xùn)者進(jìn)行預(yù)測試；（6）準(zhǔn)備對在崗工作人員進(jìn)行訓(xùn)練測試；（7）對在崗工作人員進(jìn)行實(shí)地測試；（8）由美國陸軍訓(xùn)練司令部正式檢查。與實(shí)際操作測試相比，訓(xùn)練績效有如下2 個優(yōu)點(diǎn)：（1）訓(xùn)練績效對于所有士兵都是日?？傻玫?；（2）訓(xùn)練績效往往是在工作訓(xùn)練課程中對表現(xiàn)的客觀評價。當(dāng)然，如書面知識測試一樣，訓(xùn)練績效的內(nèi)容效度也飽受質(zhì)疑，因為訓(xùn)練可能包含某些實(shí)際工作中不需要的操作與知識。

1.6 效標(biāo)態(tài)勢判斷測試（criterionsituational judgement test，CSJT）在Select21 中，CJST 用來測試入伍士兵在未來戰(zhàn)爭情境下的工作績效。測試開發(fā)主要分為4 步［15］：（1）場景生成；（2）回答選項生成；（3）項目分析；（4）評分。最終由50 名高級軍士生成了適應(yīng)多變環(huán)境、支援與聯(lián)系友軍、自我管理、自學(xué)、團(tuán)隊協(xié)作等5 個維度共89 種不同未來戰(zhàn)爭情境；由另外的42 名高級軍士基于得到的情境給出不同水平的應(yīng)答行為，其中有76 種情境能夠得到足夠的應(yīng)答行為；10 名士官參與項目分析，最后刪除76 種情境中10 個不合適的情境；最終，26 名士官對剩余的66 種情境下的行為反應(yīng)進(jìn)行評分，建立效標(biāo)態(tài)勢判斷測試量表［16］。CJST 是由被試自行答題完成，其主要內(nèi)容是給被試某些未來戰(zhàn)爭中的特定情境與相應(yīng)的行為反應(yīng)，要求被試選擇他們認(rèn)為的此情境下最優(yōu)的行為反應(yīng)。與根據(jù)日常表現(xiàn)的傳統(tǒng)工作績效上級評價不同，CJST 主要考察被試的知識與判斷而非動機(jī)強(qiáng)弱，即“能做”績效而非“愿做”績效。

1.7 態(tài)度測試為了驗證Select21 中的人-環(huán)境適應(yīng)性預(yù)測因子的效度，研究者專門開發(fā)了現(xiàn)時導(dǎo)向的態(tài)度測試和未來導(dǎo)向的態(tài)度測試作為效標(biāo)，前者反映士兵當(dāng)前的狀態(tài)（例如當(dāng)前的工作滿意度），而后者反映士兵在未來預(yù)期的陸軍條件下所期待的狀態(tài)。

1.7.1 陸軍生活調(diào)查（armylife survey，ALS） ALS屬于現(xiàn)時導(dǎo)向的態(tài)度測試，是一個較為成熟的量表［17］，包含15 個分量表，可進(jìn)一步歸為3 個大類：（1）3 個測量繼續(xù)在陸軍服役意愿的分量表，包括退伍意愿、二次入伍意愿與終身服役意愿；（2）11 個測量承諾的分量表，包括對不同方面陸軍生活的滿意度（6 個分量表）、組織承諾（3 個分量表）、主觀的適應(yīng)程度與壓力；（3）1 個測量士兵對陸軍核心價值觀評價的分量表。

1.7.2 未來陸軍生活調(diào)查（futurearmy life survey，F(xiàn)ALS） FALS 旨在評估士兵對未來新型陸軍任務(wù)與生活的態(tài)度，有29 道題，測量以下5 個方面：（1）未來條件下的預(yù)期滿意度；（2）未來條件下的壓力；（3）未來條件下的績效；（4）對未來陸軍的主觀適應(yīng)程度；（5）在未來條件下的二次入伍意愿與終身服役意愿。在回答問題之前，士兵被要求仔細(xì)閱讀介紹未來陸軍情況（例如頻繁的變化與不間斷的學(xué)習(xí)要求）的指導(dǎo)語，該情況介紹是由前期未來導(dǎo)向的軍事工作分析得到的［4］。

1.8 第一任期非正常退伍（firstterm attrition）雖然有大量研究表明類似于ALS 的工作態(tài)度測試能夠很好地預(yù)測未來的工作變動或非正常退伍［17-18］，但是在Select21 中態(tài)度測試只是作為檢驗同時效度的效標(biāo)，無法真正檢驗Select21 所開發(fā)的選拔工具對士兵未來非正常退伍可能性的預(yù)測效度［19］。最好的方法就是直接追蹤調(diào)查接受Select21 第一階段選拔測試的新兵在第一任期內(nèi)的非正常退伍情況。第一任期非正常退伍一般發(fā)生在以下4 個階段：（1）基本作戰(zhàn)訓(xùn)練階段；（2）高級個人化訓(xùn)練階段；（3）專業(yè)培訓(xùn)階段；（4）下連隊之后。

2 我軍心理選拔效度驗證中的效標(biāo)選擇

我軍心理選拔工作起步較晚，但發(fā)展迅速。經(jīng)過我國軍事心理學(xué)研究幾十年探索建立的《中國軍人醫(yī)學(xué)與心理選拔系統(tǒng)及標(biāo)準(zhǔn)》已全面鋪開運(yùn)行，該系統(tǒng)能夠較好地解決汰劣問題，部分解決選優(yōu)的問題。我國學(xué)者對該系統(tǒng)的2 個分系統(tǒng)——中國征兵心理測試系統(tǒng)［20］和“初級軍官心理選拔”［21］的預(yù)測性進(jìn)行了研究。

2.1 士兵工作績效評價問卷與部隊適應(yīng)性羅正學(xué)［22］認(rèn)為部隊適應(yīng)性是指戰(zhàn)士在部隊這個特殊的環(huán)境中工作表現(xiàn)情況和同伴接納的程度，士兵工作績效包括任務(wù)績效與關(guān)系績效2 個維度，正好對應(yīng)部隊適應(yīng)性的2 個方面：工作表現(xiàn)與同伴接納程度。而且，士兵工作績效與部隊適應(yīng)性互為因果，工作績效好的士兵部隊適應(yīng)性高，適應(yīng)部隊的士兵工作績效優(yōu)于適應(yīng)性差的士兵［20］。因此，在后來的效度研究中研究者利用士兵工作績效評價問卷來代表部隊適應(yīng)性［23］。

2.2 預(yù)測淘汰符合率與假陰性率武圣君［20］利用基于士兵工作績效問卷制定半結(jié)構(gòu)式提綱，分別在士兵入伍3 個月時對管理士兵的班排長、士兵入伍12 個月時對連長和指導(dǎo)員進(jìn)行訪談，得到帶兵干部心中不合格的士兵名單（提名組），同時由《中國征兵心理測試系統(tǒng)》篩選出不合格者并經(jīng)過心理專業(yè)人員訪談確定為不合格者（訪談組）。預(yù)測淘汰符合率是指訪談、提名均不合格（正確拒絕）占訪談不合格者總數(shù)的百分比。假陰性率是指訪談合格但提名不合格者（錯誤錄用）占提名不合格者總數(shù)的百分比。武圣君［20］使用預(yù)測淘汰符合率與假陰性率來反映測試系統(tǒng)的準(zhǔn)確性。由于使用中國征兵心理測試系統(tǒng)的目的是汰劣，因此沒有計算預(yù)測合格符合率。肖利軍等［23］也并沒有將士兵工作績效問卷的分?jǐn)?shù)直接作為效標(biāo)，而是與武圣君［20］的做法類似，根據(jù)士兵工作績效分?jǐn)?shù)將士兵分為良好與不良，再與中國士兵人格問卷合格與不合格數(shù)據(jù)一起計算預(yù)測淘汰符合率。

2.3 工作表現(xiàn)評價苗丹民等［21］在初級軍官心理選拔預(yù)測性研究中使用部隊工作表現(xiàn)為效標(biāo)。該評價由學(xué)員的直接上級2 名、間接上級1～2 名完成，評價分為優(yōu)秀、良好、合格、基本合格4 級。所有評價者對該學(xué)員的評價的平均分作為該學(xué)員部隊工作表現(xiàn)成績。

2.4 課程成績苗丹民等［21］在初級軍官心理選拔預(yù)測性研究中選取5 門具有代表性的課程成績（文化課、炮戰(zhàn)理論、運(yùn)籌學(xué)、軍事地形學(xué)、炮射指揮）作為一般能力傾向測試的效標(biāo)。

3 對我軍心理選拔測試效度驗證的反思

習(xí)近平主席指出：“我們要始終堅持用打得贏的標(biāo)準(zhǔn)搞建設(shè)，堅持把提高戰(zhàn)斗力作為全軍各項建設(shè)的出發(fā)點(diǎn)和落腳點(diǎn)，堅持用是否有利于提高戰(zhàn)斗力來衡量和檢驗各項工作?！保?4］軍人心理選拔設(shè)立的目的就是淘汰那些心理素質(zhì)不適應(yīng)未來作戰(zhàn)的人，以提高部隊整體的戰(zhàn)斗力［25］。那么，我軍現(xiàn)行的《中國軍人醫(yī)學(xué)與心理選拔系統(tǒng)及標(biāo)準(zhǔn)》和廣泛使用的《中國征兵心理測試系統(tǒng)》能否達(dá)到提高戰(zhàn)斗力的目的呢？效度驗證研究給出的數(shù)據(jù)表明，我軍現(xiàn)行的心理選拔預(yù)測淘汰符合率高，能夠很好地起到汰劣的作用［20,23］。但是，我軍現(xiàn)有的系統(tǒng)仍存在一定的問題。

3.1 效標(biāo)無法反映戰(zhàn)斗力我軍多項效度驗證研究都采用了淘汰符合率這一效標(biāo)，但是淘汰符合率這個效標(biāo)真的能反映整個部隊的戰(zhàn)斗力嗎？仔細(xì)審視淘汰符合率的計算過程，會發(fā)現(xiàn)淘汰符合率是基于金標(biāo)準(zhǔn)“部隊適應(yīng)性”計算出來的，而“部隊適應(yīng)性”是由士兵工作績效問卷的得分來表示的。士兵工作績效問卷通過對士兵工作績效行為事件的提取而編制，共有38 個條目，采用李克特5 點(diǎn)評分，包括任務(wù)績效與關(guān)系績效2 個維度。任務(wù)績效維度又包括軍事訓(xùn)練、愛學(xué)習(xí)、基本能力3 個因子；關(guān)系績效維度包括工作主動、個性關(guān)懷、模范行為、集體榮譽(yù)感等4 個因子［22］。事實(shí)上，士兵工作績效問卷類似于Project A 中的任務(wù)績效評定表，它針對的是士兵和平時期日常表現(xiàn)，而且是非工作特異性的。日常表現(xiàn)優(yōu)異并不等同于在戰(zhàn)場上會有突出的表現(xiàn)［26］，因此需要明確在戰(zhàn)爭中最優(yōu)秀士兵所具備的特質(zhì)和能力，以此為效標(biāo)才能真正檢驗軍人心理選拔的有效性。

3.2 效標(biāo)功能單一淘汰符合率只能作為汰劣的參考指標(biāo)，而無法作為擇優(yōu)的指標(biāo)。與直觀感覺不同，擇優(yōu)（選拔合適的候選者）與汰劣（淘汰不適宜的候選者）實(shí)際上是2 種完全不同的選拔策略，在選拔的理論與實(shí)踐中表現(xiàn)出巨大的差異［27］。擇優(yōu)的效標(biāo)一般是工作績效，汰劣的效標(biāo)一般為淘汰符合率。我軍心理選拔研究使用的效標(biāo)是淘汰符合率，得到的結(jié)果只能證明心理選拔測試能夠較好地將有精神障礙傾向與智力低下的應(yīng)征公民淘汰。

事實(shí)上，在工業(yè)組織心理學(xué)界的人事選拔研究中并沒有擇優(yōu)與汰劣之分［28］。選拔的終極目的是招入預(yù)期工作績效高的候選者，為組織帶來更高的效益，因此選拔在人事心理學(xué)的語境中往往等同于擇優(yōu)［29-30］，無論是ASVAB 還是Select21 所開發(fā)的選拔測試都是擇優(yōu)測試。我軍在研究中一般選擇淘汰符合率作為效標(biāo)，導(dǎo)致士兵工作績效問卷所得到的信息大量損失。士兵工作績效問卷是一種順序量表，可以根據(jù)被試的得分高低進(jìn)行排序，但是淘汰符合率是將士兵工作績效問卷當(dāng)作分類量表來使用，結(jié)果只有合格與不合格2 種，信息利用率大大降低。直接以士兵工作績效問卷的得分作為效標(biāo)，既能汰劣也能擇優(yōu)，效果可能更好。

3.3 效標(biāo)選擇單一如前所述，我軍心理選拔的效度驗證主要以淘汰符合率為效標(biāo)，而淘汰符合率基于士兵工作績效問卷，其本質(zhì)類似于美軍的任務(wù)績效評定表，但是只選擇這1 個效標(biāo)來進(jìn)行效度驗證是遠(yuǎn)遠(yuǎn)不夠的。因為士兵工作績效問卷的測試內(nèi)容是和平時期日常工作表現(xiàn)的綜合評價，相較于實(shí)際操作測試與書面知識測試，它的評定內(nèi)容過于寬泛，主要反映的是關(guān)系績效部分，無法細(xì)致地反映被試的業(yè)務(wù)能力。但是，我軍并沒有如美軍那樣細(xì)致的軍事職業(yè)分類系統(tǒng)（military occupational speciality，MOS），更沒有對每種不同的軍事職業(yè)崗位進(jìn)行工作分析、挑選出具有代表性的工作任務(wù)樣本池，所以暫時還無法使用實(shí)際操作測試和書面知識測試等基于任務(wù)的效標(biāo)。較為可惜的是，雖然訓(xùn)練績效與檔案資料等相較于實(shí)際工作測試與書面知識測試容易開展、方便收集，但是之前也并沒有研究者采用這些資料作為效標(biāo)。

4 對未來軍人心理選拔效度研究的展望

相較于美軍，我軍在心理選拔領(lǐng)域起步晚、投入少，但是自“戰(zhàn)斗力標(biāo)準(zhǔn)”提出之后心理選拔越來越受到重視。心理選拔的效度驗證仍舊是心理選拔的靈魂，軍事心理學(xué)研究人員可以從以下幾方面開展研究。

4.1 建立基于任務(wù)的效標(biāo)任務(wù)池基于任務(wù)的效標(biāo)主要包括實(shí)際操作測試、書面知識測試和任務(wù)績效評定量表［12］，是工作績效測量最主要的方法，也是軍人心理選拔效度驗證中最重要的效標(biāo)。但目前我軍尚沒有基于此的效度驗證研究。這些效標(biāo)主要依賴于任務(wù)池的建立，未來的研究者可以先針對建立任務(wù)池開展研究。

4.1.1 建立我軍軍事職業(yè)崗位分類建立基于任務(wù)的效標(biāo)任務(wù)池，前提是擁有完備的軍事職業(yè)崗位分類。美軍有MOS，我軍暫時還沒有成型的軍事職業(yè)崗位分類，因此無法開展運(yùn)用基于任務(wù)的效標(biāo)的效度驗證研究?？上驳氖?，張家喜［31］初步構(gòu)建了我軍軍事崗位職業(yè)分析評測系統(tǒng)，未來的研究者可以基于此建立符合我軍軍情的軍事職業(yè)崗位分類。

4.1.2 建立每項職業(yè)崗位工作的整體任務(wù)域（total taskdomain）目前，我軍還沒有建立不同專業(yè)崗位的整體任務(wù)域，可以參照美軍的經(jīng)驗建立適合我軍軍情的專業(yè)崗位整體任務(wù)域。美軍整體任務(wù)域的建立主要有3 個來源：（1）士兵手冊（soldier’s manual）。每個MOS 提議者和負(fù)責(zé)規(guī)定MOS 政策的機(jī)構(gòu)都需要出版1 個士兵手冊，描述該軍事職業(yè)崗位在職者必須了解和執(zhí)行的具體任務(wù)。（2）陸軍職業(yè)調(diào)查項目（army occupational survey program，AOSP）。這是美國陸軍資助的1 項研究，通過定期對在職人員進(jìn)行問卷調(diào)查獲得任務(wù)描述，問卷清單包括幾百個項目。（3）在Project A 中，研究者還直接采訪了MOS 提議機(jī)構(gòu)的指定代表，請他們審查任務(wù)清單并確定是否存在其他有關(guān)任務(wù)。最后，至少有3 名高級軍士或軍官對項目冗余進(jìn)行了編輯，并對項目進(jìn)行了修訂和組合，進(jìn)一步細(xì)化了綜合任務(wù)列表。

4.1.3 各領(lǐng)域?qū)＜覍θ蝿?wù)特征進(jìn)行評定崗位工作的整體任務(wù)域明確之后，需要由15～30 名正在一線工作的軍官（上尉及以上）或士官（上士及以上）組成的專家組對最終修訂完成的任務(wù)清單中的任務(wù)特征進(jìn)行評定。任務(wù)特征主要包括任務(wù)分類、任務(wù)重要性和任務(wù)難度。

4.1.4 選擇項目建立任務(wù)池需要由10名軍官（上尉及以上）或士官（上士及以上）組成工作組，每人在任務(wù)清單中挑選30～40 項自認(rèn)為最能代表該軍事職業(yè)崗位的任務(wù)，然后工作組進(jìn)行德爾菲法專家協(xié)商，達(dá)成共識，最終選出30 項最能代表該軍事職業(yè)崗位的任務(wù)。在Project A 中，書面知識測試是針對任務(wù)池中所有30 項任務(wù)的，實(shí)際操作測試與任務(wù)績效評定量表則針對30 項任務(wù)中隨機(jī)挑選出的15 項任務(wù)。

4.2 建立符合現(xiàn)代戰(zhàn)爭特點(diǎn)的效標(biāo)無論是美軍的JPM、Project A，還是我軍的《中國征兵心理測試系統(tǒng)》，瞄準(zhǔn)的都是和平時期軍人的日常表現(xiàn)。但是和平時期的任務(wù)環(huán)境與戰(zhàn)時的環(huán)境有著天壤之別［32-33］，不能用來反映部隊的戰(zhàn)斗力，需要更符合現(xiàn)代戰(zhàn)爭特點(diǎn)并且瞄準(zhǔn)戰(zhàn)時表現(xiàn)的效標(biāo)。美軍在21 世紀(jì)開展的Select21 能夠給我們帶來一些啟示［7］，該研究表明對未來戰(zhàn)士的選拔可以從3 個相互補(bǔ)充的方面考慮：（1）未來戰(zhàn)爭條件；（2）不同的績效方面（例如溝通、團(tuán)隊合作等）；（3）士兵需要完成的特殊任務(wù)工作。

4.3 綜合運(yùn)用不同的效標(biāo)預(yù)測淘汰符合率并不能完全反映心理選拔系統(tǒng)的有效性，只選用預(yù)測淘汰符合率作為效標(biāo)是遠(yuǎn)遠(yuǎn)不夠的，應(yīng)該綜合運(yùn)用各種不同的效標(biāo)［34］，特別是工作績效，來驗證心理選拔的效度。