薛 婷 陳 浩 賴凱聲 董穎紅 樂國安
(1天津中醫(yī)藥大學管理學院, 天津 300193) (2阿姆斯特丹自由大學社會科學學院社會學系,阿姆斯特丹1081HV, 荷蘭) (3南開大學周恩來政府管理學院社會心理學系, 天津 300071)(4魯東大學教育科學學院心理系, 山東煙臺 264011)
網(wǎng)絡信息時代的到來, 不僅改變了人們的生活方式, 同時也給學術研究范式帶來深刻變革?,F(xiàn)實世界與網(wǎng)絡世界緊密關聯(lián), 彼此纏繞, 人類行為痕跡以數(shù)據(jù)形式大量涌現(xiàn)。心理學研究者愈來愈依賴計算機與信息科學技術, 以探索個體或群體的心理和行為規(guī)律。應時代特征和學科發(fā)展之需誕生的心理信息學(Psychoinformatics), 正是心理學研究者積極嘗試利用計算機和信息科學技術, 獲取、整理和分析心理學研究資料的新學科(Yarkoni, 2012)。它已然取得一些令人興奮的成果,昭示著這門新興交叉學科, 將從研究方法和研究內(nèi)容上給心理學注入新的活力。
回顧心理學和信息科學各自的發(fā)展歷史與特點, 不難發(fā)現(xiàn), 兩者的相遇并非偶然, 而是兩者在學科目的、內(nèi)容上有所交叉的集中體現(xiàn), 同時也是其各自尋求發(fā)展的必然趨勢。
以信息作為主要研究對象、以信息運動規(guī)律為主要研究內(nèi)容、以信息科學方法論為主要研究方法的信息科學, 其主要研究目標是擴展人的信息功能, 尤其是智力功能(鐘義信, 2002)。在信息科學研究者看來, 智能本身并不是什么神秘的東西, 其本質(zhì)就是一種利用信息的能力?,F(xiàn)在科學早已發(fā)現(xiàn), 人類是通過感覺器官、傳導神經(jīng)網(wǎng)絡、思維器官和效應器官的協(xié)同合作來認識世界和改造世界。信息科學技術則試圖在這四種人類信息器官的功能基礎上, 進一步發(fā)展感測、通信、計算機與智能、控制等技術, 以擴展人的信息功能,更好地完成信息的獲取、傳遞、加工、再生和施用等功能(Brillouin, 1956)。信息的普遍存在性和信息科學的核心目標, 決定了該學科需要不斷地從其它領域汲取養(yǎng)分來豐富自己。這一過程也促使信息科學技術逐漸成為一種典型的通用技術,深入到系統(tǒng)科學、控制論、認知科學、人工智能等諸多學科領域中(鐘義信, 2002)。
近半個世紀以來, 信息科學先后與經(jīng)濟學、生物學、神經(jīng)科學等學科聯(lián)姻, 誕生出經(jīng)濟信息學(Ecoinformatics)、生物信息學(Bioinformatics)和神經(jīng)信息學(Neuroinformatics)等交叉學科。這些領域綜合運用信息與計算機科學技術, 探討了與經(jīng)濟活動有關的信息特征及其運動規(guī)律; 生物信息的獲取、處理、儲存、分發(fā)、分析和解釋; 神經(jīng)系統(tǒng)信息的產(chǎn)生、傳輸、加工規(guī)律及編碼、存儲與提取機理等問題。這些交叉學科在理解和解釋各類經(jīng)濟信息現(xiàn)象, 闡明核酸和蛋白質(zhì)序列數(shù)據(jù)所包含的結構功能, 以及大腦不同層次活動的生理學和心理學意義上, 取得了許多令人興奮的成果(邱均平, 2002; 張陽德, 2009; 陳惟昌, 王自強, 陳志華, 安榮姝, 2001)。相比而言, 心理信息學的研究成果一直散落在不同學科背景的新近文獻之中。
其實, 心理學和信息科學對彼此的關注和互動由來已久。早在Shannon提出信息論時, 心理學家和其它領域的研究者們就試圖將信息論的概念和方法, 用于解決各自學科面臨的種種難題,但因為信息科學自身的不完善以及其它學科盲目的生搬硬套, 許多工作都不同程度地遭遇了困境。近年來, 信息科學技術的飛速發(fā)展, 以及學界對語義信息和語用信息的重新關注, 使得信息科學開始肩負起聯(lián)結技術科學與社會科學的重要使命。采用信息觀點和技術重新闡釋社會學、心理學命題的嘗試, 在扎扎實實地進行著。研究者們相信, 對事物語義信息和語用信息的充分挖掘與利用, 有助于揭示諸如思維、智慧這些高級活動的復雜過程。
心理信息學的誕生, 也得益于社會科學和信息科學領域的研究者們出自不同學科視角的已有努力。最初, 信息科學家們認識到只有深入理解社會科學規(guī)律, 才能真正提高信息技術的社會效應, 由此促成了社會計算(social computing)的誕生(Schuler, 1994; 王飛躍, 2006)。從最初的社會軟件到后期的一門學科, 社會計算的內(nèi)涵不斷演進,當下其關注的核心問題是如何結合信息科學技術和社會科學理論, 對人們在互聯(lián)網(wǎng)絡世界中留下的海量真實數(shù)據(jù)進行分析, 進而提高信息技術的社會應用價值(陳浩, 樂國安, 李萌, 董穎紅,2013)。
同樣是利用信息技術獲取、存儲并分析網(wǎng)絡世界中海量個體行為數(shù)據(jù)的計算社會科學(computational social science), 則主要立足于社會科學理論視角, 通過引進新的方法和技術探究新時代背景下個體或群體間的合作與競爭關系、社會網(wǎng)絡結構及其演化博弈等社科核心問題, 屬于社會科學與信息科學的交叉學科(Lazer et al.,2009)。計算社會心理學(computational social psychology)是較早就被倡導的心理學與信息技術的交叉研究領域, 其主要特征是利用基于代理建模(agent-based modeling)的仿真模擬技術, 探索由微觀個體心理與個體間互動涌現(xiàn)出的宏觀模式之間的非線性關系(Smith & Conrey, 2007)。
從心理學單一學科視角來看, 社會計算、計算社會科學雖然帶來了研究方法上的革新, 但研究內(nèi)容過于寬泛, 計算社會心理學又難以代表網(wǎng)絡信息時代下心理學研究的整體發(fā)展潮流, 無法全面展示心理學與信息科學的密切聯(lián)系和互動。作為產(chǎn)生和利用信息的真正智能體, 人類的各種心理和行為會影響信息運動的各個環(huán)節(jié)。同時,不同信息的性質(zhì)、所在載體、傳遞渠道和過程等,也無時不在影響著個體和群體的心理和行為。面對這樣一個新交流與生活模式不斷涌現(xiàn)、數(shù)據(jù)不斷激增的嶄新世界, 心理學也開始面臨如何處理大規(guī)模多樣化數(shù)據(jù)、探索和建立新模型、建立可共享和可持續(xù)發(fā)展的數(shù)據(jù)庫等方法論難題。這些都可借助信息科學所孕育的大量前沿技術在不同程度上獲得解決。這預示著將信息科學技術滲透到心理學研究的各個環(huán)節(jié)和各個領域, 能使雙方最大程度上受益, 并擦出新的科學火花。
基于此, Yarkoni (2012)在總結信息科學技術應用于心理學研究過程中的數(shù)據(jù)收集、資料整合和組織、數(shù)據(jù)挖掘和分析等方面所取得的既有成果基礎之上, 正式提出了“心理信息學”這一新穎的交叉學科概念。作為一個真正立足于心理學整體特色和學科發(fā)展的新學科方向, 心理信息學重點關注如何在心理學研究的各個環(huán)節(jié)和各個分支領域中, 借助計算機和信息科學技術促進心理學研究的與時俱進。既有研究表明, 這類方法和認識上的革新不但可以幫助研究者從新視角驗證心理學經(jīng)典理論假設, 并且在探索新的有關個體和群體的心理和行為規(guī)律方面展示出了巨大潛力, 因此, 它有望成為心理學未來發(fā)展的重要方向之一。
此外, 需要注意的是, 同為互聯(lián)網(wǎng)時代產(chǎn)物的網(wǎng)絡心理學(Cyber Psychology), 雖然在研究場域上與心理信息學有所重疊, 但其與幾乎關照心理學整個體系和研究過程的心理信息學相較, 在研究目的、方法和內(nèi)容上都有所不同。心理信息學關注的是如何應用新技術, 在心理學研究整個過程發(fā)揮作用, 促進心理學學科的整體發(fā)展。而目前的網(wǎng)絡心理學則更側重以經(jīng)典理論為基礎,以心理學傳統(tǒng)范式為研究手段, 強調(diào)網(wǎng)絡是心理行為的特殊發(fā)生情境, 探索與網(wǎng)絡有關的各類心理或行為現(xiàn)象, 屬于應用心理學的分支方向之一。
心理學自誕生伊始就以科學認識論與方法論為學科指導原則, 一直在研究方法上進行探索和改進, 努力形成嚴謹、成熟的學科研究范式。但與此同時, 心理學研究的科學性不斷受到來自學科內(nèi)外的諸多質(zhì)疑, 究其原因主要來自于研究方法和技術上的局限。其中, 取樣缺乏代表性和研究手段人為性問題比較突出:受人力、時間、經(jīng)濟成本和可操作性限制, 傳統(tǒng)心理學研究多以大學生為被試, 即使是大規(guī)模調(diào)查, 也很難真正意義上代表總體。另一方面, 心理學的核心目標是探索現(xiàn)實生活中人類心理和行為的因果機制, 但典型的實驗法研究通常在毫無“人情”的實驗室控制情境中進行, 高度抽象并明顯脫離實際生活,這無疑降低了心理學研究的外部生態(tài)效度, 制約著心理學的進一步發(fā)展(Gosling, Gaddis, & Vazire,2008; 彭凱平, 劉鈺, 曹春梅, 張偉, 2011)。
網(wǎng)絡時代的到來以及計算機和信息科學技術的飛速發(fā)展, 給心理學研究帶來了福音, 以研究方法和技術工具的深刻變革為重要特征的心理信息學, 為心理學研究過程的各個階段注入了新活力。
無論是以互聯(lián)網(wǎng)為平臺進行調(diào)查和實驗, 還是利用移動設備收集各類心理行為數(shù)據(jù), 甚或是直接抓取網(wǎng)絡生態(tài)數(shù)據(jù)信息, 都使心理學研究數(shù)據(jù)在數(shù)量和質(zhì)量上有了很大提升。
相對于其它研究方法, 網(wǎng)絡實驗和調(diào)查對心理學研究者來說并不陌生, 特別是在西方國家,已經(jīng)出現(xiàn)了很多方便學者們進行研究的專門化網(wǎng)站。譬如, “調(diào)查猴子” (SurveyMonkey)和Qualtrics就設計了一些易于操作的應用程序, 以便人們能夠輕松地創(chuàng)建和管理復雜的研究。為充分發(fā)揮網(wǎng)絡實驗的模擬性和便利性, 這些網(wǎng)站還允許研究者利用簡單的JavaScript等編程語言自行設計和實施與現(xiàn)實情境相似的實驗。此外, “亞馬遜土耳其機器人” (Amazon’s Mechanical Turk, MTurk)等網(wǎng)站的出現(xiàn), 則使得招募高質(zhì)量被試變得更加容易和經(jīng)濟。該類網(wǎng)站包含了完整的參與者報酬系統(tǒng)、大規(guī)模被試庫, 以及從研究設計、招募被試到數(shù)據(jù)收集的整個簡易流程。
面對同行關于網(wǎng)絡實驗、調(diào)查信效度如何的憂慮和疑問, 一些研究者針對利用Mturk等網(wǎng)站招募的樣本人群特征和收集的數(shù)據(jù)質(zhì)量進行了分析。結果發(fā)現(xiàn), 與傳統(tǒng)研究樣本相比, 網(wǎng)絡樣本在性別、年齡、地區(qū)和社會經(jīng)濟地位等方面都更具區(qū)分性和代表性; 雖然人們決定是否參與研究受報酬水平和任務長度的影響, 但通過這些網(wǎng)站仍能快速而經(jīng)濟地招募到被試; 實際的報酬水平并不會影響到數(shù)據(jù)的質(zhì)量; 收集到的數(shù)據(jù)的可信度至少不會低于傳統(tǒng)方法, 而且網(wǎng)絡調(diào)查結果的外部效度不受重復作答者或不認真作答者的影響(Gosling, Vazire, Srivastava, & John, 2004; Buhrmester, Kwang, & Gosling, 2011)?;ヂ?lián)網(wǎng)作為一種新的研究工具, 其價值不僅體現(xiàn)在擴展了心理學的研究平臺和實驗范圍, 更重要的是, 其為解決傳統(tǒng)研究的弊端提供了一個可能的新途徑。
除了互聯(lián)網(wǎng)以外, 研究者們對移動設備(如手機)的關注和使用也在不斷增多。很多年前, 他們就開始使用各類移動設備記錄和收集數(shù)據(jù)。有研究者通過電信服務商提供的用戶電話撥打時間、長度、號碼和所處位置等信息, 追蹤人們的社會聯(lián)系, 進行社會網(wǎng)絡分析(Campbell et al., 2008;Eagle, Pentland, & Lazer, 2009)。限于數(shù)據(jù)的匿名性, 那時研究者還未能充分利用到移動設備的傳感性、聯(lián)結性和互動性等功能。
另外一些研究者通過購買或設計特定功能的電子記錄設備, 收集相對少量被試較為詳細的心理和行為數(shù)據(jù)。譬如, 一種叫做“電子激活錄音器”(Electronically Activated Recorder, EAR)的便攜式記錄設備(現(xiàn)已開發(fā)為iPhone手機的APP), 能定期記錄日常生活中人們的聲音信息, 幫助研究者了解到真實情境中的人類行為(Mehl, Pennebaker,Crow, Dabbs, & Price, 2001)。性別差異一直是心理學關注的議題。有關女性更加多語健談的刻板印象, 已深深根植于東西方各類民諺和流行文化中, 且被認為是不證自明的科學事實。其實之前很長一段時間, 并沒有任何研究系統(tǒng)地記錄過大批人群的自然交談過程, 為這一假設提供直接可靠的數(shù)據(jù)檢驗。有研究者曾通過分析153個英國公民日常對話的磁帶錄音推斷, 女性平均每天說8805個單詞, 男性平均每天說6073個單詞。但該研究者也承認, 這種估計存在問題, 因為他缺少有關被試何時關閉錄音機的信息(Liberman,2006)。為更加科學地檢驗這一假設, 研究者通過使用EAR來對人們在現(xiàn)實生活中的即時互動, 進行不加干擾和不可自控的記錄。由此得到的結果是, 男性和女性平均每天說16000個單詞, 性別間差異不顯著, 但個體間差異顯著(Mehl, Vazire,Ramírez-Esparza, Slatcher, & Pennebaker, 2007)。Vazire和Mehl (2008)做的另一項研究發(fā)現(xiàn), 與自己關系密切的人往往比個體本人更能預測該個體的日常行為。這就提醒廣大研究者, 通過自我報告評估人們的心理和行為, 甚或是人格特質(zhì), 也許遠非想象中那般可靠。雖然基于新設備的研究發(fā)現(xiàn)了許多令人深省的研究結果, 但這些設備大多昂貴、笨重, 且需要實地分發(fā)給被試, 因此在學界并未獲得推廣。
近年來, 隨著智能手機的大幅普及以及受到手機應用軟件開發(fā)者的啟發(fā), 一些心理學研究者著手開發(fā)能夠供網(wǎng)絡下載的手機應用軟件, 這類軟件通常能夠自動管理知情同意、資料收集、資料上傳和費用支付等研究過程, 已在心理學研究中嶄露頭角(Miller, 2012)。Dufau等人(2011)指出,傳統(tǒng)認知心理學研究利用小規(guī)模同質(zhì)自愿者群體,考察注意、記憶、語言等人類認知功能所存在的局限性和可能的取樣偏差, 進而展示了將手機作為收集大規(guī)模異質(zhì)人群數(shù)據(jù)的工具的可能性和優(yōu)勢, 以及對整合認知領域相關研究與理論的巨大潛力。其和同事開發(fā)的一種多語言版本語言任務決策應用程序, 在4個月的時間內(nèi)收集到4000名參與者的數(shù)據(jù)。Eagle 等人(2009)為解決以自我報告為主要數(shù)據(jù)源的人際互動和社會網(wǎng)絡結構研究,在深度、廣度和準確性等方面所面臨的瓶頸, 發(fā)起了名為“現(xiàn)實挖掘” (reality mining)的研究項目。該項目通過分析94位智能手機用戶連續(xù)9個月的位置和通話記錄, 以及有關日常行為和人際關系的自我報告, 發(fā)現(xiàn)兩種數(shù)據(jù)源的分析結果雖有重疊, 但并不完全一致, 口頭報告更容易隨互動時間和顯著性的變化而發(fā)生偏移。并且, 結果顯示僅僅依靠手機客觀數(shù)據(jù)就能很準確地推測出人們之間的朋友關系, 甚至能夠預測諸如地位、工作滿意度等個體水平層面的社會與心理變量。Killingsworth和Gilbert (2010)通過一個基于iPhone手機的應用軟件, 創(chuàng)建了一個大范圍人群日常生活中的即時思維、感受和行動報告的大規(guī)模數(shù)據(jù)庫。在此基礎上, 研究者發(fā)現(xiàn)人們經(jīng)常處在“走神”(wondering)狀態(tài), 且不管此時正在干什么, 都會伴隨不愉快的情緒體驗。人們在想什么比人們在做什么更能預測人們的情緒狀態(tài)。該研究驗證了走神實際上是一種認知進化但卻以情緒消耗為代價的觀點。
互聯(lián)網(wǎng)的出現(xiàn)深刻地改變了人們的生活方式:虛擬和現(xiàn)實的界限愈加模糊, 人們通過網(wǎng)絡交流信息和情感, 更新自己的近況和活動, 上傳和分享圖片, 下載音樂和電影, 購買商品和尋求問題答案。計算機和信息科學技術的發(fā)展, 使得這些反映現(xiàn)代生活印跡的海量數(shù)據(jù)得以永久保存, 并可通過一定程序或渠道獲得, 為心理學家探究人們的心理生活提供了無以比擬的大規(guī)模生態(tài)數(shù)據(jù)庫。
從起初通過電子郵件分析探索社交網(wǎng)絡特征(Dodds, Muhamad, & Watts, 2003; Adamic & Adar,2005), 到隨后基于博客的情感分析技術來探索人們的情緒變化趨勢(Balog & Rijke, 2006), 及其與現(xiàn)實行為的相關性(Mihalcea & Liu, 2006; Mishne& Glance, 2006), 再到近年來針對Facebook和Twitter等著名社交媒體網(wǎng)站上海量用戶數(shù)據(jù)的集中挖掘(Dodds, Harris, Kloumann, Bliss, & Danforth,2011; Gosling, Augustine, Vazire, Holtzman, &Gaddis, 2011; Lansdall-Welfare et al., 2012; Zhang,Fuehres, & Gloor, 2011)。研究者對網(wǎng)絡媒介的關注和把握正是為了映射人們的真實生活, 網(wǎng)絡發(fā)展和技術進步使這一看似單純的目標得以實現(xiàn)。
為顯著提高數(shù)據(jù)收集和分析工作的學術共同體利益, 心理學研究者們正在積極構建許多分支研究領域下可共享和重復利用的數(shù)據(jù)庫和數(shù)據(jù)分類體系, 以便對分支研究領域乃至整個學科的多源頭數(shù)據(jù)進行迭代重組與整合工作。
以研究工具技術創(chuàng)新著稱的認知神經(jīng)科學,可以說是實踐心理信息學主旨的典范, 該領域的研究者已經(jīng)不再局限于個別研究的新技術吸納與創(chuàng)新, 而是立足于整個學科領域的發(fā)展。一些研究者和研究機構開始致力于開發(fā)大規(guī)模在線數(shù)據(jù)庫, 以促進跨領域數(shù)據(jù)的整合和分享。譬如最近建立的一個公共數(shù)據(jù)庫“千人功能連接組腦項目”(1000 Functional Connectomes Project), 包含了來自35個地區(qū)的1400多名被試的大腦功能掃描數(shù)據(jù), 為研究者提供了非常有價值的大規(guī)模人類靜息態(tài)數(shù)據(jù)(Biswal et al, 2010), 有利于對人腦功能的協(xié)同深入探索。腦地圖數(shù)據(jù)庫(BrainMap Database)和界面管理系統(tǒng)數(shù)據(jù)庫(Surface Management Systems DataBase, SumsDB)等還提供了快速數(shù)據(jù)挖掘技術、可視化技術、整合與分析不同研究中立體坐標技術(如檢索和神經(jīng)影像分析等), 從而為研究者在不同研究領域間建立連接, 驗證已有假設, 以及開發(fā)新領域、發(fā)展新假設和理論等方面提供幫助(Laird, Lancaster, & Fox, 2005; Dickson,Drury, & Van Essen, 2001; Yarkoni, Poldrack, Van Essen, & Wager, 2010)。
數(shù)據(jù)庫應用的另一重要領域是在線文本情感分析。它通常建立在特定情感詞庫或語料庫基礎之上, 通過詞匯匹配技術(term-based matching technique), 將文本中的詞匯與情感詞庫或相應語料庫中的詞語進行匹配, 從而判斷文本在情感方面上的傾向或極性(O’Connor, Balasubramanyan,Routledge, & Smith, 2010)。研究者們已經(jīng)通過人工、自動或半自動化等方式建立了一些情感詞庫,如標準英語情感詞匯庫(Affective Norms for English Words, ANEW)、意見發(fā)覺者(OpinionFinder)、情感詞語網(wǎng)絡詞典(WordNet-Affect)和谷歌心境狀態(tài)量表(Google-Profile of Mood States, GPOMS)等(Bradley & Lang, 1999; Wilson, Wiebe, & Hoffman,2005; Strapparava & Valitutti, 2004; Bollen, Mao,& Zeng, 2011)。
此外, 很多類似于情感詞庫的特定領域數(shù)據(jù)庫, 以及其它一些有關人們心理與行為的數(shù)據(jù)庫,都可在特定社會科學網(wǎng)站, 如哈佛定量社會科學研究所(Institute for Quantitative Social Science,IQSS)的The Dataverse Network或?qū)I(yè)領域數(shù)據(jù)庫, 如開放性功能核磁共振項目(OpenfMRI)中下載。這些共享資源有助于研究者對彼此的研究結果進行比較、驗證、擴展和整合, 加速該領域的研究進程。
有心理學研究者擔憂如果任憑各類數(shù)據(jù)庫各自為戰(zhàn)地獨立建設, 可能會導致雜亂無序的學術研究狀態(tài), 反而會阻礙各個領域乃至整個學科的發(fā)展。因此, 為最大限度利用公共數(shù)據(jù)庫并更有效地對數(shù)據(jù)進行結構化訪問與搜索, 一些心理學家嘗試建立全面的心理結構分類體系。Poldrack等人(2011)的“認知地圖集項目” (Cognitive Atlas)就試圖建立一個能夠被學界廣泛認可的認知心理學概念與研究任務的智識體系, 從而促進相關研究的自覺整合。Balota, Yap, Hutchison和Cortese(2013)進一步利用大規(guī)模數(shù)據(jù)挖掘技術, 對三個獨立數(shù)據(jù)庫(視覺詞語再認數(shù)據(jù)庫、語言啟動數(shù)據(jù)庫和再認記憶數(shù)據(jù)庫)進行了統(tǒng)合分析, 嘗試建立起能夠被共享和公認的有關語言加工過程和關鍵影響因素的普適原則。這些工作充分體現(xiàn)了大規(guī)模數(shù)據(jù)研究在建立共享數(shù)據(jù)庫、探索各變量間有機、有序聯(lián)系, 以及建立連續(xù)性理論體系中的重要性和必要性。
相關工作剛剛開始, 距離建立起一個容納所有心理學分支的完整分類體系還有很長的路要走,但是相應數(shù)據(jù)庫與基礎分類體系的完備, 的確會極大促進心理學研究者組織、分享和獲取學術共同體協(xié)同努力的成果, 從而加速對人類心理世界的探索之旅。
計算機和信息科學技術的發(fā)展, 給心理學帶來的不僅僅是對海量社會生態(tài)數(shù)據(jù)的捕獲, 更是一場分析工具和技術上的變革。一方面, 各類開源統(tǒng)計建模軟件(如R軟件)和Ucinet、KrackPlot、Negopy等網(wǎng)絡分析軟件, 使很多曾經(jīng)不能實現(xiàn)的分析變成了可能, 推動了相關研究進程。另一方面, 作為心理信息學數(shù)據(jù)分析的核心技術, 計算機數(shù)據(jù)挖掘技術的逐步滲入, 無形中促進了心理學探索性研究的發(fā)展, 補充了傳統(tǒng)心理學以假設驗證為主要特征的研究邏輯, 有助于產(chǎn)生全新的假設和理論。
一些研究者開始利用各種計算機算法進行數(shù)據(jù)挖掘, 揭示大規(guī)模數(shù)據(jù)視野中人類心理與行為的新特征和潛在新關聯(lián)。譬如, Yarkoni和他的同事開發(fā)了一個叫做“神經(jīng)合成” (Neurosynth)的計算平臺, 該平臺利用數(shù)以千計的神經(jīng)影像論文中的數(shù)據(jù), 自動生成fMRI元分析結果, 并且能對大腦活動模式進行自動解碼(Yarkoni, Poldrack,Nichols, Van Essen, & Wager, 2011)。計算機技術在數(shù)據(jù)分析中的另一重要應用, 是利用機器學習算法對研究數(shù)據(jù)進行分類和預測。Pereira, Mitchell和Botvinick (2009)曾引入機器學習算法對大腦活動狀態(tài)和心理失調(diào)癥狀進行編碼、分類和預測。這些算法有助于解決長久困擾學界的過度適應問題(Kriegeskorte, Simmons, Bellgowan, & Baker, 2009)。
對人類社交網(wǎng)絡的拓撲結構分析, 更是以各類計算機算法為基礎, 如馬爾科夫法(如PageRank算法、HITS模型)、度中心法(degree centrality)、基于路徑法(如α-centrality、SenderRank)等(孟小峰, 余力, 2011)。這些數(shù)據(jù)挖掘技術的應用使研究者能夠更好地探究人與人之間的彼此關系和相互影響, 有助于解決復雜網(wǎng)絡社會的非線性涌現(xiàn)問題(程學旗, 陳海強, 韓戰(zhàn)鋼, 2006)。
正如Yarkoni (2012)所言, “如同基因組關聯(lián)研究給復雜的疾病基因?qū)W帶來的革命那樣, 這種大規(guī)模數(shù)據(jù)庫、豐富的樣本和經(jīng)驗數(shù)據(jù)與計算機算法的結合, 可能會使我們很快識別出各種心理和行為現(xiàn)象中的新相關……發(fā)現(xiàn)一些傳統(tǒng)研究方法無法發(fā)現(xiàn)的反直覺性結果”。
心理信息學不同于心理學其它交叉或分支領域的一個顯著特征, 體現(xiàn)在其對心理學學科健康發(fā)展的整體關注上。研究者們重視利用信息技術促進心理學研究的各個環(huán)節(jié)都能取得實質(zhì)性進步,其中也包括如何提升研究成果的發(fā)布質(zhì)量, 以及如何促進研究成果在領域內(nèi)外的共享與交流。
為此, 該領域的先驅(qū)們提出了一些供學界同仁參考的有益方向:通過引入商業(yè)和社交網(wǎng)站中廣泛使用的協(xié)同過濾算法, 提高對已發(fā)表文章的評論質(zhì)量; 通過自動化質(zhì)量控制算法, 檢測學術出版物中可能存在的偏見; 開發(fā)專門用于檢索未發(fā)表論文的數(shù)據(jù)庫; 設計個性化推薦技術, 幫助個體研究者識別他可能感興趣的文章; 利用已有媒介或開發(fā)新的專門化媒介, 促進研究成果在領域內(nèi)的討論以及面向大眾的分享和普及(Yarkoni, 2012)。
相較于遵循類同理路出現(xiàn)的經(jīng)濟信息學、生物信息學和神經(jīng)信息學等交叉學科的快速發(fā)展和相對成熟, 心理信息學還剛剛起步, 以它為明確主題的研究還比較少。但不可否認的是, 心理學和信息科學在思想和技術上的融合, 已經(jīng)在情緒、人格等個體心理領域, 以及社會網(wǎng)絡和群體動力等社會(群體)心理領域給我們帶來了不少驚喜。
計算機和信息科學技術的應用, 使研究者可以從微觀和宏觀層次上共同探索個體心理規(guī)律,揭示其對個體行為和社會生活等方面帶來的影響,其中比較典型的研究領域是情緒和人格。
不管是單純?yōu)榱嘶A科學研究, 還是為了社會或商業(yè)應用, 情緒一直是心理學和信息科學研究的重點之一。得益于數(shù)據(jù)收集方法及文本情感分析技術的發(fā)展, 研究者在此領域已取得了一些令人矚目的成果, 在微觀或宏觀層面上為我們描繪出人類情緒的新圖景。
(1)情緒的內(nèi)在機制和外在表達
在微觀層面上, 研究者訴諸于大規(guī)模真實數(shù)據(jù)和挖掘技術, 探索情緒的內(nèi)在機制和外在表達。譬如, 以基于內(nèi)核圖像重建為核心的標準化元分析技術, 使得研究者可以對數(shù)十、甚至數(shù)百個研究中的神經(jīng)影像結果進行整合性分析, 已被應用于情緒失調(diào)和腦功能特征的關系研究中。Wager等人(2008)通過該元分析技術發(fā)現(xiàn), 杏仁核不僅與害怕情緒有關, 在厭惡情境下也會表現(xiàn)出不同程度的激活; 杏仁核和腦島在三種不同焦慮狀態(tài)下都有較高水平的激活, 但是創(chuàng)傷后應激反應只引起腹內(nèi)側前額葉頁皮層的高度激活。這些發(fā)現(xiàn)充實著我們對情緒內(nèi)在機制的理解(Etkin& Wager, 2007)。Kober等人(2008)指出, 以往負性情緒模型只關注杏仁核的作用, 忽視了動物模型研究中相關腦區(qū)發(fā)現(xiàn), 如中央灰質(zhì)和丘腦下部。元分析顯示, 這兩個區(qū)域在消極情緒時會出現(xiàn)重復性激活現(xiàn)象, 因此有必要對兩者的功能和重要性進行重新考量。
另一方面, 為更有效幫助情緒障礙患者、協(xié)助心理衛(wèi)生工作者, 一些研究者探索利用社交媒體診斷或預測個體的抑郁障礙發(fā)作, 并獲得了意外收獲。例如, 有研究者采用經(jīng)濟省時的網(wǎng)絡數(shù)據(jù)抓取技術和MTurk上獲得的抑郁量表測試數(shù)據(jù)建構樣本庫。通過分析這些個體在Twitter上的發(fā)帖表達特征, 研究者發(fā)現(xiàn)患有抑郁障礙的被試,在確診前一年的社交活動就開始減少, 消極情緒體驗有所增加, 同時表現(xiàn)出更多的自我關注和對抗抑郁藥物的關注等。基于這些線索, 研究者們建立了一個統(tǒng)計分類指標, 預測人們罹患抑郁障礙的可能性。實踐證明, 該指標的預測準確率達到70%以上(De Choudhury, Gamon, Counts, &Horvitz, 2013)。
(2)大眾情緒變化規(guī)律和情緒指標
海量數(shù)據(jù)分析技術也讓研究者可以從由微觀至宏觀的路徑, 把握由若干個體疊加起來的大眾情緒整體特征、變化規(guī)律, 及其與現(xiàn)實社會經(jīng)濟事件的相關性, 從而建立具有預測效力的宏觀情緒指標體系。
Golder和Macy (2011)曾對數(shù)百萬的Twitter使用者的在線信息進行分析, 將他們的情緒變化趨勢以天或周為單位進行量化, 在個體季節(jié)性情感障礙成因的兩個競爭性假設中進行甄別驗證。Dodds和Danforth (2010)采用人們對大量詞匯的情緒效價評估結果, 對不同類型的大規(guī)模文本,如歌曲名和歌詞、網(wǎng)絡博客、國情演說等, 進行數(shù)據(jù)挖掘。結果發(fā)現(xiàn), 從20世紀60年代到20世紀90年代中期的歌詞中所傳達的幸福感水平有逐漸下降的趨勢, 博客中所表達的幸福感水平在2005年至2009年間穩(wěn)步上升。為更全面地了解公眾在Twitter上的情緒表達規(guī)律, 研究者擴大了詞匯的選取范圍, 增加了詞庫容量, 并采用與ANEW相類似的方法, 建構了一個可調(diào)節(jié)的、實時的、免干擾的和基于文本的測量工具。該方法的核心是人們對一系列詞匯的幸福度評估以及一個將詞匯范疇擴展至所涉獵文本的新算法。在此基礎上, Dodds等人(2011)通過分析6300多萬個用戶在33個月間所發(fā)的約46億條Twitter信息, 揭示出了大眾幸福感水平在不同時間尺度上(幾小時到幾年)的變化規(guī)律。
為探索情緒和現(xiàn)實事件之間的關聯(lián)性, 有研究者對1084名美國公民在911前后各兩個月間的在線日記文本進行了分析, 結果顯示, 那些有更多認知性和社會性卷入的參與者表現(xiàn)出了更強烈的消極情緒, 但這些情緒在事件發(fā)生兩周后都恢復到正常水平(Cohn, Mehl, & Pennebaker, 2004)。Back, Küfner和Egloff (2010)對911事件當天的約50萬條手機短信進行了分析, 揭示出了不同類型情緒的變化規(guī)律:人們最開始感到憤怒, 隨后變得焦慮, 但很快恢復到正常水平, 最后出現(xiàn)的是悲傷情緒。
研究者還嘗試建立能夠預測現(xiàn)實世界中的群體行為或社會經(jīng)濟事件的情緒指標。如Devitt和Ahmad (2007)曾通過識別金融評論文本的情感極性, 預測金融市場的未來走勢。Kim和Hovy (2007)通過分析大樣本網(wǎng)絡新聞評論預測美國大選結果。Bollen, Pepe和Mao (2011)利用OpinionFinder和GPOMS, 分析人們在Twitter上的特定類型情緒表達, 發(fā)現(xiàn)了它們是能顯著提高預測道瓊斯工業(yè)指數(shù)(Dow Jones Industrial Average, DJIA)效果的情緒指標。Mao, Counts和Bollen (2011)在Google和Twitter上搜索與股市相關的信息, 將之與相應的情緒指標進行比較, 發(fā)現(xiàn)“谷歌搜索觀察” (Google Insight for Search, GIS)和“Twitter投資者每日情緒指數(shù)”能預測股市波動。Lansdall-Welfare等人(2012)利用WordNet-Affect分析了98萬英國人在Twitter上歷時31個月所發(fā)布的信息,發(fā)現(xiàn)大眾的某些情緒能預測社會事件的發(fā)生, 如在2011年夏季的倫敦暴動發(fā)生之前, 公眾的憤怒情緒從春季就開始持續(xù)增加。這些研究昭示了信息技術與情緒理論相結合在應用上的巨大潛力。
人格作為反映個體穩(wěn)定心理行為傾向的重要特征, 一直受到心理學和諸多領域的關注。目前,研究者們開始考慮如何利用、開發(fā)新的方法和技術, 促進人格特質(zhì)的測量及其相關影響因素研究的進一步發(fā)展。
Yarkoni曾開發(fā)一種能夠以最小代價自動化縮短各種人格問卷的方法, 并實證驗證了該方法的有效性。在此基礎上, 其生成了一個包含181道題目的新量表, 該量表能夠準確地獲得原本由203個不同量表組成的8個新的不同問卷的得分(Yarkoni,2010a)。有研究者利用Twitter的API收集使用者的個人資料, 然后結合已有人格測量結果, 采用兩種機器學習算法進行訓練, 以期通過用戶個人資料信息預測他們在大五人格維度上的得分(Golbeck, Robles, Edmondson, & Turner, 2011)。
Quercia和其團隊分析了不同類型Twitter用戶的人格特征。他們發(fā)現(xiàn)不同類型用戶并非所謂相似“節(jié)點”, 而是既有共性又具個性的獨立個體。例如, 受歡迎的用戶和有影響力的用戶, 雖然都表現(xiàn)出外向性和情緒穩(wěn)定性的共同特征。但是受歡迎的用戶在開放性上的得分普遍更高, 更富于幻想; 而有影響力的用戶則表現(xiàn)得更具組織性,其消極的情緒表達也更為明顯(Quercia, Ellis,Capra, & Crowcroft, 2011; Quercia, Kosinski,Stillwell, & Crowcroft, 2011)。Gosling等人(2011)通過分析Facebook上的數(shù)據(jù), 探索人們在社交網(wǎng)站中表現(xiàn)出的人格特征、自我報告網(wǎng)絡行為和客觀描述性信息之間的相關。結果發(fā)現(xiàn), 外向性不僅能夠預測人們使用社交網(wǎng)站的頻率, 而且能夠預測其卷入程度和活動強度。對朋友列表和圖片帖子的分析表明, 外向性的人更傾向于在現(xiàn)實生活和虛擬生活之間建立聯(lián)系, 也就是說, 不同于大眾的猜測, 在線社交網(wǎng)站使用者不是通過虛擬網(wǎng)絡行為逃避或補充其現(xiàn)實生活中的人格, 而是將其線下的人格特征拓展至網(wǎng)絡世界中。
Yarkoni (2010b)指出, 以往人格特質(zhì)和個體網(wǎng)絡用詞特征間的相關研究, 受方法和技術局限,只探討過主要人格類型和整體詞語類別間的相關,對內(nèi)在具體關聯(lián)甚少涉獵。為此, 他搜集了694名Google博主的近80萬字文本數(shù)據(jù), 系統(tǒng)分析了人格、整體詞語類別和個體使用詞匯特征間的相關, 所得結果既驗證了以往現(xiàn)實情境中的相關研究結論, 又發(fā)現(xiàn)了許多新的涉及分類水平、單個詞語使用與人格特征的相關關系。
這些研究不但有助于驗證心理學相關理論、探索新發(fā)現(xiàn), 并且對推薦系統(tǒng)、市場營銷定位和網(wǎng)站界面設計等實際應用也有重要啟發(fā)。
不同于個體水平, 社會水平的心理研究側重于分析特定社會情境或社會結構條件下的心理現(xiàn)象, 強調(diào)的是社會互動的作用和影響。群體心理和行為并非群體內(nèi)所有個體心理和行為的簡單加和, 而是群體成員在社會互動情境中所形成的共有或典型的價值觀、態(tài)度和行為方式。社會心理的廣泛影響以及新的網(wǎng)絡社交環(huán)境與形態(tài)的出現(xiàn),吸引了眾多研究者涉足該領域。社會心理研究對樣本代表性和生態(tài)效度的長期高訴求, 也使得該領域?qū)π录夹g的應用具有天然敏感性。短短幾年里, 相關研究已涉及虛擬和現(xiàn)實網(wǎng)絡社會中的諸多現(xiàn)象。
隨著Web 2.0理念的深入人心, 人類社會迎來了一個嶄新的網(wǎng)絡社交時代。據(jù)2010年2月數(shù)據(jù)顯示, 全球最大的社交網(wǎng)站Facebook的注冊用戶已達4億多, 成為排在中國和印度之后的人口世界第三大社會(King, 2010)。虛擬網(wǎng)絡社會不但聚集了大量用戶, 而且也改變了人與人之間的互動模式。人們通過各種網(wǎng)絡工具與他人溝通交流,結成不同類型的關系, 如社交網(wǎng)絡中的好友關系、微博中的關注關系、購物網(wǎng)站或論壇中的共同興趣關系等。以往研究表明, 網(wǎng)絡中的社會關聯(lián)普遍存在局部聚集特性(程學旗, 沈華偉,2011)。大量具有局部聚集特性的關系數(shù)據(jù), 啟發(fā)著研究者們借助計算機和信息技術, 揭示特定虛擬網(wǎng)絡環(huán)境中所承載的社會心理與行為規(guī)律。
Szell, Lambiotte和Thurner (2010)基于數(shù)據(jù)挖掘和社會網(wǎng)絡分析技術, 對一個容納30多萬玩家的大型在線游戲中的多維社會網(wǎng)絡進行了整體性結構分析, 并根據(jù)個體間不同的交互關系, 抽取了6種不同的社會網(wǎng)絡, 探索了不同類型的網(wǎng)絡結構特性以及它們之間的關聯(lián)和重疊關系。結果發(fā)現(xiàn), 個體在不同的網(wǎng)絡中傾向于扮演不同的角色, 并驗證了用以解釋社會沖突和緊張關系的結構平衡理論。
另有研究者嘗試通過分析Twitter用戶的人際地理拓撲結構, 挖掘影響人們使用社交網(wǎng)站的動機。結果顯示, 人們使用Twitter主要是為了日常交流、搜尋和共享信息, 而具有相同需求的人更容易通過彼此聯(lián)系而結成社群(Java, Song, Finin,& Tseng, 2007)。從外部動機上看, 驅(qū)動人們使用社交網(wǎng)絡的并不是那些外顯的朋友和同事關系,而是潛藏其下的、零散的網(wǎng)絡社交關系(Huberman,Romero, & Wu, 2008)。另外, 研究者還發(fā)現(xiàn)用戶發(fā)帖特征和網(wǎng)絡歷史使用率, 與用戶背景信息相比, 能更好地預測該用戶所發(fā)信息的網(wǎng)絡擴散程度(Yang & Counts, 2010)。
這些現(xiàn)象雖然多發(fā)生于虛擬網(wǎng)絡世界中, 但對于檢驗已有的基于現(xiàn)實世界現(xiàn)象發(fā)展而來的社會心理理論的普適性, 以及對于理解現(xiàn)實和網(wǎng)絡交織的大時代背景下, 人們的社會生活新特征和心理行為規(guī)律等, 都具有重要意義。
除對虛擬情境中社交生活的關注以外, 研究者們同時嘗試揭示現(xiàn)實社會網(wǎng)絡結構對個體和群體行為的影響。Kossinets和Watts (2006)通過記錄一個學年的電子郵件標題信息, 考察了某大學43,533個學生、教師和職工組成的動態(tài)社會網(wǎng)絡。結果發(fā)現(xiàn), 該社會網(wǎng)絡的發(fā)展主要受網(wǎng)絡形態(tài)自身以及其所處組織結構的影響。當整體擾動消失后, 網(wǎng)絡特征的平均水平接近平衡, 而個體特征則并不穩(wěn)定, 該發(fā)現(xiàn)有助于推測網(wǎng)絡中個體間的交互作用。
為解答“幸福感能否在人際網(wǎng)絡中擴散?”以及“幸福感是否會在人際網(wǎng)絡中集群?”的問題,Fowler和Christakis (2008)開展了一項縱向研究,他們收集了4739個被試20年間的相關數(shù)據(jù), 涉及不同類型社會網(wǎng)絡和社會聯(lián)結。該研究結果顯示, 現(xiàn)實社會網(wǎng)絡中確實存在明顯的幸福集群和不幸福集群, 并且被許多幸福的人包圍著的個體,或是處于幸福集群中心的個體更可能變得幸福。縱向統(tǒng)計模型表明, 幸福集群的形成主要是幸福感傳播的結果, 而不是由于相似幸福感水平的人更傾向于聚集在一起所致。有研究者對2008年9月到2009年9月間發(fā)布在Twitter上的近4千萬條消息的分析發(fā)現(xiàn), 個體的平均幸福感體驗水平與其在網(wǎng)絡中的一個、兩個和三個聯(lián)結點外的用戶幸福感得分皆有顯著的正相關, 從而再次證明了網(wǎng)絡形態(tài)對幸福感集群的影響(Bliss, Kloumann,Harris, Danforth, & Dodds, 2012)。
在合作行為問題上, 人們通常認為合作行為會隨著個體間互動的增加而增加。依社會網(wǎng)絡視角而言, 這意味著高聚集的社會網(wǎng)絡中的合作行為要多于低聚集的社會網(wǎng)絡。為檢驗該假設, Suri和Watts (2011)開展了一系列基于真實社會網(wǎng)絡的實驗研究, 結果發(fā)現(xiàn)網(wǎng)絡結構形態(tài)對整體合作行為水平的平均貢獻率沒有顯著影響。合作行為只在某些情況下對網(wǎng)絡中的直接鄰居有正向感染力。另有研究發(fā)現(xiàn), 動態(tài)網(wǎng)絡中的合作行為存在著局部強化和全局擴散間的權衡關系:當網(wǎng)絡中建立聯(lián)系的代價大, 并且局部結構大規(guī)模消失時,更容易產(chǎn)生高水平的合作行為; 當網(wǎng)絡中建立聯(lián)系的代價小, 并且朋友的朋友之間的互動可能性高時, 建立高水平合作行為的可能性反而更小。對這一反直覺性結果的可能解釋是, 人們能夠單方面地切斷與他人的聯(lián)系, 而新的聯(lián)系只有在雙方都同意的情形下才能建立(Hanaki, Peterhansl,Dodds, & Watts, 2007)。
綜上所述, 目前計算機和信息科學技術的應用已經(jīng)對心理學研究的設計思想、數(shù)據(jù)資料的收集、組織和整合、結果的挖掘分析等幾乎各個環(huán)節(jié)帶來了發(fā)展, 已滲透到心理學的諸多分支研究領域中。在研究方法上, 心理信息學利用各種平臺和技術收集各類心理行為信息的能力, 以及對大規(guī)模多元真實數(shù)據(jù)的分析處理能力, 顯著提高了研究效率和研究結果的生態(tài)效度, 極大地擴展了研究視角和研究范疇。在研究內(nèi)容上, 雖然心理信息學立足于心理學科的全面發(fā)展, 但目前的研究多集中在探討基于海量數(shù)據(jù)的心理和行為變化規(guī)律, 多變量間相關性分析, 以及社會心理學所關注的人際互動和社會網(wǎng)絡結構對個體、群體心理的影響。隨著心理信息學的研究范疇向認知神經(jīng)甚或政治、經(jīng)濟等多層次相關現(xiàn)象領域的拓展, 其驗證和發(fā)展心理學理論假設的潛力將獲得更大程度的發(fā)揮。
但是, 作為一門新興的交叉學科, 學界對于心理信息學的認識和應用遠未成熟和普及, 還有許多值得注意和亟需解決的問題。
從技術層面上看, 目前對大規(guī)模數(shù)據(jù)的獲取、存儲、整理和分析的具體技術還有繼續(xù)發(fā)展和完善的空間。例如, 如何避免其它因素的干擾,提高手機等移動設備收集人們?nèi)粘P睦砗托袨閿?shù)據(jù)的質(zhì)量和效度(Miller, 2012); 如何改進情感分析技術, 使之能夠?qū)Σ煌Z境下的詞語屬性, 對整體文本所涉的評價對象的具體態(tài)度極性等, 進行更為智能的識別判斷(趙妍妍, 秦兵, 劉挺,2010); 如何整合分析網(wǎng)絡中的文本、圖片和聲音等異質(zhì)數(shù)據(jù)。但是, 這些技術問題的解決并不只是某一學科的份內(nèi)任務, 而是在信息科學技術和多學科理論視角的不斷撞擊中才能實現(xiàn)。
從研究范式上看, 雖然新技術的應用對于改善傳統(tǒng)心理學研究中的取樣缺乏代表性和研究手段的人為性等弊端提供了可能性。但目前, 該領域的許多研究仍存在著研究思路較為簡單, 研究設計缺乏嚴謹性等缺陷。少有研究通過嚴格的實驗控制設計進行因果推斷, 目前的絕大部分研究只限于相關關系探討。因此, 有必要在未來的研究中著重結合心理學業(yè)已成熟的實驗范式, 充分利用新技術和大規(guī)模生態(tài)數(shù)據(jù)揭示人類心理和行為的本質(zhì)規(guī)律。
從研究倫理上看, 新的方法和技術創(chuàng)新帶給人們的不僅僅是興奮, 還有對信息安全和個人隱私等問題的重新思考和擔憂。一方面, 很大一部分涉及個人隱私(特別是消費者隱私)的數(shù)據(jù)為某些私營公司或個別機構所有, 其對數(shù)據(jù)安全性的理解, 以及有關數(shù)據(jù)共享的協(xié)議并不統(tǒng)一。這可能在使用和分享私人信息時, 造成對個人或某些機構的威脅和傷害。另一方面, 許多原本看似匿名的信息, 如果綜合多渠道來源數(shù)據(jù)或利用特殊技術分析, 仍然會泄露很多個人的真實信息。 因此, 有必要建立一套自上而下的監(jiān)管機制, 使得從數(shù)據(jù)信息的集中收集、存儲, 到信息在商業(yè)和學術界的共享和使用, 都有健全有效的制度可依,從而保證個人信息安全, 并促進學術和應用研究的健康發(fā)展(Cioffi‐Revilla, 2010)。
從研究重心和人才培養(yǎng)上看, 一方面, 為了防止心理學陷入唯技術工具驅(qū)動的泥潭, 以至將心理學埋葬在紛繁復雜的數(shù)據(jù)之中(Karpf, 2012)。心理學研究者, 特別是有志從事心理信息學研究的學者, 應本著以問題為中心的原則, 重視新技術和傳統(tǒng)研究方法的結合, 在確定有意義的研究目標和內(nèi)容基礎之上, 充分利用新的數(shù)據(jù)收集和分析技術, 如從封閉化的軟件(如SPSS軟件)到改為使用開源軟件(如R軟件), 以及花費一定時間和精力研習機器學習等數(shù)據(jù)挖掘技術。對于已具備相關信息科學技術背景的心理學研究者, 則可以嘗試尋找能夠與信息技術相結合的基礎或商業(yè)研究項目。另一方面, 由于現(xiàn)有技術的高端性和復雜性, 使得傳統(tǒng)心理學研究者一時難以介入其間。以往的許多心理信息學研究都是計算機和信息科學領域?qū)<议_展的, 其專長于應用研究和具體算法的改進與創(chuàng)新, 對心理和行為理論的系統(tǒng)研究所涉不深。因此, 為使心理信息學乃至整個心理學獲得長足發(fā)展, 需要在心理學學科人才的培養(yǎng)計劃中, 增加對在校學生的相應學術訓練,重視培養(yǎng)同時擅長心理學理論分析和信息科學技術應用的綜合性人才, 并鼓勵跨領域研究成果的發(fā)表與分享。
陳浩, 樂國安, 李萌, 董穎紅. (2013). 計算社會科學: 社會科學與信息科學的共同機遇.西南大學學報(社會科學版), 39(3), 87–93.
陳惟昌, 王自強, 陳志華, 安榮姝. (2001). 神經(jīng)信息學的原理與展望.生物物理學報, 17(4), 613–620.
程學旗, 陳海強, 韓戰(zhàn)鋼. (2006). 社會信息的網(wǎng)絡化分析初探.中國計算機學會通訊, 2(2), 18–26.
程學旗, 沈華偉. (2011). 社會信息網(wǎng)絡中的社區(qū)分析.中國計算機學會通訊, 7(12), 12–20.
孟小峰, 余力. (2011). 用社會化方法計算社會.中國計算機學會通訊, 7(12), 25–30.
彭凱平, 劉鈺, 曹春梅, 張偉. (2011). 虛擬社會心理學:現(xiàn)實, 探索及意義.心理科學進展, 19(7), 933–943.
邱均平. (2002).市場經(jīng)濟信息學. 武漢: 武漢大學出版社.
王飛躍. (2006). 社會計算的意義及其展望.中國計算機學會通訊, 2(2), 28–35.
張陽德. (2009). 生物信息學(第二版). 北京: 科學出版社.
趙妍妍, 秦兵, 劉挺. (2010). 文本情感分析.軟件學報,21(8), 1834–1848.
鐘義信. (2002).信息科學原理(第三版). 北京: 北京郵電大學出版社.
Adamic, L., & Adar, E. (2005). How to search a social network.Social Networks, 27(3), 187–203.
Back, M. D., Küfner, A. C., & Egloff, B. (2010). The emotional timeline of September 11, 2001.Psychological Science, 21(10), 1417–1419.
Balog, K., & de Rijke, M. (2006, May).Decomposing bloggers’ moods: Towards a time series analysis of moods in the blogosphere. Paper presented at the WWW-2006 Workshop on the Weblogging Ecosystem, Edinburgh,Scotland.
Balota, D. A., Yap, M. J., Hutchison, K. A., & Cortese, M. J.(2013). Megastudies: What do millions (or so) of trials tell us about lexical processing? In J. S. Adelman (Ed.),Visual Word Recognition Volume 1: Models and methods,orthography and phonology(pp. 90–115). New York, NY:Psychology Press.
Biswal, B. B., Mennes, M., Zuo, X.-N., Gohel, S., Kelly, C.,Smith, S. M., …Milham, M. P. (2010). Toward discovery science of human brain function.Proceedings of the National Academy of Sciences of the United States of America, 107(10), 4734–4739.
Bliss, C. A., Kloumann, I. M., Harris, K. D., Danforth, C. M.,& Dodds, P. S. (2012). Twitter reciprocal reply networks exhibit assortativity with respect to happiness.Journal of Computational Science, 3, 388–397.
Bollen, J., Mao, H. N., & Zeng, X. J. (2011). Twitter mood predicts the stock market.Journal of Computational Science, 2, 1–8.
Bollen, J., Pepe, A., & Mao, H. (2011).Modeling public mood and emotion: Twitter sentiment and socio-economic phenomena.Paper presented at the Proceedings of the Fifth International AAAI Conference on Weblogs and Social Media, Barcelona, Spain.
Bradley, M. M., & Lang, P. J. (1999).Affective norms forEnglish words (ANEW): Instruction manual and affective ratings (Technical report C-1). Gainesville, FL: The Center for Research in Psychophysiology, University of Florida.
Brillouin. L. (1956).Science and information theory. New York: Academic Press.
Buhrmester, M., Kwang, T., & Gosling, S. D. (2011). Amazon's Mechanical Turk: A new source of inexpensive, yet highquality, data?Perspectives on Psychological Science, 6(1),3–5.
Campbell, A. T., Eisenman, S. B., Lane, N. D., Miluzzo, E.,Peterson, R. A., Lu, H., ... Gahng-Seop, A. (2008). The rise of people-centric sensing.Internet Computing, IEEE,12(4), 12–21.
Cioffi-Revilla, C. (2010). Computational social science.Wiley Interdisciplinary Reviews: Computational Statistics,2(3),259–271.
Cohn, M. A., Mehl, M. R., & Pennebaker, J. W. (2004).Linguistic markers of psychological change surrounding September 11, 2001.Psychological Science, 15(10), 687–693.
De Choudhury, M., Gamon, M., Counts, S., & Horvitz, E.(2013).Predicting depression via social media. Paper presented at Proceedings of the 7th International AAAI Conference on Weblogs and Social Media, Boston, MA.
Devitt, A., & Ahmad, K. (2007).Sentiment polarity identification in financial news: A cohesion-based approach.Paper presented at the Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics,page 984–991, Prague, Czech Republic.
Dickson, J., Drury, H., & Van Essen, D. C. (2001). ‘The surface management system’(SuMS) database: A surface–based database to aid cortical surface reconstruction,visualization and analysis.Philosophical Transactions of the Royal Society of London.Series B: Biological Sciences,356(1412), 1277–1292.
Dodds, P. S., & Danforth, C. M. (2010). Measuring the happiness of large-scale written expression: Songs, blogs,and presidents.Journal of Happiness Studies, 11(4), 441–456.
Dodds, P. S., Harris, K. D., Kloumann, I. M., Bliss, C. A., &Danforth, C. M. (2011). Temporal patterns of happiness and information in a global social network: Hedonometrics and Twitter.PloS One, 6(12), e26752.
Dodds, P. S., Muhamad, R., & Watts, D. J. (2003). An experimental study of search in global social networks.Science, 301(5634), 827–829.
Dufau, S., Du?abeitia, J. A., Moret-Tatay, C., McGonigal, A.,Peeters, D., Alario, F.-X.,… Grainger, J. (2011). Smart phone, smart science: How the use of smartphones can revolutionize research in cognitive science.PloS One, 6(9),e24974.
Eagle, N., Pentland, A. S., & Lazer, D. (2009). Inferring friendship network structure by using mobile phone data.Proceedings of the National Academy of Sciences of the United States of America, 106(36), 15274–15278.
Etkin, A., & Wager, T. D. (2007). Functional neuroimaging of anxiety: A meta-analysis of emotional processing in PTSD, social anxiety disorder, and specific phobia.The American Journal of Psychiatry, 164(10), 1476–1488.
Fowler, J. H., & Christakis, N. A. (2008). The dynamic spread of happiness in a large social network: Longitudinal analysis over 20 years in the Framingham Heart Study.British Medical Journal, 337, a2338, 1–9.
Golbeck, J., Robles, C., Edmondson, M., & Turner, K. (2011).Predicting personality from twitter. Paper presented at the Privacy, Security, Risk and Trust (Passat), 2011 IEEE third international conference on and 2011 IEEE third international conference on social computing (SocialCom), 1–23.
Golder, S. A., & Macy, M. W. (2011). Diurnal and seasonal mood vary with work, sleep, and daylength across diverse cultures.Science, 333(6051), 1878–1881.
Gosling, S. D., Augustine, A. A., Vazire, S., Holtzman, N., &Gaddis, S. (2011). Manifestations of personality in online social networks: Self-reported facebook-related behaviors and observable profile information.Cyberpsychology,Behavior, and Social Networking, 14(9), 483–488.
Gosling, S. D., Gaddis, S., & Vazire, S. (2008). First impressions based on the environments we create and inhabit. In N.Ambady & J. J. Skowronski (Eds.),First Impressions(pp.334–356). New York: Guilford.
Gosling, S. D., Vazire, S., Srivastava, S., & John, O. P.(2004). Should we trust web-based studies? A comparative analysis of six preconceptions about Internet questionnaires.American Psychologist, 59(2), 93–104.
Hanaki, N., Peterhansl, A., Dodds, P. S., & Watts, D. J.(2007). Cooperation in evolving social networks.Management Science, 53(7), 1036–1050.
Huberman, B. A., Romero, D. M., & Wu, F. (2008). Social networks that matter: Twitter under the microscope.First Monday, 14, 1–5.
Java, A., Song, X., Finin, T., & Tseng, B. (2007).Why we twitter: understanding microblogging usage and communities.Paper presented at the Proceedings of the 9th WebKDD and 1st SNA-KDD 2007 workshop on Web mining and social network analysis.
Karpf, D. (2012). Social science research methods in Internet time.Information, Communication and Society, 15(5), 639–661.
Killingsworth, M. A., & Gilbert, D. T. (2010). A wandering mind is an unhappy mind.Science, 330(6006), 932.
Kim, S. M., & Hovy, E. (2007).Crystal: Analyzing predictive opinions on the web. Paper presented at the Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning (EMNLP-CoNLL), 1056–1064.
King, I. (2010).Introduction to social computing. Paper presented at the Database Systems for Advanced Applications, 428–484.
Kober, H., Barrett, L. F., Joseph, J., Bliss-Moreau, E.,Lindquist, K., & Wager, T. D. (2008). Functional grouping and cortical–subcortical interactions in emotion: A meta-analysis of neuroimaging studies.Neuroimage, 42(2),998–1031.
Kossinets, G., & Watts, D. J. (2006). Empirical analysis of an evolving social network.Science, 311(5757), 88–90.
Kriegeskorte, N., Simmons, W. K., Bellgowan, P. S., & Baker,C. I. (2009). Circular analysis in systems neuroscience: The dangers of double dipping.Nature Neuroscience, 12(5),535–540.
Laird, A. R., Lancaster, J. J., & Fox, P. T. (2005). Brainmap.Neuroinformatics, 3(1), 65–77.
Lansdall-Welfare, T., Lampos, V., & Cristianini, N. (2012).Effects of the recession on public mood in the UK. Paper presented at the Proceedings of the 21st international conference companion on World Wide Web, 1221–1226.
Lazer, D., Pentland, A. S., Adamic, L., Aral, S., Barabasi, A.L., Brewer, D., … Alstyne, M. (2009). Computational social science.Science, 323(5915), 721–723.
Liberman, M. (2006). Sex-linked lexical budget. Retrieved October 26, 2013, from http://itre.cis.upenn.edu/~my/languagelog/ archives/003420html.
Mao, H., Counts, S., & Bollen, J. (2011).Computational economic and finance gauges: Polls, search, and twitter.Paper presented at the Meeting of the National Bureau of Economic Research-Behavioral Finance Meeting, Stanford,CT.
Mehl, M. R., Pennebaker, J. W., Crow, D. M., Dabbs, J., &Price, J. H. (2001). The Electronically Activated Recorder(EAR): A device for sampling naturalistic daily activities and conversations.Behavior Research Methods, Instruments,and Computers, 33(4), 517–523.
Mehl, M. R., Vazire, S., Ramírez-Esparza, N., Slatcher, R. B.,& Pennebaker, J. W. (2007). Are women really more talkative than men?Science, 317(5834), 82–82.
Mihalcea, R., & Liu, H. (2006).A corpus-based approach to finding happiness. Paper presented at the AAAI Spring Symposium: Computational Approaches to Analyzing Weblogs, 139–144.
Miller, G. (2012). The smartphone psychology manifesto.Perspectives on Psychological Science, 7(3), 221–237.
Mishne, G., & Glance, N. S. (2006).Predicting movie sales from blogger sentiment. Paper presented at the AAAI Spring Symposium: Computational Approaches to Analyzing Weblogs, 155–158.
O'Connor, B., Balasubramanyan, R., Routledge, B. R., &Smith, N. A. (2010).From tweets to polls: Linking text sentiment to public opinion time series. Paper presented at Proceedings of the International AAAI Conference on Weblogs and Social Media, Washington, DC.
Pereira, F., Mitchell, T., & Botvinick, M. (2009). Machine learning classifiers and fMRI: A tutorial overview.Neuroimage, 45(1), S199–S209.
Poldrack, R. A., Kittur, A., Kalar, D., Miller, E., Seppa, C.,Gil, Y., ... Bilder, R. M. (2011). The cognitive atlas: Toward a knowledge foundation for cognitive neuroscience.Frontiers in Neuroinformatics, 5, 17.
Quercia, D., Ellis, J., Capra, L., & Crowcroft, J. (2011).In the mood for being influential on Twitter. Paper Presented at the Privacy, Security, Risk and Trust (Passat), 2011 IEEE 3th International Conference on and 2011 IEEE 3rd International Conference on Social Computing (socialcom),307–314.
Quercia, D., Kosinski, M., Stillwell, D., & Crowcroft, J.(2011).Our Twitter profiles, our selves: Predicting personality with Twitter. Paper presented at the Privacy,security, risk and trust (passat), 2011 IEEE 3th International Conference on and 2011 IEEE 3rd International Conference on Social Computing (socialcom), 180–185.
Schuler, D. (1994). Social computing.Communications of the ACM, 37(1), 28–29.
Smith, E. R., & Conrey, F. R. (2007). Agent-based modeling:A new approach for theory building in social psychology.Personality and Social Psychology Review, 11(1), 87–104.
Strapparava, C., & Valitutti, A. (2004). Wordnet-Affect: An affective extension of WordNet. InProceedings of the 4th international conference on language resources and evaluation(pp. 1083–1086). Lisbon, Portugal.
Suri, S., & Watts, D. J. (2011). Cooperation and contagion in web-based, networked public goods experiments.PloS One, 6(3), e16836.
Szell, M., Lambiotte, R., & Thurner, S. (2010). Multirelational organization of large-scale social networks in an online world.Proceedings of the National Academy of Sciences of the United States of America, 107(31), 13636–13641.
Vazire, S., & Mehl, M. R. (2008). Knowing me, knowing you:The accuracy and unique predictive validity of self-ratings and other-ratings of daily behavior.Journal of Personality and Social Psychology, 95(5), 1202–1216.
Wager, T. D., Barrett, L. F., Bliss-Moreau, E., Lindquist, K.,Duncan, S., Kober, H., … Mize, J. (2008). The neuroimaging of emotion. In M. Lewis, J. M. Haviland-Jones, & L. F.Barrett (Eds.),Handbook of emotions(3rd ed., pp.249–271). New York: Guilford.
Wilson, T., Wiebe, J., & Hoffman, P. (2005, October).Recognizing contextual polarity in phrase-level sentiment analysis. In:Proceeding HLT '05 Proceedings of the Conference on Human Language Technology and Empirical Methods in Natural Language Processing(pp. 347–354).Vancouver, B. C., Canada.
Yang, J., & Counts, S. (2010). Predicting the speed, scale,and range of information diffusion in Twitter.ICWSM, 10,355–358.
Yarkoni, T. (2010a). The abbreviation of personality, or how to measure 200 personality scales with 200 items.Journal of Research in Personality, 44(2), 180–198.
Yarkoni, T. (2010b). Personality in 100,000 words: A largescale analysis of personality and word use among bloggers.Journal of Research in Personality, 44(3), 363–373.
Yarkoni, T. (2012). Psychoinformatics: New horizons at the interface of the psychological and computing sciences.Current Directions in Psychological Science, 21(6), 391–397.
Yarkoni, T., Poldrack, R. A., Nichols, T. E., Van Essen, D. C.,& Wager, T. D. (2011). Large-scale automated synthesis of human functional neuroimaging data.Nature Methods,8(8), 665–670.
Yarkoni, T., Poldrack, R. A., Van Essen, D. C., & Wager, T.D. (2010). Cognitive neuroscience 2.0: Building a cumulative science of human brain function.Trends in Cognitive Sciences, 14(11), 489–496.
Zhang, X., Fuehres, H., & Gloor, P. A. (2011). Predicting stock market indicators through Twitter “I hope it is not as bad as I fear”.Procedia-Social and Behavioral Sciences,26, 55–62.