[摘 要] 基于谷歌圖書語料庫2019年最新版本,從學(xué)科軌跡、學(xué)科研究主題以及學(xué)科研究方法三個方面追蹤德國教育社會學(xué)的學(xué)科發(fā)展。研究發(fā)現(xiàn):在學(xué)科軌跡上,德國教育社會學(xué)興起于20世紀(jì)20年代,30年代末期受第三帝國的影響而發(fā)展中斷,50年代開始逐漸復(fù)興,在70年代的經(jīng)濟(jì)危機(jī)中陷入低谷,在千禧年所宣布的第二場教育危機(jī)后復(fù)興;在學(xué)科研究主題上,德國教育社會學(xué)主要關(guān)注教育不平等的再生產(chǎn)、教育和社會不平等、教育和社會化、教學(xué)社會學(xué)、教師角色、學(xué)校職能,以及教育功能這幾個主題;在學(xué)科研究方法上,與定性研究方法相比,定量研究方法的影響不斷擴(kuò)大。本研究為教育學(xué)和教育社會學(xué)應(yīng)用谷歌圖書語料庫此類大數(shù)據(jù)工具梳理并分析學(xué)科發(fā)展提供了初步經(jīng)驗,是我國教育社會學(xué)領(lǐng)域應(yīng)用該方法探究學(xué)科發(fā)展史的首次嘗試。
[關(guān)鍵詞] 教育社會學(xué);學(xué)科發(fā)展;谷歌圖書語料庫;“文化組學(xué)”
[中圖分類號] G40-052 [文獻(xiàn)標(biāo)識碼] A [文章編號] 2096-2991(2025)01-0081-11
一、研究緣起
自社會科學(xué)誕生以來,學(xué)科發(fā)展史始終是社會科學(xué)各學(xué)科發(fā)展所繞不開的重要主題,眾多研究者分別就各自所屬學(xué)科的發(fā)展軌跡、學(xué)科的地位、學(xué)科研究轉(zhuǎn)向抑或是反思,以及學(xué)科的知識生產(chǎn)等主題對學(xué)科發(fā)展進(jìn)行了詮釋與探究,[1]雖在一定程度上梳理了學(xué)科的發(fā)展史,豐富了學(xué)科發(fā)展的研究,但亦存在一定的缺失。這種缺失主要在于社會科學(xué)界以往關(guān)于學(xué)科發(fā)展史的研究多以定性描述為主,研究資料、研究維度或關(guān)鍵詞的劃分與確定多基于研究者個人的認(rèn)知架構(gòu),即便研究者在研究過程中會盡可能保證客觀性和科學(xué)性,但鑒于其所接觸資料的數(shù)量和質(zhì)量的局限性,其研究結(jié)論的準(zhǔn)確性往往遭到質(zhì)疑。大數(shù)據(jù)方法為解決該問題提供了有效的方案,其以海量數(shù)字化資源為研究依據(jù),通過非介入性獲得的數(shù)據(jù)進(jìn)行分析,能夠有效解決當(dāng)前因缺乏數(shù)據(jù)支撐所導(dǎo)致的基于案例分析或內(nèi)容分析的社會科學(xué)學(xué)科發(fā)展史研究困境,為社會科學(xué)發(fā)展史研究提供了一種更具科學(xué)性和客觀性,且往往能夠產(chǎn)生新成果的研究路徑。
在眾多大數(shù)據(jù)研究工具中,興起于2011年的谷歌圖書語料庫在為研究提供大數(shù)據(jù)的同時亦為其提供了“長數(shù)據(jù)”(long data),能夠從更為宏觀的時空維度上進(jìn)行大跨度的觀察與分析,展示學(xué)科發(fā)展軌跡,探索學(xué)科發(fā)展中的現(xiàn)象和規(guī)律,對社會科學(xué)發(fā)展史的研究具有重要的意義和價值,遂成為評估學(xué)科文化影響力的重要技術(shù),受到定性研究者和定量研究者的關(guān)注。2011年《科學(xué)雜志》(Science)第331卷所發(fā)表的《使用百萬數(shù)字化書籍的文化定量分析》(Quantitative Analysis of Culture Using Millions of Digitized Books)是應(yīng)用谷歌圖書語料庫開展研究的最初嘗試。在此篇論文中,以讓-巴蒂斯特·米歇爾(Jean Baptiste Michel)為代表的來自哈佛大學(xué)、麻省理工學(xué)院、大英百科全書的學(xué)者與谷歌研究團(tuán)隊,基于谷歌圖書語料庫海量數(shù)字化資料,觀察關(guān)鍵詞的詞頻曲線變化,剖析了1500年到2000年間人類文化史的發(fā)展趨勢,開創(chuàng)了一個全新的研究領(lǐng)域——“文化組學(xué)”(culturomics),推進(jìn)了人文科學(xué)范式向“數(shù)字人文學(xué)”(Digital Humanities)的轉(zhuǎn)型。[2]此后,文化組學(xué)的研究視角與谷歌圖書語料庫這一研究工具逐漸滲透到語言學(xué)、文化心理學(xué)、傳播學(xué)、社會學(xué)等領(lǐng)域中。
我國學(xué)者陳云松以谷歌語料庫為基礎(chǔ),從學(xué)科軌跡、名家大師、理論流派、領(lǐng)域熱點以及分析方法這五個維度追蹤了19世紀(jì)中期以來社會學(xué)的百年發(fā)展歷程,并提出了“社會組學(xué)”的概念。[3]但由于谷歌語料庫與“文化組學(xué)”概念興起與提出的時間較晚,故此方面的研究仍有限,且已有研究多集中在傳播學(xué)、社會學(xué)、語言學(xué)等學(xué)科,教育學(xué)科中尚未有應(yīng)用此視角與工具的嘗試。除此之外,我國教育社會學(xué)學(xué)科發(fā)展的研究對象多集中在英國、美國、日本等國家,對德國教育社會學(xué)學(xué)科發(fā)展的研究仍處于一種缺位的狀態(tài)。為此,研究基于谷歌圖書語料庫海量數(shù)據(jù),試圖通過大數(shù)據(jù)的非介入數(shù)據(jù),觀察德國教育社會學(xué)詞頻的曲線變化,梳理德國教育社會學(xué)的學(xué)科發(fā)展。本研究是我國教育社會學(xué)領(lǐng)域應(yīng)用谷歌圖書語料庫這一大數(shù)據(jù)工具剖析教育社會學(xué)學(xué)科發(fā)展的首次嘗試。
二、研究方法
自2004年起,谷歌公司以哈佛、牛津等40多所頂級大學(xué)圖書館館藏書籍和出版社贈書為數(shù)據(jù)源,對1800年至2008年間出版的英、法、西、德等七種語言、1500多萬本書籍進(jìn)行了數(shù)字化整理,建立了第一版本的谷歌圖書語料庫(2008版),實現(xiàn)了總量達(dá)5000億的詞匯填充。[2]2012年,谷歌公司改進(jìn)其數(shù)字化技術(shù),在第一版本語料庫的基礎(chǔ)上增加意大利語圖書文本的收錄,谷歌圖書語料庫的詞匯量突破了8000億(2012版)。[4]2020年7月,谷歌語料庫更新至2019版本,實現(xiàn)了自1800年至2020年2月的千萬本書籍的數(shù)字化,其中質(zhì)量較好,可供全文檢索的約811萬冊,詞匯量約8613億個。谷歌采用“N-gram”算法模型為用戶提供數(shù)據(jù)文本的切分和斷句服務(wù),并提供繪制基于時間的數(shù)據(jù)圖表以及顯示查詢詞的使用頻率等服務(wù)。谷歌圖書語料庫的構(gòu)成見下頁表1。
本研究在借鑒“文化組學(xué)”研究方法的基礎(chǔ)上,以谷歌圖書語料庫(Google Books Corpus)2019版中德語語料庫所提供的數(shù)據(jù)為基礎(chǔ),通過觀察詞頻查看器所展示的相關(guān)關(guān)鍵詞詞頻曲線變化,剖析德國教育社會學(xué)學(xué)科發(fā)展。
(一)數(shù)據(jù)的代表性
在語料庫的選擇上,鑒于本研究主題為德國教育社會學(xué)學(xué)科的發(fā)展,故將代表性數(shù)據(jù)限定于谷歌圖書語料庫中的德語庫。以其中的657 991冊書籍和647億詞匯作為數(shù)據(jù)源。在時間的限定上,由于德國教育社會學(xué)的誕生以19世紀(jì)古斯塔夫·阿道夫·林德納(Gustav Adolph lindner)出版的著作——《作為一門科學(xué)的教育學(xué)概要》(Grundriss der Pidagogik als Wissenschaft)為標(biāo)志[5],且谷歌圖書語料庫中德國教育社會學(xué)19世紀(jì)之前的數(shù)據(jù)相對于19世紀(jì)之后要稀疏很多,故本文將研究的時間跨度限定在1800年至2019年。
(二)數(shù)據(jù)的針對性
研究以谷歌圖書語料庫的圖書作為文化載體的原因有二。其一,與學(xué)術(shù)期刊相比,書籍具有更大的文化影響力,且書籍的發(fā)展更為成熟和完善。其二,書籍主題和內(nèi)容的呈現(xiàn)往往能夠反映大眾的觀念和思維偏好。雖然與期刊相比,書籍存在一定的“滯后性”,但本研究旨在對學(xué)科史進(jìn)行探索,故書籍的沉淀性能使得研究排除“追新”“跟風(fēng)”“一時性”的內(nèi)容,因而能夠從更為科學(xué)的角度探尋德國教育社會學(xué)發(fā)展的規(guī)律和特性。
(三)檢索詞的設(shè)定
以2019版谷歌圖書語料庫德語庫為數(shù)據(jù)源,研究將檢索方向設(shè)定為三大方向,分別是學(xué)科軌跡、學(xué)科研究主題以及學(xué)科研究方法。在關(guān)鍵詞的選擇上,為能夠較為迅速和準(zhǔn)確地定位關(guān)鍵詞,研究主要參考《教育社會學(xué)手冊》(Handbuch Bildungs und Erziehungssoziologie)、《教育社會學(xué)教科書》(Lehrbuch der Bildungssoziologie)、《教育社會學(xué):基于實證研究的介紹》(Bildungssoziologie Eine Einführung anhand empirischer Studien)、《教育社會學(xué)簡介》(Einführung in die Soziologie der Bildung und Erziehung)等德國經(jīng)典教育社會學(xué)教科書,以及德國教育社會學(xué)重要組織——教育社會學(xué)學(xué)會所出版的叢書和教育社會學(xué)年會所應(yīng)用的語言。選擇教育社會學(xué)學(xué)會出版叢書和教育社會學(xué)年會所用語言的原因在于,該學(xué)會為德國教育社會學(xué)學(xué)科中最具有權(quán)威性的組織,自1959年起便一直致力于推進(jìn)德國教育社會學(xué)的學(xué)科發(fā)展。
在關(guān)鍵詞的設(shè)定上,基于對文獻(xiàn)的檢索發(fā)現(xiàn),德語世界中教育社會學(xué)學(xué)科相關(guān)關(guān)鍵詞存在著不同的表達(dá)形式。為了保證檢索的全面性和準(zhǔn)確性,研究嘗試對不同關(guān)鍵詞的多種表達(dá)形式進(jìn)行了全面的檢索,力求在最大程度上窮盡關(guān)鍵詞的德文表達(dá),觀察關(guān)鍵詞在“谷歌圖書詞頻查看器”(Google Books Ngram Viewer)中所顯示的詞頻曲線,選擇最具影響力的1—2個表達(dá)形式,分析其詞頻曲線。以“教育社會學(xué)”為例,自19世紀(jì)至今,德語世界中“教育社會學(xué)”一詞的表達(dá)形式主要有以下幾種:“Bildungssoziologie”“Soziologie der Erziehung”“Erziehungssoziologie”“Soziologie der Bildung”,將其輸入谷歌詞頻查看器,得出“教育社會學(xué)”四種不同表達(dá)式的詞頻曲線,參見下頁圖1。
由圖1可知,德語世界教育社會學(xué)的表達(dá)式最初為“Soziologie der Erziehung”,其后依次分別為“Erziehungssoziologie”“Soziologie der Bildung”以及“Bildungssoziologie”?;讷@取早期德國教育社會學(xué)學(xué)科發(fā)展相關(guān)信息的考量,研究選取“Soziologie der Erziehung”(其后在圖中的標(biāo)注為“教育社會學(xué)SE”)作為探索德國教育社會學(xué)學(xué)科發(fā)展的關(guān)鍵詞表達(dá)形式;基于關(guān)鍵詞總體出現(xiàn)頻率的考量,研究選擇“Bildungssoziologie”(其后在圖中的標(biāo)注為“教育社會學(xué)BS”)作為另一個剖析德國教育社會學(xué)學(xué)科發(fā)展的關(guān)鍵詞表達(dá)形式。
(四)操作步驟的具體化
以1800年至2019年為時間跨度,依據(jù)所需要的關(guān)鍵詞在https://books.google. com/ngram上進(jìn)行檢索,獲得詞頻比例圖。以詞頻比例圖為基礎(chǔ),輔以在BASE、SSOAR、SSRN等期刊庫中搜索的相關(guān)文獻(xiàn),得出與德國教育社會學(xué)發(fā)展相關(guān)的分析結(jié)果。此外,為了能夠使詞頻比例曲線呈現(xiàn)更好的視覺效果,研究對曲線進(jìn)行了2年平滑處理。以1980年為例,將其數(shù)值平滑為它與前后各兩年共5年的原始數(shù)值的平均值(1978、1979、1980、1981和1982年的均值)。
三、大數(shù)據(jù)中的教育社會學(xué)學(xué)科軌跡
研究首先對“教育社會學(xué)”這一學(xué)科關(guān)鍵詞在1900年至2019年德國書籍中出現(xiàn)的頻次展開分析。為進(jìn)一步厘清德國教育社會學(xué)的發(fā)展軌跡,研究將教育社會學(xué)置于與教育人類學(xué)(P?dagogische Anthropologie)、教育哲學(xué)(Philosophie der Bildung)、教育史(Geschichte der Bildung)、比較教育學(xué)(Vergleichende P?dagogik)、職業(yè)教育(Berufliche Bildung)等學(xué)科的對比中,獲得各個教育學(xué)科名稱的詞頻比例變化曲線。該曲線圖的橫坐標(biāo)為時間軸,縱坐標(biāo)為詞頻比例,德文教育學(xué)科名稱詞頻比例變化曲線參見圖2。
由圖2可知,在1820年至2019年的德國書籍中,教育史是最早出現(xiàn)詞頻的學(xué)科,且在20世紀(jì)60年代之前的教育學(xué)科中一直處于領(lǐng)先位置。 教育史、教育哲學(xué)、教育社會學(xué)、教育人類學(xué)受到二戰(zhàn)的影響,學(xué)科頹勢明顯,在二戰(zhàn)期間的發(fā)展處于近乎中斷的態(tài)勢。20世紀(jì)60年代末期,職業(yè)教育詞頻急劇增長,并于20世紀(jì)70年代中期至80年代達(dá)到頂峰。教育人類學(xué)、教育社會學(xué)、教育哲學(xué)、比較教育學(xué)、教育史在這一階段保持著上升的發(fā)展態(tài)勢,其詞頻曲線幾近達(dá)到了整個20世紀(jì)的高峰。其中,教育社會學(xué)一詞的出現(xiàn)頻率在0.000012%左右,高于教育哲學(xué)的0.000002%,教育人類學(xué)的0.000004%,比較教育學(xué)的0.000007%,教育史的0.000010%。20世紀(jì)90年代,這五門學(xué)科中除比較教育學(xué)外,其余四門學(xué)科的詞頻曲線均呈現(xiàn)緩慢下降的趨勢。
教育社會學(xué)這門學(xué)科興起于20世紀(jì)20年代。20世紀(jì)30年代末期,納粹黨的執(zhí)政使得教育社會學(xué)的發(fā)展在第三帝國(1933—1945)時期中斷了,在國家社會主義者的主導(dǎo)下,德國古典人文主義的教育理想無法實現(xiàn),而被迫轉(zhuǎn)為群體教育的概念,思想自由和獨立思考被意識形態(tài)所取代。[6]3320世紀(jì)50年代,德國教育社會學(xué)的詞頻曲線呈上升趨勢。原因在于教育對社會發(fā)展具有正面積極作用的公共認(rèn)識愈發(fā)清晰。20世紀(jì)50年代,德國社會學(xué)家赫爾穆特·謝爾斯基(Helmut Schelsky)為國家專家委員會——“德國教育和培訓(xùn)委員會”撰寫并提交的報告引發(fā)了公眾的廣泛關(guān)注。謝爾斯基對學(xué)校與社會之間的關(guān)系作出了重要的討論。一方面,高度贊揚了學(xué)校在德國社會發(fā)展中的作用,認(rèn)為學(xué)校是“個人的等級、地位和生活機(jī)會的主要的、決定性的、幾乎是唯一的社會機(jī)構(gòu)”;另一方面,他認(rèn)為對學(xué)校改革的研究必須要考慮社會條件、結(jié)構(gòu)和發(fā)展。[7]17-18盡管謝爾斯基對功能主義的分層理論頗有微詞,但他的研究在專業(yè)界引起了諸多理論和經(jīng)驗上的討論,有力地推動了德國教育社會學(xué)學(xué)科的制度化進(jìn)程[8]195-213。20世紀(jì)80年代初期,德國教育社會學(xué)的詞頻比例到達(dá)第一個高峰,約為0.00012%,其后其詞頻曲線便進(jìn)入了下降通道,直至90年代末期開始上升,并于2010年前后達(dá)到第二個高峰,即至2019年為止的詞頻曲線頂峰。
為進(jìn)一步探索學(xué)科發(fā)展規(guī)律,總結(jié)學(xué)科發(fā)展特點,研究以教育社會學(xué)和教育緊急情況(Bildungsnotstand)、斯普特尼克(Sputnik)1、就業(yè)危機(jī)(Besch?ftigungskrise)等德國重大事件或危機(jī)為關(guān)鍵詞進(jìn)行檢索,將教育社會學(xué)與教育緊急情況、斯普特尼克、就業(yè)危機(jī)等關(guān)鍵詞的詞頻變化曲線進(jìn)行比對,探究德國教育社會學(xué)學(xué)科發(fā)展規(guī)律,具體參見圖3和圖4。
基于對圖3和圖4的分析可以看出,德國教育社會學(xué)的詞頻曲線與斯普特尼克、教育緊急情況、就業(yè)危機(jī)等曲線相交叉與呼應(yīng)??梢哉f,德國教育社會學(xué)發(fā)展的“興衰”始終與德國社會的危機(jī)與改革密切相關(guān)。20世紀(jì)50年代,在“斯普特尼克”人造衛(wèi)星的發(fā)射和德國教育危機(jī)的雙重影響下,德國教育社會學(xué)有了明顯的發(fā)展。20世紀(jì)70年代中后期,主要受“歐佩克石油沖擊”(OPEC-?lschock)2的影響,德國面臨著突如其來的經(jīng)濟(jì)危機(jī)與經(jīng)濟(jì)衰退,社會就業(yè)崗位急劇減少,青年失業(yè)率不斷上升,這一發(fā)展最終導(dǎo)致了“寄希望于教育改革解決社會問題”的幻想破滅。[9]29-39因此,教育社會學(xué)的學(xué)科發(fā)展在此背景下步入了衰退期,其詞頻曲線呈現(xiàn)出下降的趨勢。21世紀(jì)初,隨著第一次國際學(xué)生評估項目(Program for International Student Assessment,簡稱PISA)研究結(jié)果的發(fā)表,以及聯(lián)邦家庭事務(wù)部家庭事務(wù)科學(xué)咨詢委員會第二次教育緊急情況的宣布,德國開始了一場關(guān)于教育機(jī)會和成功起源相關(guān)性質(zhì)的大討論,而教育社會學(xué)是社會科學(xué)中與該話題最具相關(guān)性的學(xué)科,在此背景下,教育社會學(xué)在德國逐漸得到復(fù)興。[10]7-21
四、大數(shù)據(jù)中的教育社會學(xué)學(xué)科研究主題
學(xué)科的研究主題并非一成不變,實際上,它總是會隨著時代的變化而不斷改變。梳理學(xué)科研究主題向來是研究學(xué)科發(fā)展歷程的重要組成部分,對本研究而言,谷歌圖書語料庫為掌握并解讀德國教育社會學(xué)學(xué)科研究主題的變遷提供了重要工具。研究首先對教育不平等的再生產(chǎn)(Reproduktion von Bildungsungleichheit)、教育和社會不平等(Bildung und sozialer Ungleichheit)、教育和社會化(Erziehung und Sozialisation)、教學(xué)社會學(xué)(Soziologie des Unterrichts)、教師角色(Rolle des Lehrers)、學(xué)校職能(Schulveranstaltungen),以及教育功能(Die Aufgabe der Bildung)等教育社會學(xué)中的重要研究主題進(jìn)行檢索。教育社會學(xué)學(xué)科研究主題詞頻變化曲線參見圖5和圖6。
依據(jù)圖5和圖6可以得出以下結(jié)論:第一,教師角色、學(xué)校職能以及教育功能是德國教育社會學(xué)首批研究主題。其中,教師角色的研究主題始于1850年前,在1975年前后達(dá)到高峰后開始下降,并于90年代中后期開始增長,至2008年達(dá)到另一個發(fā)展高峰。學(xué)校職能和教育功能的主題則分別興起于1889年和1869年,詞頻曲線呈現(xiàn)波動但整體上升的趨勢。第二,教師角色、教育職能以及教育和社會化這幾個主題在德國教育社會學(xué)學(xué)科發(fā)展中占據(jù)主導(dǎo)地位。從圖5可以看出,教師角色、教育職能以及教育和社會化這三個主題的詞頻遙遙領(lǐng)先。教育和社會化的詞頻曲線開始時間雖晚于教師角色和教育職能,但在教育社會學(xué)學(xué)科制度化的推動下,其詞頻曲線呈現(xiàn)強勁的發(fā)展態(tài)勢,于2008年左右達(dá)到詞頻曲線的高峰值,成為教育社會學(xué)領(lǐng)域的重要研究主題。第三,教育社會學(xué)中的重要主題——“不平等”,在德國教育社會學(xué)學(xué)科發(fā)展中則處于一種波動的狀態(tài),但其始終為德國教育社會學(xué)發(fā)展的核心議題之一。具體而言,在德國,教育與社會不平等的主題歷經(jīng)了20世紀(jì)50年代的緩慢興起,60年代至80年代初期的消沉,80年代中期較為短暫的興起與90年代的衰落后,在21世紀(jì)初期呈現(xiàn)強勁上升的發(fā)展趨勢,并于2010年前后到達(dá)發(fā)展的頂峰。同教育與社會不平等相比,教育不平等的再生產(chǎn)詞頻曲線開始的時間較晚,于20世紀(jì)與21世紀(jì)之交興起,主要受埃里克森(Erikson)和瓊森(Jonsson)影響,他們在國際比較的視野下研究瑞典教育不平等的變化。[11]1-63此后,該主題迅速超過教育和社會不平等,并于2010年左右達(dá)到詞頻曲線的峰值。
為進(jìn)一步探索“不平等”議題在德國教育社會學(xué)學(xué)科發(fā)展中的情況,研究選取地區(qū)不平等(Regionale Ungleichheiten)、性別不平等(Geschlechterungleichheiten)、種族不平等(Rassenungleichheit)、教育機(jī)會不平等(Ungleichheiten in den Bildungschancen)這四個代表性術(shù)語為關(guān)鍵詞,獲取詞頻比例變化曲線。具體參見圖7。
依據(jù)圖7可發(fā)現(xiàn),地區(qū)不平等、性別不平等、種族不平等、教育和機(jī)會不平等這四個關(guān)鍵詞的詞頻比例不盡相同。種族不平等是德國較早關(guān)注的議題,早在19世紀(jì)末期便出現(xiàn)了詞頻曲線,而地區(qū)不平等則在20世紀(jì)50年代開始受到關(guān)注,成為教育社會學(xué)學(xué)科中的重要議題,并分別于60年代和80年代末呈現(xiàn)一種上升的發(fā)展態(tài)勢。地區(qū)不平等的詞頻曲線的漲落與柏林墻的建立與倒塌相關(guān),受該社會背景的影響,東德、西德兩地教育擴(kuò)張的動態(tài)、制度背景和社會條件對個人教育的影響,以及柏林墻倒塌后德國內(nèi)部系統(tǒng)的比較成為學(xué)者們關(guān)注的議題。[12]89-144[13]隨著第二代勞工移民入學(xué)的影響,學(xué)界加強了對外國兒童和青年以及后來有移民背景的兒童和青年在德國教育系統(tǒng)中的劣勢的研究。[14][15]107-142[16]289性別不平等的詞頻則在20世紀(jì)80年代中期開始直至2010年間始終保持一種強勁的發(fā)展態(tài)勢,并迅速拉開了與種族不平等、地區(qū)不平等以及教育和機(jī)會不平等之間的距離。
教育和機(jī)會不平等的詞頻曲線與德國社會學(xué)家們在社會辯論和改革教育政策中所做出的努力相關(guān)聯(lián)。1964年,古典語言學(xué)家喬治·皮克特(Georg Picht)在《基督與世界》周報上發(fā)表了一系列有政治靈感但無社會學(xué)依據(jù)的文章,認(rèn)為德國的教育體系是落后的[17]15-18,并在議會、部委和大眾媒體中引起了強烈的反響。1965年,社會學(xué)家拉爾夫·達(dá)倫多夫(Ralf Dahrendorf)在《時代》周刊上發(fā)表了一系列題為《教育是公民權(quán)利——積極教育政策的呼吁》的文章,對皮克特宣言中的災(zāi)難情景和主要經(jīng)濟(jì)模式提出了警告。在此過程中,他提請注意德國教育機(jī)會的明顯不平等,并回顧了憲法保障的公民基本教育權(quán)利以及其中所包含的機(jī)會平等。[18]118-146從而使教育機(jī)會不平等這一社會問題被提上了德國教育社會學(xué)研究的議程,教育機(jī)會不平等的詞頻曲線在該階段也由此呈現(xiàn)不斷上升的趨勢。
五、大數(shù)據(jù)中的教育社會學(xué)學(xué)科研究方法
作為教育科學(xué)研究科學(xué)性的重要表征,研究方法是決定研究質(zhì)量的關(guān)鍵要素。為此,通過對研究方法關(guān)鍵詞的詞頻分析,本研究試圖詮釋德國教育社會學(xué)學(xué)科研究方法的變遷。德國社會科學(xué)學(xué)科定性研究方法與定量研究方法詞頻歷史曲線參見圖8。
從圖8中可以發(fā)現(xiàn)德國教育社會學(xué)學(xué)科研究方法的兩個特點:第一,定量研究方法和定性研究方法的詞頻在1850年至2012年間總體上處于一種持續(xù)增長的發(fā)展態(tài)勢。1930年至1950年間受第三帝國的影響,詞頻比例曲線呈現(xiàn)下降的狀態(tài)。第二,在谷歌圖書語料庫中,定性研究和定量研究存在一定的差別。具體而言,盡管自2000年起,定性研究方法的詞頻急劇增長,并在2009年前后達(dá)到頂峰并超過定量研究方法的詞頻曲線??傮w而言,相較于定性研究方法,定量研究方法在德國的使用頻率更高。其主要原因有以下三個:首先,德國對數(shù)據(jù)的重視。自19世紀(jì)以來,德國創(chuàng)建了馬克斯·普朗克社會人類學(xué)研究所、高等教育研究所等一系列研究機(jī)構(gòu),收集了諸如PISA數(shù)據(jù)、社會經(jīng)濟(jì)小組(Sozio-oekonomischen Panels,簡稱SOEP)數(shù)據(jù)、高等教育研究所(漢諾威)(HIS-Instituts für Hochschulforschung )針對高等教育部門的小組研究數(shù)據(jù),以及微觀普查或德國聯(lián)邦統(tǒng)計局的數(shù)據(jù)集等新數(shù)據(jù)研究中心的各類數(shù)據(jù)。其次,定性研究方法在教學(xué)中的偏頗性。在德國教育社會學(xué)的教學(xué)體系中,采用定量研究方法的教學(xué)更受重視。[19]最后,定量研究方法種類的豐富與快速發(fā)展。與定性研究方法相比,定量研究方法的創(chuàng)新和更新速度較快,出現(xiàn)了一系列諸如多層次模型、分解程序、模擬程序和處理選擇性和非觀察性異質(zhì)性的方法等定量研究方法。[20]17-44
在具體的操作過程中,本研究檢索了德國教育社會學(xué)較為常用的幾種研究方法,并對呈現(xiàn)出詞頻曲線的幾種研究方法進(jìn)行了對比。在定量研究方法上,檢索并最終獲得詞頻曲線的研究方法為:層次模型(Mehrebenen-Modelle)、分解程序(Dekompositionsverfahren)、模擬程序(Simulationsverfahren);在定性研究方法上,檢索并最終獲得詞頻曲線的研究方法為:話語分析(Diskursanalytisch)、傳記性訪談(Biografische Interviews)、敘述分析(Narrative Analyse)、內(nèi)容分析(Inhaltliche Analyse)。定量研究方法詞頻歷史曲線與定性研究方法詞頻歷史曲線分別參見圖9和圖10。
從圖9可以發(fā)現(xiàn),在定量研究方法中,模擬程序是影響力最大的,分解程序次之,層次模型使用頻率相對較低。以埃里克森的研究為例,其團(tuán)隊以英格蘭和威爾士16歲兒童為研究對象,應(yīng)用多變量分解程序探究了其升讀高等教育中凸顯的階級差異。發(fā)現(xiàn)升讀高等教育的階級差異既來自不同階級背景兒童學(xué)習(xí)成績水平的主要影響,亦來自這些兒童在給定成績水平下所做的教育選擇的次要影響。[21]在定性研究方法中,話語分析占主導(dǎo)地位,且其增長的速度較快。傳記性訪談、敘述分析以及內(nèi)容分析自2000年左右呈現(xiàn)出一種上升的發(fā)展態(tài)勢,但這種態(tài)勢在2010年之后逐漸式微。
六、結(jié) 語
本研究嘗試以當(dāng)前最為成熟且在全球具有最大規(guī)模的谷歌圖書語料庫作為分析工具,通過基于大數(shù)據(jù)的內(nèi)容分析,采用語義學(xué)中的詞頻分析法探究德國教育社會學(xué)的學(xué)科發(fā)展,初步梳理了德國教育社會學(xué)的發(fā)展軌跡。盡管研究通過技術(shù)手段提高了客觀性和科學(xué)性,但仍然存在以下不足:首先,研究檢索的數(shù)據(jù)源僅為圖書,數(shù)據(jù)規(guī)模的全面性存在一定缺失。其次,限于篇幅和時間,研究僅以谷歌圖書語料庫中的德語語料庫作為檢索庫,僅梳理了德國教育社會學(xué)領(lǐng)域較為重要且具有代表性的學(xué)科研究主題和研究方法,未能窮盡德國教育社會學(xué)的學(xué)科研究主題和研究方法。再次,谷歌圖書語料庫采用的“N-gram”算法模型雖能實現(xiàn)對文本的切分和斷句,但無法實現(xiàn)對具有較長表達(dá)形式的關(guān)鍵詞組的檢索。盡管研究嘗試通過提升篩選關(guān)鍵詞的全面性和準(zhǔn)確性等技術(shù)手段科學(xué)控制檢索過程,但檢索的精度仍有待提高。最后,對德國教育社會學(xué)發(fā)展的剖析與闡釋是基于谷歌圖書語料庫的詞頻曲線,雖伴隨著相關(guān)文獻(xiàn)證據(jù)的輔證,但證據(jù)的充分性仍有待加強。
縱然大數(shù)據(jù)的研究方法和研究工具仍存在一定缺陷,但其存在和發(fā)展仍具有重大的意義和價值。此種價值不在于通過剖析關(guān)鍵詞的頻率測查學(xué)科以及學(xué)科的理論、主題、方法等內(nèi)容的知名度和影響力,當(dāng)然也無法僅憑一篇應(yīng)用該方法的短文去概括學(xué)科發(fā)展史。其價值更多地體現(xiàn)在利用大數(shù)據(jù)工具對詞匯基因的序列進(jìn)行分析,建立一種能突破人類學(xué)習(xí)能力瓶頸且具有客觀性、科學(xué)性、完善性與開放性的“組學(xué)”,以便從更為宏觀的角度探索社會科學(xué)的發(fā)展規(guī)律,為學(xué)科發(fā)展史的研究提供一種新的、方法上的研究思路和路徑,解決以往僅依靠學(xué)者個人閱讀的“微觀層面”的學(xué)科發(fā)展史研究困境。除此之外,研究呼吁進(jìn)一步細(xì)化讓-巴蒂斯特·米歇爾所提出的“文化組學(xué)”和陳云松所提出的“社會組學(xué)”的概念和類別,建立教育學(xué)界的“教育組學(xué)”,或者更為細(xì)化的“教育社會學(xué)組學(xué)”。
[參考文獻(xiàn)]
[1]劉寶存, 彭嬋娟. 知識生產(chǎn)模式轉(zhuǎn)型與比較教育學(xué)科發(fā)展路徑變遷[J]. 外國教育研究, 2022(3): 3-16.
[2]MICHEL J B, YUAN K S,AIDEN A,et al. Quantitative Analysis of Culture Using Millions of Digitized Books[J]. Science. 2011(6014):176-182.
[3]陳云松. 大數(shù)據(jù)中的百年社會學(xué):基于百萬書籍的文化影響力研究[J]. 社會學(xué)研究, 2015(1): 23-48.
[4]LIN Y, MICHEL J, LIEBERMAN E A,et al. Syntactic Annotations for the Google Books NGram Corpus[C]// Association for Computational Linguistics.Jeju Island: Proceedings of the ACL 2012 System Demonstrations,2012.
[5]GECK L H A. Some Recent German Publications Concerning Problems of Educational Sociology[J]. The Journal of Educational Sociology,1929(10):585-592.
[6]MARTINA L. Einführung in die Soziologie der Bildung und Erziehung[M]. Opladen:Verlag Barbara Budrich, 2003.
[7]HELMUT S. Schule und Erziehung in der industriellen Gesellschaft[M]. Würzburg: Werkbund Verlag, 1957.
[8]SOLGA H,BECKER R. Soziologische Bildungsforschung [M]. Wiesbaden: Springer VS,2012.
[9]SOMMERKOR N. Soziologie der Bildung und Erziehung [M]// Korte, Hermann und Sch?fers, Bernhard. Einführung in Spezielle Soziologien. Opladen:Leske und Budrich,1993.
[10]RUGER H H, RABE-KLEBERG U, KRAMER R T. Bildungsungleichheiten revisited? - eine Einleitung [M]// Bildungsungleichheiten revisited. Bildung und soziale Ungleichheit vom Kindergarten bis zur Hochschule. Wiesbaden:VS Verlag,2010.
[11]ROBERT E, JONSSON J O. Explaining class inequality in education: The Swedish test case [M]// Erikson, Robert und Jonsson, Jan O. Can Education Be Equalized?. Boulder: Westview Press, 1996.
[12]JOHANNES H, MAYER K U, TRAPPE H. Staatliche Lenkung und individuelle Karrierechancen: Bildungs- und Berufsverl?ufe [M]// Huinink, Johannes and Mayer, Karl Ulrich. Kollektiv und Eigensinn. Kollektiv und Eigensinn.Berlin: Akademie-Verlag, 1995.
[13]HEIKE S. Lebensverl?ufe und historischer Wandel in der ehemaligen DDR[J]. ZA-Information, 1996(38): 28-38.
[14]RICHARD A, HANDL J, WALTER M. Ethnische Ungleichheit im deutschen Bildungssystem[J]. K?lner Zeitschrift für Soziologie und Sozialpsychologie, 1994(46): 209-238.
[15]NAUCK B. Bildungsverhalten in Migrantenfamilien [M]// Büchner, Peter, Matthias Grundmann, Johannes Huinink, Lothar Krappmann, Bernhard Nauck, Dagmar Meyer und Sabine Rothe. Kindliche Lebenswelten, Bildung und innerfamiliale Beziehungen. München: Verlag Deutsches Jugendinstitut (DJI), 1994.
[16]NAUCK B, HEIKE D. Bildungsbeteiligung von Kindern aus Familien ausl?ndischer Herkunft [M]// Schmidt, Folker. Methodische Probleme der empirischen Erziehungswissenschaft. Hohengehren: Schneider, 1997.
[17]PICHT G. Die deutsche Bildungskatastrophe[M]. München: Deutscher Taschenbuch Verlag, 1964.
[18]BEATE K. Bildungsexpansion und soziale Ungleichheit in der Bundesrepublik Deutschland [M]// Bolder, Axel, Walter R. Heinz und Klaus Rodax. Die Wiederentdeckung der Ungleichheit. Opladen: Leske+Budrich, 1996.
[19]HOPF C, WALTER M. Zur Entwicklung der empirischen Sozialforschung in der Bundesrepublik Deutschland[J]. ZUMA-Nachrichten. 1994(45):28-53.
[20]SOLGA H,BECKER R. Soziologische Bildungsforschung [M]. Wiesbaden: Springer VS, 2012.
[21]ERIKSON R,GOLDTHORPE J H, JACKSON M, YAISH M. On class differentials in educational attainment[J]. Proceedings of the National Academy of Sciences of the United States of America,2005(27), 9730-9733.
【責(zé)任編輯 王凌宇】
On the Development of the Discipline of Sociology of Education in Germany based on the Google Books Corpus
SHI Yan,HAN Rui
(Faculty of Education,Northeast Normal University,Changchun,Jilin 130024,China)
[Abstract] Based on the latest version of the Google Books Corpus 2019, we traced the development of the German sociology of education in terms of subject trajectories, research themes and research methods. The study found that: in terms of academic trajectory, German sociology of education emerged between the 1920s and the 1930s, was interrupted by the influence of the Third Reich in the late 1930s, gradually revived around the 1950s, hit a low point during the economic crisis in the 1970s, and revived after the second educational crisis declared in the millennium. In terms of research themes, German sociology of education focused on the reproduction of educational inequalities, education and social inequalities, education and socialization, the sociology of teaching, the role of the teacher, the function of the school, and the function of education; in terms of research methods, the influence of quantitative research methods continued to expand compared to qualitative research methods. The study provides initial experience in applying the Google Books corpus,a big data tool, to sort out and analyze the development of the discipline in pedagogy and sociology of education, and is the first attempt to apply the method to explore the history of the discipline in the field of pedagogy and sociology of education in China.
[Key words] Sociology of Education; disciplinary development; Google books corpus; “culturomics”