• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)幫你進(jìn)一步認(rèn)識(shí)蘇軾

      2018-07-06 09:44官天澤徐子昂王儲(chǔ)玉馬梓銘葛宇軒
      第二課堂(課外活動(dòng)版) 2018年1期
      關(guān)鍵詞:編年高頻詞東坡

      官天澤 徐子昂 王儲(chǔ)玉 馬梓銘 葛宇軒

      編者按

      不久前,北京清華附小六年級(jí)的學(xué)生成了“網(wǎng)紅”。原因是幾位小學(xué)生合作寫(xiě)了一篇論文《大數(shù)據(jù)幫你進(jìn)一步認(rèn)識(shí)蘇軾》,利用大數(shù)據(jù)搜索,整理了蘇軾詩(shī)詞的高頻用詞,還展示了研究過(guò)程中克服文獻(xiàn)查找困難的解決辦法。很多人在驚嘆的同時(shí),也很困惑,為什么清華附小的學(xué)生這么牛?下面,我們選登《大數(shù)據(jù)幫你進(jìn)一步認(rèn)識(shí)蘇軾》,看看這些小學(xué)生是如何開(kāi)展研究性學(xué)習(xí)的。

      前言:我們是清華附小2012級(jí)4班的學(xué)生,2017年正逢蘇軾誕辰980周年,學(xué)校開(kāi)展了一系列致敬蘇軾的活動(dòng)。我們利用課前時(shí)間演講了解蘇軾生平,在晨讀時(shí)間吟誦蘇軾的詩(shī)詞,在暮省時(shí)間進(jìn)行游戲飛花令,臨摹蘇軾的書(shū)法和畫(huà)作,跟著康震老師一起品讀蘇軾。通過(guò)老師的推薦,觀看了紀(jì)錄片《蘇東坡》。

      隨著對(duì)蘇軾的了解越來(lái)越多,我們心中也產(chǎn)生了很多疑問(wèn)。利用假期時(shí)間,我們進(jìn)行了以蘇軾為主題的小課題研究。同學(xué)們自愿組成小組,確定研究課題,進(jìn)行小組討論和分工。為了方便交流、討論,我們組建了微信群和QQ群,大家在群里熱烈討論,特別是對(duì)于貢獻(xiàn)了智慧的同學(xué),組長(zhǎng)還給他發(fā)紅包。各小組同學(xué)將老師也拉入群中,大家一遇到疑難問(wèn)題就隨時(shí)向老師請(qǐng)教,老師成了同學(xué)們的“貼身軍師”,思維在碰撞中產(chǎn)生了更多火花。

      本次班級(jí)共完成課題研究報(bào)告23 份,研究主題各有不同:《大數(shù)據(jù)幫你進(jìn)一步認(rèn)識(shí)蘇軾》《今人對(duì)蘇軾的評(píng)價(jià)和蘇軾的影響力》《行走的蘇軾》《唯美景與美食不可辜負(fù)》《蘇軾的朋友圈》《蘇軾的心情曲線》《蘇軾的旅游品牌價(jià)值》《蘇軾VS李白》等等。

      上學(xué)期我們用大數(shù)據(jù)的方法寫(xiě)了一首《如夢(mèng)令》,這次我們小組研究蘇軾,我們想再用大數(shù)據(jù)的方法對(duì)蘇軾的詩(shī)詞進(jìn)行進(jìn)一步的分析。

      一、數(shù)據(jù)證明蘇軾是名高產(chǎn)作家

      首先我和徐子昂把蘇軾的3458首詩(shī)詞都找了出來(lái),大概有25萬(wàn)字。我們發(fā)現(xiàn)唐宋詩(shī)詞由9552位作者創(chuàng)作了276545首詩(shī)詞,平均下來(lái)每位作者要完成28~29首詩(shī)詞的創(chuàng)作,而蘇軾一個(gè)人就相當(dāng)于120位詩(shī)人,占了整個(gè)唐宋詩(shī)詞量的1.25%。蘇軾一共活了66歲(其實(shí)按照今天的計(jì)算方法來(lái)算,他只活了64年,古代出生的時(shí)候就算1歲,過(guò)了年又算1歲,所以在他出生半個(gè)月的時(shí)候就算2歲了),我們按照他的實(shí)際年齡來(lái)計(jì)算,他平均每年需要寫(xiě)54首詩(shī)詞,這樣下來(lái)平均每周至少寫(xiě)一首詩(shī)詞。這些僅僅是他的詩(shī)詞,不包括散文、札記、書(shū)信等。

      二、通過(guò)數(shù)據(jù)看蘇軾的人生經(jīng)歷

      1. 我們的方法

      我和爸爸通過(guò)電腦程序把蘇軾的3458首詩(shī)詞進(jìn)行了分詞研究,找出了這些詩(shī)詞中的高頻詞。

      排名前50的高頻詞表如下:

      由于漢語(yǔ)里有很多一個(gè)字的詞,這些詞也需要考慮,于是我們把所有的高頻字也做了分析。

      排名前50的高頻字表如下:

      2. 我們的問(wèn)題

      這些高頻詞和字分析出來(lái)之后,我們產(chǎn)生了很多疑惑。比如:

      “歸來(lái)”這個(gè)詞竟然出現(xiàn)了157次,是蘇軾詩(shī)詞里面用得最多的一個(gè)詞(注:第一次分析高頻詞時(shí),還沒(méi)有搜索“子由”,因此排在第一位的詞匯是“歸來(lái)”),“歸去”出現(xiàn)92次,蘇軾是在到處云游嗎?

      蘇軾經(jīng)常提到“故人”,出現(xiàn)了135次,還有“道人”60次,這些人都指的誰(shuí)呢?他是不是有很多和尚、道士朋友呀?

      蘇軾詩(shī)詞里面提到“西湖”92次,“江南”84次,這些詩(shī)詞是否都是他在杭州當(dāng)官時(shí)候的作品呢?這些詩(shī)句描述的場(chǎng)景是不是與他的這段人生經(jīng)歷有關(guān)?

      高頻單字中,“山”2041次,“我”1732次,“風(fēng)”1447次,“云”1260次,“月”1059次,“水”1020次,“花”1006次,“酒”826次,高頻詞里面“明月”出現(xiàn)100次,“飲酒”出現(xiàn)57次,這些詩(shī)句描述的都是什么場(chǎng)景?蘇軾是不是因?yàn)楣賵?chǎng)上不得志而寄情于山、水、花、酒之間?

      “使君”出現(xiàn)了152次,而使君是誰(shuí)?“東坡”出現(xiàn)了108次,“東坡”是指地方還是蘇軾自己呢?為什么提到這么多次“東坡”?他的人生和“東坡”的關(guān)系是什么?帶著這些問(wèn)題,我們小組開(kāi)始了研究。

      3. 研究的過(guò)程

      研究的過(guò)程就像一次考古,很艱苦也很有意思,因?yàn)樵谶@個(gè)過(guò)程中我們遇到了很多困難,也想出了不少辦法。隨著研究的深入,我們的研究范圍甚至高頻詞表都進(jìn)行了調(diào)整和更新。但通過(guò)這個(gè)過(guò)程,我們也收獲了很多,于是我們把整個(gè)研究過(guò)程都記錄了下來(lái)。

      (1)小組分工和確定主題

      根據(jù)分析數(shù)據(jù)產(chǎn)生的問(wèn)題,我們小組成員進(jìn)行了分工,其中:

      徐子昂負(fù)責(zé)研究蘇軾三次被貶的經(jīng)歷,以及包含“歸來(lái)”“歸去”的詩(shī)詞。

      馬梓銘研究蘇軾在西湖及江南的經(jīng)歷,以及包含“西湖”“江南”的詩(shī)詞。

      王儲(chǔ)玉負(fù)責(zé)研究蘇軾在“明月”“飲酒”方面的愛(ài)好,以及所有包含“明月”“飲酒”的詩(shī)詞。

      官天澤負(fù)責(zé)研究蘇軾與“使君”“東坡”的關(guān)系,以及所有包含“使君”“東坡”的詩(shī)詞。

      葛宇軒負(fù)責(zé)研究蘇軾與“故人”“道人”的關(guān)系,以及所有包含“故人”“道人”的詩(shī)詞。

      大家接受了任務(wù)之后,分別查找資料,總結(jié)分析后形成了各自的研究成果。其實(shí)上面這五個(gè)研究方向都很有趣,但是受時(shí)間和資料所限,我們經(jīng)過(guò)討論,最終決定把這次課題報(bào)告聚焦到蘇軾三次被貶的經(jīng)歷和含有“歸來(lái)”詩(shī)詞之間的關(guān)系上來(lái),其他的研究方向等以后有時(shí)間再一一攻克吧。

      我們猜想“歸來(lái)”可能反映了蘇軾在被貶后,渴望回到朝廷、繼續(xù)為官報(bào)效國(guó)家的一種心情。

      我們先在蘇軾詩(shī)詞全集中把所有包含“歸來(lái)”的詩(shī)詞都找了出來(lái),為了分析這些詩(shī)詞和蘇軾生平的對(duì)應(yīng)關(guān)系,我們需要知道蘇軾創(chuàng)作這些詩(shī)詞的時(shí)間和地點(diǎn),然后對(duì)比看看是不是他在被貶后寫(xiě)的。

      (2)基礎(chǔ)資料查找

      我們上網(wǎng)搜索各種版本的蘇軾詩(shī)詞全集,但是發(fā)現(xiàn)要把每一首詩(shī)詞對(duì)應(yīng)的年代和地點(diǎn)都找出來(lái),卻是一件艱苦而且巨大的工程,因?yàn)闆](méi)有一個(gè)網(wǎng)站能完成這樣的任務(wù)。

      后來(lái)我們發(fā)現(xiàn)了兩本工具書(shū),一個(gè)是《東坡先生編年詩(shī)》[50卷,清乾隆二十六年(1761年)海寧查氏香雨齋刻本],另一本是《蘇軾詞編年校注》(中華書(shū)局“十國(guó)古典文學(xué)基本叢書(shū)”,鄒同慶、王宗堂著),這兩本書(shū)對(duì)蘇軾的詩(shī)詞按照年代進(jìn)行了編排,可以實(shí)現(xiàn)我們的想法。

      研究蘇軾的詞,可以查找《蘇軾詞編年校注》。這書(shū)有編年的詞292首,沒(méi)有編年的31首,殘句11則。我們?cè)诰W(wǎng)上找到了這本書(shū)的電子版,可以快速檢索出來(lái)每一首詞的年代。

      研究蘇軾的詩(shī),可以查找《東坡先生編年詩(shī)》。不過(guò)這本書(shū)只能找到哈佛線上圖書(shū)館的竹紙線裝的掃描書(shū),一共16冊(cè)50卷(http://nrs.harvard.edu/urn-3:FHCL:15633072)。清朝人編著的都是繁體字,對(duì)我們來(lái)說(shuō)簡(jiǎn)直是天書(shū),根本無(wú)法進(jìn)行檢索(見(jiàn)下圖)。

      我們幾乎放棄了之前的想法,但是在爸爸的幫助下我們找到了另外一個(gè)網(wǎng)站——http://ctext.org/library.pl?if=gb&res=94092&remap=gb,這個(gè)網(wǎng)站把這本竹紙線裝的書(shū)進(jìn)行了光學(xué)字符識(shí)別掃描,這樣,大多數(shù)的詩(shī)就可以用搜索的方法查到了(見(jiàn)下圖)。

      我們是從編年詩(shī)入手的,工具書(shū)雖然找到了,但還有很多工作需要完成:

      第一,由于這本古籍書(shū)是豎排排版,文字的識(shí)別率不是很精確,很多工作需要人工再次確認(rèn)。

      第二,我們需要手工查詢每一卷詩(shī)創(chuàng)作的年代和地點(diǎn)。

      我們開(kāi)始分工,把50卷書(shū)中的每一卷書(shū)的年代和地點(diǎn)都找了出來(lái),做出了一張對(duì)應(yīng)表格,見(jiàn)下表(刊發(fā)時(shí)有刪節(jié)):

      我們興奮地以為這下就可以大功告成了,真是高興得太早了,我們開(kāi)始查詢的第一首詩(shī)就出了問(wèn)題。《次韻和王鞏》在《東坡先生編年詩(shī)》的第十冊(cè)里面,可是第十冊(cè)居然有2個(gè)電子文本(在掃描過(guò)程中現(xiàn)代人對(duì)這本古籍進(jìn)行了重新分冊(cè),16本紙質(zhì)書(shū)被掃描成了23冊(cè)電子文本)。每個(gè)電子文本里面還有好幾卷啊,我們?nèi)绾文軌蚩焖俣ㄎ贿@首詩(shī)是在具體的那一卷里面呢?看樣子搞研究真不是一件容易的事情??!

      經(jīng)過(guò)討論,我們想到了一個(gè)辦法,就是做一套對(duì)照表,來(lái)體現(xiàn)電子書(shū)和紙質(zhì)書(shū)的對(duì)照關(guān)系,然后把搜索到的結(jié)果經(jīng)過(guò)兩次對(duì)照,找出它的具體年份。下面是電子書(shū)和紙質(zhì)書(shū)的對(duì)照關(guān)系表(刊發(fā)時(shí)有刪節(jié)):

      這樣我們就可以快速定位每一首詩(shī)的具體年代了,舉個(gè)例子:《次韻和王鞏》在《東坡先生編年詩(shī)》里面,我們搜索其中的詩(shī)句“歸來(lái)千首詩(shī)”,搜索結(jié)果是如下圖這樣的:

      這代表它在該書(shū)第十冊(cè)第32列,我們點(diǎn)擊“十”可看到下圖中的的詩(shī)句。

      由于十冊(cè)是兩本,我們還需要回到十冊(cè)的首頁(yè),看一下到底是十(1)還是十(2),在《電子書(shū)和紙質(zhì)書(shū)的對(duì)照關(guān)系表》上找到這首詩(shī)對(duì)應(yīng)的卷冊(cè)之后,再在《每一卷書(shū)的年代和地點(diǎn)對(duì)應(yīng)表》上找到這首詩(shī)的年代和創(chuàng)作地點(diǎn):

      說(shuō)明《次韻和王鞏》這首詩(shī)創(chuàng)作于哲宗元祐元年,即公元1086年,蘇軾當(dāng)年在京都當(dāng)翰林學(xué)士時(shí)候創(chuàng)作的。

      (3)研究結(jié)論

      我們按照上面的方法和步驟,查到了蘇軾所有包含“歸來(lái)”的111處詩(shī)的年代。但由于時(shí)間的原因,我們沒(méi)有來(lái)得及對(duì)蘇軾所有包含“歸來(lái)”的詞進(jìn)行查找。因此,下面的分析是基于111首包含“歸來(lái)”詩(shī)的統(tǒng)計(jì)結(jié)果。

      這是蘇軾一生中,“歸來(lái)”一詞在詩(shī)中出現(xiàn)的次數(shù)分布圖:

      我們查找了蘇軾三次被貶的經(jīng)歷,即第一次(1080—1084),因?yàn)椤盀跖_(tái)詩(shī)案”他遭到新黨誣陷,被貶黃州;第二次(1089—1091),蘇軾因?yàn)椴煌馑抉R光盡廢新法,被貶杭州、潁州;第三次(1094—1101),蘇軾因?yàn)榕c章惇政見(jiàn)不合,被貶惠州、儋州。

      我們發(fā)現(xiàn),每次被貶結(jié)束之后,蘇軾詩(shī)中的“歸來(lái)”出現(xiàn)的次數(shù)都會(huì)有所增加,蘇軾這些“歸來(lái)”詩(shī),與他跌宕起伏的一生似乎存在著聯(lián)系,他一直滿懷憂國(guó)之情,總能將這些歸去歸來(lái)的經(jīng)歷,化作美好的文學(xué)意境。

      數(shù)據(jù)分析的結(jié)果印證了我們的猜想,讓我們從一個(gè)新的角度認(rèn)識(shí)了這位文學(xué)巨匠。蘇軾一生憂患重重、多次被貶,正是這些苦難的經(jīng)歷和豐富的閱歷,讓蘇軾更關(guān)心民間疾苦,更親近大自然,使他的作品成為傳世的杰作。時(shí)至今日,我們讀蘇軾的詩(shī)詞,仍然能感到無(wú)限的哀怨和悲涼,更能體味到中國(guó)文化的深厚底蘊(yùn)和幽香。

      三、額外的發(fā)現(xiàn)

      在研究過(guò)程中,我們還發(fā)現(xiàn)“子由”出現(xiàn)在很多詩(shī)詞中,“子由”是蘇軾弟弟的字,這讓我們想到應(yīng)該檢索一下“子由”在蘇軾作品中出現(xiàn)的次數(shù)。于是,我們重新檢索了一下,發(fā)現(xiàn)“子由”在《蘇軾詩(shī)詞全集》中居然出現(xiàn)了229次,它才是蘇軾高頻詞里面的王者!為此,我們更新了高頻詞表。

      我問(wèn)爸爸為什么第一次做的高頻詞表中沒(méi)有搜到“子由”,爸爸給我們解釋說(shuō),“子由”在漢語(yǔ)中不是一個(gè)詞匯,因此電腦軟件第一次在做分詞的時(shí)候,并沒(méi)有對(duì)它進(jìn)行檢索。分詞是一門(mén)很深的學(xué)問(wèn)。每一部著作都有自己的特點(diǎn)。對(duì)每部著作的分析是一個(gè)不斷發(fā)現(xiàn)的過(guò)程。今天看著正確的分析結(jié)論,可能隨著研究的深入就不一定正確了,比如這次。

      這次對(duì)高頻詞表的更新,讓我們?cè)谘芯恐黝}之外,有了額外的收獲:就是我們發(fā)現(xiàn)了蘇軾和他的弟弟子由之間的手足情深。通過(guò)上網(wǎng)進(jìn)一步查資料,我們了解到蘇軾幾乎每到一個(gè)任所就給弟弟子由寄信贈(zèng)詩(shī),晚年被貶謫時(shí)更是如此。蘇家兄弟情誼之深厚是文學(xué)史上的佳話。他們是兄弟,是師生,是詩(shī)詞唱和的良友,是政治上榮辱與共的伙伴,也是精神上相互勉勵(lì)安慰的知己。我們?cè)O(shè)計(jì)的高頻詞表也進(jìn)一步印證了他倆之間的情誼,我們可以得出結(jié)論,研究表明蘇軾還是一個(gè)好哥哥!

      猜你喜歡
      編年高頻詞東坡
      貴州土司史籍編年系列總序
      30份政府工作報(bào)告中的高頻詞
      省級(jí)兩會(huì)上的高頻詞
      28份政府工作報(bào)告中的高頻詞
      省級(jí)兩會(huì)上的高頻詞
      索尼微單TM相機(jī)編年冊(cè)
      東坡詩(shī)元代接受論
      宜興:東坡書(shū)院憶東坡
      蘇詞編年百年回顧與反思
      博乐市| 安西县| 江安县| 广安市| 镇雄县| 永靖县| 东丽区| 天气| 柘城县| 互助| 怀仁县| 北安市| 开平市| 横山县| 新乐市| 冕宁县| 财经| 九寨沟县| 保康县| 本溪| 集安市| 鸡泽县| 乐至县| 建湖县| 阳山县| 偃师市| 新河县| 新密市| 天津市| 西乡县| 岳西县| 景谷| 玛沁县| 公主岭市| 松桃| 玛曲县| 东台市| 富平县| 垫江县| 伊宁市| 新竹市|