杜華
【摘要】文字云圖是通過文字云圖工具制作而成的反映文字頻率的可視圖的一種形象比喻,可以作為一種有效的文本分析工具應用在教學中。文章梳理了國內(nèi)外文字云圖應用研究現(xiàn)狀,指出國內(nèi)該領域研究的不足。并以英語閱讀教學為切入點,從文字云圖的可視化表征、生成線索詞、語義和表象的雙重表征等優(yōu)勢分析了文字云圖應用在英語閱讀教學中的可行性,以Wordle為例選擇高中英語教材中的一節(jié)課“Harry Potter”進行了研究設計與實踐,研究結果表明文字云圖的使用能夠調(diào)動學生的興趣,給學生的英語閱讀帶來積極的促進作用。
【關鍵詞】文本可視化;文字云圖;Wordle;英語閱讀教學
【中圖分類號】G40-057【文獻標識碼】A【論文編號】1009-8097(2012)09-0065-05
一文本可視化
“可視化”英文為“Visualization”,意為“視覺的”、“形象的”。它作為學科術語最早見于1987年美國國家科學基金會(National Science Foundation,NFS)名為《科學計算可視化》的報告??梢暬鳛橐粋€專門研究領域與可視化技術的發(fā)展緊密相連。一方面,可視化技術使視覺對象從宏觀宇宙天體到微觀微生物都能得以顯現(xiàn);另一方面,可視化技術的“動態(tài)化”、“仿真化”、“虛擬化”不僅讓不可視的事物可視化,而且讓靜態(tài)的可視變?yōu)閯討B(tài)的可視。
在不斷涌現(xiàn)的海量信息中,文本信息是一種最普通、最常用的信息表現(xiàn)形式,利用傳統(tǒng)的文本逐句閱讀方式耗時費工,已然不能滿足人們的需要。文本可視化(TextVisualization),即借助計算機技術將文本信息以圖形化、可視化、形象化呈現(xiàn),有利于人們理解文本內(nèi)容,提高理解的速度和深度,是信息可視化領域較新的一個研究分支。文本可視化的實質在于針對海量的文本信息,最大程度的實現(xiàn)抽象和概括。其方法主要包括以下三種。
(1)基于詞頻統(tǒng)計的文本可視化。這種可視化方法通過詞頻統(tǒng)計發(fā)現(xiàn)特定的詞頻模式如高頻詞匯、異常詞頻等,從而分析文本的含義。高頻詞匯指文本中出現(xiàn)頻率較高的詞匯,這些高頻詞匯本身具有相對固定的含義,它們之間的連接關系對于我們分析文本的主旨、探索高頻詞匯在文本中的用途、尋找詞匯間的搭配方式具有重要的意義。WordStat是常用的文本分析系統(tǒng)之一,它使用基于方法的詞典進行文本的內(nèi)容分析和文本挖掘,如D·Dillon、D·Cottree、lJ·Reser等在研究網(wǎng)絡熱點語境等運用WordStat進行文本分析。
(2)基于聚類算法的文本可視化。文本聚類是處理文本的重要方法之一,它通過將大量信息組織成少數(shù)有意義的簇,并保證同一簇內(nèi)的文本之間是相似的,達到改善檢索性能的目的。多應用在信息檢索、網(wǎng)頁鏈接關系分析等領域。
(3)基于語義的文本可視化。此法最為復雜,也最難實現(xiàn)。它不僅要發(fā)現(xiàn)文本中特定的詞頻模式,而且還要通過各種技術手段,發(fā)現(xiàn)文章中特定的隱含語義關系,并以圖形化呈現(xiàn),幫助我們有效閱讀和理解文本內(nèi)容。
二文字云圖工具及其應用研究綜述
1、文字云圖
文字云圖(Word Clouds、Text Clouds)也譯為詞匯云、詞云、文字云、文本云圖等,是一種基于詞頻的文本可視化形式,以頗具美感的圖形將其呈現(xiàn)。緣起于標簽云圖(TagCloud),是目前大眾標注網(wǎng)站普遍使用的標簽可視化組織和表現(xiàn)方式,其原理逐漸推廣應用于展示非標簽類型數(shù)據(jù),由此產(chǎn)生了數(shù)據(jù)云圖、文本云圖、搭配云圖等其他類型云圖。文字云圖是通過文字云圖工具制作而成的反映文字頻率的可視圖的形象比喻,圖1給出一個示例,顏色樣式都可以調(diào)節(jié)。文字云圖中每個單詞的大小取決于其在文本出現(xiàn)的頻率,頻率越高,在云圖中顯示越大。單詞的重要性通過其字體大小來呈現(xiàn)。它可以直觀地反映文本中的文字密度及重要性。
2、文字云圖工具Wordle
常用的文字云圖工具有Wordle、Tagxedo、Tagul、WordIt Out、Tag Crowd、Wordsiff等。Wordle是最流行的文字云圖工具之一,由IBM高級軟件工程師Jonathan Feinberg 2008年6月發(fā)布。在《數(shù)據(jù)可視化之美》一書的第三章,JonathanFeinberg詳細介紹了Wordle的發(fā)明過程、內(nèi)部工作方式以及在這個過程中從技術和審美角度所做的選擇。點擊網(wǎng)址http://www.wordle.net即可打開主界面,無需注冊和登錄免費使用,使用者將文本輸入后,很快就能自動制作出具有不同風格樣式的文字云圖。用戶可以設置一些參數(shù)值如字體、色彩、所顯示的文字最大數(shù)目、文字顯示的角度比如所有文字垂直、水平、部分垂直或者水平等。
3、文字云圖的應用研究綜述
文字云圖可以作為一種有效的工具對文本內(nèi)容作出快速的分析和研究,可以應用于各種文本分析和研究中,有助于讀者從不同的角度理解文本的內(nèi)容。近幾年關于文字云圖的研究并不太多(Cidell,2010:McNaught&Lam,2010;Pendergast,2010;Ramsden&Bate,2008)。Pendergast(2010)使用文字云圖對于美國家庭與消費科學學會(AAFCS)發(fā)布的公文常用的單詞進行分析,并建議在網(wǎng)站上公布的公文之后附上其標簽云,以便更多的人理解。Ciden(2010)建議文字云圖可以分析描述性數(shù)據(jù)。她對跨地區(qū)的會議錄音和報紙上關于“綠色”建筑的文章進行研究,分別運用可視化的文字云圖形式與文字頻率報告兩種形式進行了比較,從而得出運用文字云圖有助于分析描述性數(shù)據(jù)。
國外研究文字云圖在教育教學中的應用也不多。Ramsden&Bate分析了文字云圖用于教育領域的可能性,他們描述了文字云圖如何分析“教師對播客在教育中的應用這一問題的看法?!彼麄円部偨Y了Wordle的其他應用,也對教師如何使用文字云圖如生成器的選擇、數(shù)據(jù)的準備、文字云圖的解釋等方面給出了一些建議(Ramsden&Bate,2008)。佛羅里達國際大學的Melissa Baralt和喬治城大學的Susan Pennestri與Marie Selvandin等學者運用行動研究法使用Wordle幫助學生提高外語(研究對象的母語為英語,外語為西班牙語)的寫作水平,研究過程長達一個學期。研究結論是學生在應用西班牙語寫作時會應用豐富的詞匯、動詞時態(tài)和準確的語法,寫作水平確實有所提高,而且給教師和學生帶來有效、新奇、愉悅的心理體驗(Melissa Baralt,SusanPennestri,and Marie Selvandin,2011)。
與國外研究相比,國內(nèi)這方面研究更少。筆者以“文字云”、“文字云圖”為關鍵詞檢索了中國期刊全文數(shù)據(jù)庫、中國優(yōu)秀碩士學位論文全文數(shù)據(jù)庫、中國博士學位論文全文數(shù)據(jù)庫、中國重要會議論文全文數(shù)據(jù)庫、中國重要報紙全文數(shù)據(jù)庫,僅得到與筆者研究相關性極大的一篇文獻,黃曉英(2011)的《文字云圖在外語電化教學中的應用》,運用wordle進行外語課堂教學設計,分別用Wordle輔助聽力教學、輔助閱讀教學,“增加了外語課堂教學的活力”。因Wordle不支持中文,極大限制了它在我國教學中的應用范圍,在我國大部分學科領域中都無法應用,最能發(fā)揮文字云圖特長的學科無疑是英語,在英語詞匯、閱讀、寫作、聽力教學中有其獨特的優(yōu)越性。鑒于英語教學的復雜性,在本文中只研究英語閱讀教學。
三文字云圖在英語閱讀教學中應用的優(yōu)勢分析
1、可視化表征(Visual Representation)
英語閱讀是一個復雜的過程,在閱讀過程中,閱讀者根據(jù)本人大腦中已有的語言知識對閱讀材料進行推測,并在閱讀中加以證實和修正。英語文本閱讀基本上都是采用逐句閱讀、聯(lián)系上下文的方式來進行。而將線性的英語閱讀文本轉化為文字云圖,即是將文本進行可視化表征,“通過可視化組織,它可以形成促進思維發(fā)展的引導框架和網(wǎng)絡,將解決問題過程中的各種思維結構以各種直觀、形象和清晰的結構圖示表現(xiàn)出來”。通過對文本進行可視化呈現(xiàn)的方式能夠增強我們對文本內(nèi)容的理解,提高理解的速度和深度。首先,學習者透過視覺表征的外表特征,如顏色、大小、形狀、和位置等,將視覺符號及其空間關系具體地在腦中呈現(xiàn)出來。其次,學習者在原有的知識和經(jīng)驗基礎上,經(jīng)過分析綜合和判斷推理等思維活動后,準確把握感知材料內(nèi)容,從而準確地把握整篇文章的主旨大意,同時還可以極大地激發(fā)閱讀興趣,提高閱讀效果。
2、生成線索詞(Verbal Clues)
所謂線索詞就是能夠幫助人們理解的關鍵的詞。線索詞對于我們閱讀、理解、記憶有著非常重要的作用。文字云圖中顯示的是一些文字或單詞,其出現(xiàn)頻率及其重要性程度越高,在云圖中顯示的字體就越大,且以不同顏色的字顯示。這些詞即為能幫助學習者理解文本的線索詞。通過將閱讀文本制作成文字云圖,可以生成線索詞,促進學生對閱讀文本的理解,從而把握文章的主要內(nèi)容。例如,學生閱讀某篇課文,將其制作成文字云圖,依據(jù)雙重編碼理論,可以激活言語系統(tǒng)中的言語碼,從而將線索詞擴展為句、段、篇,進而再現(xiàn)全文大意。
3、語義和表象的雙重表征(Dual Representation ofVerbal and Non-verbal symbols)
美國心理學家佩維奧(Paivio,1991)1991年在研究人的認知過程時提出了被認為是“本世紀最有影響力的認知理論之一”(Marks,1997)的雙重編碼理論。他認為人的認知行為由語義系統(tǒng)和表象系統(tǒng)這兩個相互獨立又密切聯(lián)系的符號系統(tǒng)協(xié)調(diào),專門負責信息的編碼、組織、轉換、存儲和提取。語義系統(tǒng)即言語編碼系統(tǒng),專門處理語言信息,表象系統(tǒng)即非言語編碼系統(tǒng),專門處理非言語的客體和事件的信息。語義系統(tǒng)是一個按照序列、層級的方式排列的言語碼網(wǎng)絡,表象系統(tǒng)是以重疊的、嵌套的方式排列的意象碼的集合。外部環(huán)境中的言語刺激物和非言語刺激物,經(jīng)過感覺系統(tǒng)的覺察,通過表征加工分別激活言語系統(tǒng)中的言語碼和非言語系統(tǒng)中的意象碼。語義系統(tǒng)與表象系統(tǒng)之間的活動(言語碼與表象碼之間的轉化)通過參照加工實現(xiàn)。兩個系統(tǒng)內(nèi)部的活動(言語碼激活其他的言語碼或表象碼激活其他的表象碼)通過聯(lián)想加工實現(xiàn)。最后,兩個系統(tǒng)中被刺激的言語碼或意象碼,經(jīng)過感覺輸出系統(tǒng)后,產(chǎn)生言語反應和非言語反應。語義系統(tǒng)與表象系統(tǒng)既緊密聯(lián)系又相互獨立,通過表征加工、參照加工和聯(lián)想加工這三個加工層次緊密聯(lián)系在一起。語義表征與意象表征都是知識的表征方式,兩者既獨立又相互聯(lián)系,共同存在,互為補充,語義表征是對知識的直接描述,表象表征是對知識描述形象或映像的補充,兩種方式可以相互轉化并共同作用于人的大腦,構成對知識的雙重記憶。
英語閱讀是言語碼和意象碼在三個不同加工層次的激活,即在表征加工中的言語碼和意象碼的直接激活,在參照加工中的言語碼和意象碼的交叉激活,在聯(lián)想加工中的言語碼和意象碼的擴散激活。在分析單詞或段落或文本的涵義的同時在文字云圖中將其以圖形化顯示,這正是給學習者以語義和表象的雙重表征,當兩個編碼系統(tǒng)同時被激活時,可以使學習者對學習內(nèi)容更有效的加工處理和保持,從而會增強學習效果。在課堂中應用文字云圖可以使學習者在文字信息、語言信息、視覺信息之間建立有意義的聯(lián)系。
四研究設計
前文分析了文字云圖在英語閱讀教學中的優(yōu)勢,下面結合課堂實踐來探討其具體應用。本研究被試來自商丘市實驗中學高一年級五班。該研究選擇的學習內(nèi)容是人民教育出版社高中一年級英語上冊Unit 12:Art and Literature。本單元的中心話題是“文學藝術”。本課“Harry Potter”是一篇敘事性的閱讀短文,介紹和描述英國著名女作家J.K.羅琳撰寫的系列書籍《哈利·波特》的內(nèi)容及主人公哈利·波特的生活、學習、性格和信念,并啟發(fā)學生如何面對困難,堅定信念從而最終克服困難。由于本研究在真實課堂環(huán)境解決復雜問題,同時將設計原則與技術可行性相結合,提供可能的解決方案,在研究中采用了設計研究范式,對高中英語教學活動進行設計和實施。在研究開始之前,和英語教師就閱讀教學的組織形式等問題進行溝通,對文字云圖的趣味性及其在英語教學中的有效性達成一致,旨在改善學生閱讀能力較差,在閱讀中容易產(chǎn)生焦慮情緒的現(xiàn)狀。為了保證研究的真實有效性,在研究開始之前,我們對教師和學生進行相應的培訓,讓他們掌握文字云圖的制作使用方法,并熟悉這種教學方式。教室選在多媒體網(wǎng)絡教室。
1、“讀前”(Pre-reading)部分設計
“讀前”活動是一種在實際閱讀課文之前的對閱讀材料進行預測、猜測的準備活動。預測機制在閱讀中有著非常重要的作用,它不僅能幫助學生準確地把握整篇文章的主旨大意,還可以極大地激發(fā)閱讀興趣,提高閱讀效果?!白x前”活動是正式閱讀的熱身活動,目的是調(diào)動學生的閱讀積極性,激活相關的言語碼和意象碼,為正式閱讀做好充分的準備。教師應該為學生提供充足的閱讀的動因,研究表明,在閱讀課堂里,生動有趣的開始對學習有著重大而積極的影響。它可以提高學生的集中注意力、激發(fā)好奇心、加強想象力以及激勵內(nèi)驅力。
課文是以某種序列從字母逐一排列成單詞、句子和篇章的言語碼,我們可以通過將其制作為文字云圖的方式將其轉化為直觀形象的意象碼,讓學生把課文制作成文字云圖的形式。在文字云圖中生成的線索詞Harry、Magic、World等以最為醒目的方式呈現(xiàn)(如圖2所示),學生可以調(diào)整自己喜歡的云圖樣式。依據(jù)雙重編碼理論,言語碼通過聯(lián)想加工可以擴散激活其他的言語碼。教師鼓勵學生依據(jù)文字云圖中的線索詞來猜測文本的風格和主要內(nèi)容,通過集體自由討論,激活與題目相關的其他言語碼,讓每組同學討論這些線索詞的含義,通過集體自由討論給出自己的答案。而后,教師向學生展示電影《哈利·波特》的海報,播放電影《哈利·波特與魔法石》的片段,提出問題:Who is the boy wearing glasses?Have you seen the film“Harry Potter”?Do you know who plays the role of Harry Potter?從而激活學生已有的知識和生活體驗,為后續(xù)的閱讀活動做鋪墊。學生圍繞這些問題開展了談明星,說電影的熱身活動,熱烈的討論營造了活躍的英語課堂氛圍,有的學生甚至叫了出來:“I want learn about magic!”實踐證明,充分的讀前準備大大消除了學生的焦慮、抑制等一些情感障礙,對教學任務的順利完成起了關鍵性的作用。文字云圖的制作幫助學生把握全文大意,極大程度上把學生的閱讀興趣激發(fā)起來,有助于學生發(fā)揮想象,激活課堂氣氛,檢驗學生使用英語思維和表達的能力,為后面的閱讀活動作了很好的鋪墊。
2、“閱讀”(While-reading)部分設計
此部分是英語閱讀教學過程中的關鍵步驟,主要是分析文章結構,理解文章內(nèi)容,對文章結構的分析有助于學生在短時間內(nèi)盡快了解全文大意以及證實“讀前”活動中對文章主旨的預測。首先,隨著在“讀前”活動結束后,學生相關的意象碼和言語碼被激活,教師適時向學生提出略讀任務,指導學生瀏覽全文。讓學生首先略讀課文找出每段的主旨句,并回答問題:Whattype ofwritingisthetext?讓學生從整體上把握文章,使學生了解文章的體裁,把握文章的結構,培養(yǎng)學生快速閱讀的能力,讓他們在有限的時間內(nèi)讀文章,作習題,提高了學習效率。在閱讀過程中引導學生關注每個段落的開頭和結尾部分。
而后,將每一段都制作成文字云圖,結合云圖中的線索詞,分析每一段的段落大意,教師給予引導、提示、講解,將文章結構分為四部分。第一段的文字云圖中的線索詞有Rowling、Books、World、Strang、Magic、Real、Creatures等,主要介紹英國著名女作家J.K.羅琳的《哈利·波特》系列作品描繪的是一個充滿了奇異、魔幻的世界,第二段的文字云圖線索詞Harry、Life等,主要介紹在《哈利·波特》第一部作品中哈利這個無父無母的孩子的悲慘生活。第三段的云圖線索詞主要有Harry、Learns、Hogwarts、Magic等,本部分主要介紹哈利在霍格沃茨魔法學校的學習生活冒險故事,最后一段的云圖中主要有Harry、Different等,主要從情感上進行升華,告訴我們要相信自己、幫助別人、堅持夢想,出身和相貌并不能決定一個人的成長。我們可能來自不同世界,說著不同的語言,具有不同的習慣,但這并不影響我們具有共同的目標、期望、夢想。如圖3-圖6所示。
通過閱讀,學生能了解有關J.K.羅琳的著作《哈利·波特》的發(fā)展,了解成功人士背后的艱辛,并能從中學習J.K.羅琳堅持夢想,決不放棄的精神和吃苦耐勞的品質,鼓勵學生閱讀名著以增長見識,勵志奮進。對課文語段的理解、結構的分析以及由淺入深的閱讀,也能夠培養(yǎng)學生良好的閱讀習慣。通過制作文字云圖幫助分析文章的組織結構,學生能更好地把握文章中心思想和文章的擴展思路。
3、“讀后”(Post-reading)部分設計
本部分指導學生在了解文本的基礎上,提出問題Whatdo you think of Harry?What can we leam from Harry?Whatcan we do to make our dreams come true?引導學生進行深層次的思考和分析。指導學生聯(lián)系自己的生活實際和體驗,帶著問題展開小組討論,并進行匯報。這樣設計立足文本,并聯(lián)系學生生活實際進行小組討論,使學生樹立一種堅持夢想的精神和吃苦耐勞的優(yōu)秀品質。為了擴展學生對內(nèi)容的理解,可以建議學生閱讀此系列書籍,觀看此系列的電影。
五數(shù)據(jù)分析
在課堂觀察中,我們看到學生在半個小時內(nèi)即能熟練使用文字云圖工具。一節(jié)課結束后,整個課堂充滿了積極活躍的氣氛,閱讀課堂不再是沉悶的代名詞,效果非常明顯。學生很支持這種新型的英語學習方式,學生始終保持了較好的學習興趣,明顯流露出對進一步學習的期待。不足的是,因為學生閱讀基礎差,“讀前”部分、“略讀”部分時間比預想的要長,多少影響了下一環(huán)節(jié)的教學。
為了解學生對這種上課形式的態(tài)度,本研究數(shù)據(jù)分析部分設計了里克特四點量表(1=非常不同意;2=不同意;3=同意;4=非常同意)。分值越高,表明對此觀點的認同度越高。在正式施測之前,進行了信度測試和因素分析,表明量表各維度項目信度較高(α>.70)。量表發(fā)放69份,回收69份,回收率為100%,采用Spss 13.0進行數(shù)據(jù)分析。研究結果(見表1)表明,89.9%的學生認為文字云圖工具Wordle的使用較為簡單、容易掌握,85.5%的學生表示在使用Wordle時很自信。在使用Wordle進行英語閱讀教學的愉悅程度方面,95.6%的學生認為制作文字云圖的活動很新穎有趣,90%的學生很享受制作文字云圖的活動,88.5%的學生希望參與更多的這種活動。81.2%的學生認為創(chuàng)造力被激發(fā),85.5%的學生更加享受英語學習,86.8%的學生認為英語學習變得更有趣,69.6%的學生認為Wordle使閱讀變得更易于理解。在一節(jié)課結束后,筆者與教師和學生座談,分享他們的感受。訪談與量表調(diào)查結果是一致的,學生們認為,“Wordle能把課文變成漂亮的圖,里面有許多單詞可以幫助我理解課文。”“我喜歡使用Wordle,很有趣,今天這節(jié)課跟以往的英語課完全不同?!薄耙敲看斡⒄Z課都能這樣上就好了。”教師也認為,“確實調(diào)動了學生上課的積極性?!?/p>
六結束語
研究表明,文字云圖的使用確實使英語閱讀教學更加生動有趣,給學生的英語閱讀帶來積極的促進作用。但它一方面具有優(yōu)越性,另一方面也存在很大的局限性。正如Wordle發(fā)明者Jonathan Feinberg在《數(shù)據(jù)可視化之美》一書中提到的那樣,“Wordle不是為可視化專家、文本分析專家甚至是有經(jīng)驗的計算機用戶而設計的。Wordle視為一種可視化工具更為貼切?!彼⒉皇莾?yōu)秀的信息可視化,也不能算是嚴格的基于詞頻統(tǒng)計的文本可視化。單詞大小調(diào)整較簡單,并未考慮單詞的長度、字形。文字的顏色并無意義,僅是用來提高單詞邊界的對比度和增加一些美感。字體傾向于美學和表現(xiàn)力,而不是可讀性。本研究讀后部分、數(shù)據(jù)分析部分略顯薄弱,我們將在后續(xù)研究中進一步加強,并向大家介紹支持中文的文字云圖工具Tagxedo在學科教學中的應用。