金 澎
(樂山師范學院 智能信息處理及應(yīng)用實驗室, 四川 樂山 614004)
2010年4月18至19日,在樂山師范學院召開了“超大規(guī)模語料庫精深加工及應(yīng)用研討會”。會議中心議題是交流在超大規(guī)模語料獲取、整理、加工方面的成果與經(jīng)驗,特別針對基于國家語言資源監(jiān)測語料庫的語言狀況調(diào)查中遇到的問題進行了深入討論。
此次會議由北京大學教育部計算語言學重點實驗室組織,樂山師范學院計算機科學學院和智能信息處理及應(yīng)用實驗室承辦。會議的動機是通過交流,將已有的大規(guī)模語料庫加工的成果能夠有機地應(yīng)用于基于超大規(guī)模語料庫的語言狀況調(diào)查中。會上交流的研究成果包括“現(xiàn)代漢語虛詞用法知識庫研究及相關(guān)工具”、“漢字義類信息庫”、“漢語語義構(gòu)詞信息庫”、“現(xiàn)代漢語新詞語信息電子詞典”、“新編同義詞詞林”、“句子語義成分標注語料庫”、“同形標注語料庫及標注、校對軟件”等。同時,對面向語言監(jiān)測的分詞標注工具的特點、新詞語、流行語提取的難點及對策等進行了深入討論。達成了在超大規(guī)模語料庫的處理及精加工方面發(fā)揮各自所長,相互合作,共享成果的意向。
出席此次會議的專家學者包括:北京大學俞士汶教授、朱學鋒副教授、中國傳媒大學侯敏教授、魯東大學亢世勇教授、北京語言大學楊爾弘教授、鄭州大學昝紅英副教授、中國情報技術(shù)研究所劉耀副研究員、北京大學博士后劉鵬遠、樂山師范學院金澎博士等。