維基百科
- 基于深度學(xué)習(xí)的醫(yī)療問句分類研究*
本文提出基于維基百科和深度學(xué)習(xí)相結(jié)合的詞向量特征擴(kuò)展模型,該模型利用中文維基百科語義結(jié)構(gòu)和Word2vec構(gòu)造特征詞向量,從而提高醫(yī)療問句分類準(zhǔn)確性。1 相關(guān)工作雖然中文問句大部分比較短小,只包含幾個關(guān)鍵詞,但是問句中蘊(yùn)含著豐富的語義關(guān)系,它的結(jié)構(gòu)復(fù)雜,形式多樣,給研究者帶來不少難題。目前大部分研究集中在分類模型準(zhǔn)確性、性能提升等工作,并且取得不錯的進(jìn)展,近幾年,眾多學(xué)者開始著手研究問句關(guān)鍵詞提取,本文結(jié)合醫(yī)療問句自身特點(diǎn),重點(diǎn)研究問句關(guān)鍵詞特征擴(kuò)展,構(gòu)建
計算機(jī)時代 2022年11期2022-11-10
- 利用維基百科點(diǎn)擊流的概念依賴關(guān)系識別方法
A.本文將以維基百科為例研究概念間的依賴關(guān)系挖掘問題.維基百科作為世界上最知名互聯(lián)網(wǎng)百科全書之一,幾乎囊括了學(xué)習(xí)者需要的所有概念知識.維基百科概念是指詞條的標(biāo)題,一個維基百科概念就代表著一個詞條.如果一個概念B依賴于概念A(yù),那么就意味著理解B的詞條內(nèi)容,需要同時閱讀一下A的詞條內(nèi)容,因?yàn)锳中包含了一些理解B的詞條內(nèi)容所需的背景知識.當(dāng)學(xué)習(xí)者瀏覽概念B的詞條后,緊接著瀏覽概念A(yù)的詞條,像這樣的行為我們稱之為“點(diǎn)擊流”,維基百科官方公布最近30個月用戶的點(diǎn)擊流
小型微型計算機(jī)系統(tǒng) 2022年10期2022-10-15
- 民進(jìn)黨又爆抄襲,來源竟是百度百科
中甚至有抄錄維基百科、百度百科等非學(xué)術(shù)材料的內(nèi)容。據(jù)臺灣中時新聞網(wǎng)9月1日報道,臺北市民意代表參選人劉仕杰、陳志明,基隆市議員參選人江欣怡1日召開記者會,公布蔡適應(yīng)論文抄襲細(xì)節(jié)。陳志明表示,蔡適應(yīng)在臺立法機(jī)構(gòu)公告上,將學(xué)歷改為“臺北大學(xué)都市計劃研究所博士”,此學(xué)歷在2020年取得,且他在競選廣告牌上也打出博士頭銜。然而,近期有民眾舉報蔡適應(yīng)涉嫌論文抄襲,經(jīng)過逐頁比對后,發(fā)現(xiàn)該論文有三大問題,即論文抄襲30份文獻(xiàn),其中25份都沒被列入?yún)⒖嘉墨I(xiàn),結(jié)論抄襲比例高
環(huán)球時報 2022-09-022022-09-02
- 網(wǎng)絡(luò)我不相信
為網(wǎng)絡(luò)時代是維基百科(Wikipedia)時代。維基百科上的稿件一般來說不是專家寫的,是老百姓或者學(xué)生編輯的。當(dāng)然,老百姓、學(xué)生也會有知識。無論是在柏林自由大學(xué)還是在波恩大學(xué),過去我總跟我的學(xué)生合作。我跟他們出版了我譯的六卷《魯迅選集》,后來又增加到第七卷。特別是在上個世紀(jì)的七十年代,不少德國的大學(xué)互相學(xué)習(xí)。這說明當(dāng)時老師們也準(zhǔn)備向?qū)W生們學(xué)習(xí)。不過,要互相幫助,還是需要一個老師! 他會給學(xué)生修改他們的翻譯、文章等。三十年來,我出版的雜志《袖珍漢學(xué)》(min
南方周末 2020-05-282020-05-28
- 為自己想要的世界投出一票
的時候都會給維基百科捐款。金額不多,一般是100美元,和維基每年收到的上億美元捐助相比不過百萬分之一,可謂微不足道??墒俏也⒉粫虼司陀X得我的捐款不重要。因?yàn)?span id="j5i0abt0b" class="hl">維基百科的日常運(yùn)營,依賴的正是全球數(shù)以百萬計像我一樣的普通人力所能及從口袋里掏出的小額捐贈。拿去年來說,總計1.12億美元的捐款,分別來自700多萬位捐贈者。一筆筆幾美元、幾十美元的捐款,像一滴滴水匯聚成海洋,支撐起了這個龐大的非營利性網(wǎng)站。維基百科成立于2001年,二十年來在沒有任何廣告和商業(yè)收入的
風(fēng)流一代·經(jīng)典文摘 2020年4期2020-04-27
- 中國對外傳播在維基百科平臺中的機(jī)遇與挑戰(zhàn)*
及問題的提出維基百科是一個“共同創(chuàng)造”(Collaborative)知識的網(wǎng)絡(luò)社交平臺,它遵循“客觀”、“開放”、“協(xié)作”的功能理念,允許網(wǎng)民自由針對百科條目進(jìn)行創(chuàng)作、修改、擴(kuò)展或深入的探討。事實(shí)上,作為網(wǎng)絡(luò)百科最具代表性的百科知識搜索和共享平臺,維基百科影響力已經(jīng)逐漸超過CNN、BBC等傳統(tǒng)媒體,成為普羅大眾、各行各業(yè),甚至全球最具影響力的記者、學(xué)者和政治家們搜索信息、了解新事物的重要渠道[注]A. Lih, “Wikipedia as Particip
社會科學(xué) 2019年6期2019-12-13
- 基于維基百科鏈接特征的詞語語義相似度計算
針對目前基于維基百科的相似度計算方法預(yù)處理過程煩瑣、計算量大的問題,本文以維基百科為本體引入基于特征的詞語語義計算,提出了一種基于維基百科的快速詞語相似度計算方法。根據(jù)維基百科頁面鏈接結(jié)構(gòu)的特點(diǎn),該方法把頁面的入鏈接和出鏈接作為頁面特征值構(gòu)建特征向量模型,通過計算頁面的特征向量相關(guān)系數(shù)計算對應(yīng)詞語的語義相似度。本文還改進(jìn)了維基百科消歧處理算法,在一詞多義的處理中減少社會認(rèn)知度低的義項(xiàng)頁面的干擾,進(jìn)一步提高了計算準(zhǔn)確度。經(jīng)Miller & Charles(M
軟件工程 2019年10期2019-11-16
- 普京要求創(chuàng)建“俄版維基百科”
百科全書替代維基百科?!倍砹_斯總統(tǒng)普京近日在俄語委員會會議上表明了這一觀點(diǎn)。據(jù)俄羅斯《莫斯科共青團(tuán)員報》6日報道,在會上普京表示,俄羅斯學(xué)生經(jīng)常使用不可靠的信息來源,其中包括來自維基百科的信息,應(yīng)當(dāng)建立一個“大俄羅斯電子百科全書”來取代維基百科,給出更優(yōu)質(zhì)可靠的信息。報道稱,實(shí)際上自2014年以來,俄羅斯就開始討論并著手實(shí)施創(chuàng)建國家百科全書計劃。當(dāng)時,俄羅斯國家圖書館和總統(tǒng)圖書館的負(fù)責(zé)人表示,維基百科存在錯誤,它反映世界地緣政治現(xiàn)實(shí)時帶有偏見,通常由美國控
環(huán)球時報 2019-11-082019-11-08
- 兩岸網(wǎng)民展開“維基百科攻防戰(zhàn)”
伸到網(wǎng)絡(luò),“維基百科”的編輯內(nèi)容近來成為另類角逐戰(zhàn)場。臺灣“中央社”7日援引英國廣播公司(BBC)此前的報道稱,如果詢問谷歌或蘋果智能助手Siri“臺灣是什么?”它們之前會回答稱:“位于東亞的一個國家?!钡珡?月開始這個問題的答復(fù)是“中華人民共和國的一個省份”。原因在于這類搜索引擎或?qū)?shù)字語音助理的答案都會先導(dǎo)向“維基百科”,而目前“維基百科”內(nèi)容成為兩岸的編輯角力場?!董h(huán)球時報》記者注意到,“維基百科”的中文詞條僅從文字上分為簡體與繁體,內(nèi)容則完全一致,
環(huán)球時報 2019-10-082019-10-08
- 一氣候變化論文竟被引280萬次
維基百科上被引用最多的信源是什么?據(jù)ABC新聞7日報道,維基百科日前公布了被引用次數(shù)最多的十大信源。由3名澳大利亞科學(xué)家在2007年發(fā)表的一篇?dú)夂蜃兓撐母呔影袷?,成?span id="j5i0abt0b" class="hl">維基百科上的“信源王”。該文章總共被引用280多萬次,遠(yuǎn)遠(yuǎn)超過排名第二的一篇物理論文,該論文的被引用次數(shù)只有2萬多次。報道稱,結(jié)果一出來,連這3名科學(xué)家也大吃一驚。其中一名作者表示,這證實(shí)了科學(xué)開放的重要性,科學(xué)研究的數(shù)據(jù)和結(jié)果都應(yīng)免費(fèi)公開,供有需要的公眾參考。這篇論文被引用次數(shù)多,與當(dāng)初選
環(huán)球時報 2018-05-092018-05-09
- 基于維基百科的短文本相關(guān)度計算
取背景知識。維基百科是目前世界上最大的、多語種的、開放式的在線百科全書。目前含有35萬條中文條目,這些條目之間相互鏈接構(gòu)成了一個巨大的語義網(wǎng)絡(luò),很多研究者都青睞于利用維基百科來計算語義相關(guān)性。文獻(xiàn)[2]將基于Wordnet的一些經(jīng)典算法用到維基百科的分類圖中,證明了維基百科在相關(guān)度計算中的可行性。文獻(xiàn)[3]提出了利用維基百科解釋文檔來計算兩個純文本之間的相關(guān)度,該算法被稱為明確語義分析(Explicit Semantic Analysis,ESA),但是該
計算機(jī)工程 2018年2期2018-03-02
- 一種基于大規(guī)模知識庫的語義相似性計算方法
究通過運(yùn)用以維基百科為代表的大規(guī)模知識庫取得了一定突破,但是其中的路徑并沒有被充分利用.研究基于人類思考方式的雙向最短路徑算法進(jìn)行單詞和文本的相似性評估,以充分利用知識庫中的路徑信息.提出的算法通過在維基百科中抽取出顆粒度比詞條更細(xì)密的節(jié)點(diǎn)之間的超鏈接關(guān)系,并首次驗(yàn)證了維基百科之間的普遍連通性,并對2個詞條之間的平均最短路徑長度進(jìn)行評估.最后,在公開數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn)結(jié)果顯示,算法在單詞相似度得分上明顯優(yōu)于現(xiàn)有算法,在文本相似度的得分上趨于先進(jìn)水平.大規(guī)模
計算機(jī)研究與發(fā)展 2017年11期2017-12-08
- 年歷
24日,中文維基百科正式成立上線。中文維基百科是維基百科協(xié)作計劃的中文版本,由非營利組織——維基媒體基金會負(fù)責(zé)營運(yùn)。截至2010年6月30日14:47,中文維基百科已擁有314,167條條目,累計編輯次數(shù)達(dá)13,708,705次。此外還設(shè)有其他獨(dú)立運(yùn)作的中文方言或版本,包括閩南語維基百科、粵語維基百科、文言文維基百科、吳語維基百科、閩東語維基百科、贛語維基百科及客家語維基百科等。命名為“維基百科”?!熬S基”二字符合中國大陸的譯名標(biāo)準(zhǔn),“維”字意為系物的大繩
中國計算機(jī)報 2017年40期2017-11-16
- 百度百科和中文維基百科內(nèi)容生產(chǎn)機(jī)制差異比較
度百科和中文維基百科內(nèi)容生產(chǎn)機(jī)制差異比較文/陳靈珠網(wǎng)絡(luò)百科“知識共享和協(xié)作創(chuàng)新的模式”改變了傳統(tǒng)百科全書的內(nèi)容生產(chǎn)過程,不再以傳統(tǒng)編輯為中心環(huán)節(jié),也打破了知識原有的傳播途徑,讓知識變得大眾化和易于獲得,這種新形式能有效減少數(shù)字時代帶來的知識鴻溝。但是指數(shù)暴漲式的詞條數(shù)量增長,也讓學(xué)者對其質(zhì)量提出了一定的質(zhì)疑。中文維基百科是維基百科的中文寫作計劃,一直以來都被作為百度百科的對比對象。傳播學(xué)奠基人拉斯韋爾于1948年發(fā)表的論文《傳播在社會中的結(jié)構(gòu)和功能》中提出
傳媒 2017年10期2017-06-24
- 維基百科:人人都能編寫的百科全書
文版。然而,維基百科誕生后,這部以學(xué)術(shù)性強(qiáng)、權(quán)威性高著稱的百科全書,受到了日益嚴(yán)峻的挑戰(zhàn)。2012年,《不列顛百科全書》停止紙質(zhì)版印刷,時任出版社總裁喬治·高祖告訴記者:“《不列顛百科全書》與維基百科的體量相比,簡直是微不足道。我們就做不到為每一個卡通人物、名人或運(yùn)動員撰寫詞條。”2001年,吉米·威爾斯受到維基軟件這個工具的啟發(fā),開始創(chuàng)立全網(wǎng)民都可參與的網(wǎng)上百科全書項(xiàng)目。在這部百科全書中,人人可以編寫詞條,人人可以修改,人人可以免費(fèi)分享。這部百科全書以維
百科知識 2017年10期2017-05-19
- 中國編纂新書挑戰(zhàn)維基百科
百科全書挑戰(zhàn)維基百科 中國已動員數(shù)萬名學(xué)者編纂一部網(wǎng)絡(luò)版的國家百科全書,其首期條目將于明年上線,以與維基百科競爭?!吨袊蟀倏迫珪返谌媸侵袊壳伴_展的最大規(guī)模的出版項(xiàng)目,2萬多名來自全國高校和研究機(jī)構(gòu)的專家學(xué)者參與編纂工作。作為中國首部數(shù)字化的百科全書,該版首期目標(biāo)為30萬余條,每條約1000字,相當(dāng)于《大英百科全書》的兩倍,規(guī)模與中文版維基百科相當(dāng)。“《中國大百科全書》不是一本書,而是文化萬里長城”,該版執(zhí)行總主編表示,當(dāng)前世界各國、各地區(qū)都在積極編
環(huán)球時報 2017-05-022017-05-02
- 維基百科禁《每日郵報》為信源
線百科全書“維基百科”英文版編輯就以英國《每日郵報》信息不可靠為由,決定不再采用其新聞報道作為信息來源。報道稱,維基百科編輯認(rèn)為《每日郵報》“事實(shí)查證不力、嘩眾取寵與直接捏造”,因此決定不再采信其新聞報道。負(fù)責(zé)運(yùn)營維基百科的維基媒體基金會指出,編輯至少從2015年初就開始質(zhì)疑《每日郵報》新聞的可信度。不過,也有人認(rèn)為,《每日郵報》有時還是可靠的,其他媒體也可能不可靠。報道表示,維基百科禁用某一家媒體的報道作為其信息源的做法極為罕見。如果論媒體報道內(nèi)容和傾向
環(huán)球時報 2017-02-102017-02-10
- 維基百科國內(nèi)外研究綜述與展望
付巧楊海英?維基百科國內(nèi)外研究綜述與展望付巧楊海英摘要基于對國內(nèi)外維基百科研究文獻(xiàn)的搜集與分析,論文從維基百科(技術(shù))評介、內(nèi)容研究、志愿者及其組織方式研究和維基百科(技術(shù))應(yīng)用研究等方面總結(jié)國外維基百科研究成果;從維基百科引介、信息組織及條目質(zhì)量控制方式研究、維基百科(技術(shù))應(yīng)用研究和維基百科與中國網(wǎng)絡(luò)百科全書研究等方面總結(jié)國內(nèi)維基百科研究成果,分析發(fā)現(xiàn)國內(nèi)外研究在研究視角、研究內(nèi)容與研究方法上存在相同之處與差距,指出國內(nèi)外研究的不足,并對今后的研究提出
新世紀(jì)圖書館 2016年2期2016-12-08
- 淺析互聯(lián)網(wǎng)時代維基百科的生產(chǎn)模式
的梳理,并以維基百科的知識生產(chǎn)為例,總結(jié)出互聯(lián)網(wǎng)新時代知識生產(chǎn)的新范式。關(guān)鍵詞:互聯(lián)網(wǎng);維基百科;生產(chǎn)模式中圖分類號:G211 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-8122(2016)09-0094-02一、網(wǎng)絡(luò)的發(fā)展對知識生產(chǎn)的影響截至2015年6月30日,由中國互聯(lián)網(wǎng)信息中心(CNNIC)發(fā)布的《第36次中國互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計報告》顯示,中國總體網(wǎng)民規(guī)模已達(dá)到6.68億,其中半年新增1894萬人;互聯(lián)網(wǎng)普及率達(dá)到48.8%,其中手機(jī)網(wǎng)民5.94億,占網(wǎng)
今傳媒 2016年9期2016-10-15
- 學(xué)術(shù)、理想、財產(chǎn)
對新的知識。維基百科(Wikipedia)是我的悲劇。當(dāng)然,我有時也上這個網(wǎng)站,不過查維基百科經(jīng)常讓我非常失望。維基百科上的項(xiàng)目和資料好像是學(xué)生編輯的。我不反對學(xué)生搞公開的學(xué)術(shù),我也跟他們合作。如果要發(fā)表我和學(xué)生一起研究的成果,都會署上他們的名字。如果有稿費(fèi)我跟他們分:各百分之五十。這樣才公平。學(xué)生滿意嗎?學(xué)生非常滿意。我呢?我感覺不到什么剝削人的內(nèi)疚,就好了。聽說有些老師利用他們學(xué)生的勞動,讓學(xué)生為自己搞研究工作,然后只用他們自己的名字發(fā)表,也不給學(xué)生錢
南方周末 2016-09-222016-09-22
- 基于維基百科的領(lǐng)域本體自動構(gòu)建方法研究
44)?基于維基百科的領(lǐng)域本體自動構(gòu)建方法研究吳潔明劉雁昆段建勇(北方工業(yè)大學(xué)計算機(jī)學(xué)院北京 100144)摘要隨著互聯(lián)網(wǎng)的發(fā)展,本體被廣泛應(yīng)用于知識工程、信息檢索等領(lǐng)域。傳統(tǒng)的本體構(gòu)建方法無法滿足日益增長的需求,提出一種基于維基百科的領(lǐng)域本體構(gòu)建方法。通過提取維基百科的知識體系和知識屬性,實(shí)現(xiàn)原始領(lǐng)域本體的自動化構(gòu)建。提出的一種與路徑無關(guān)的矢量方差方法,通過計算領(lǐng)域中每一個分類和條目的所屬度,選擇所屬度大于閾值的分類和條目作為領(lǐng)域本體的內(nèi)容,然后挖掘每個
計算機(jī)應(yīng)用與軟件 2016年7期2016-08-05
- immy Wales: I Don’t Regret Not Monetising Wikipedia吉米?威爾士:維基百科的“窮”掌門
盆滿缽盈。而維基百科的聯(lián)合創(chuàng)始人吉米·威爾士卻是一個例外。作為一個由全球志愿者共同編寫的網(wǎng)絡(luò)百科全書,維基百科不收費(fèi)、不刊登廣告,僅僅依靠公眾和企業(yè)的捐贈來維系日常運(yùn)營。如此,就不難理解為何吉米·威爾士是“世界知名的互聯(lián)網(wǎng)企業(yè)家中唯一一個沒有成為億萬富豪的人”。比起巨額的財富,或許威爾士更在意的是實(shí)現(xiàn)他的夢想——讓地球上每個人都能自由獲取人類全部的知識。 I Dont Regret Not Moneti
新東方英語 2016年7期2016-07-06
- 一種基于維基百科的多語種翻譯詞匯自動抽取方法
章提出一種從維基百科中自動抽取出多語種翻譯詞匯的方法,主要通過在維基百科離線數(shù)據(jù)文件中根據(jù)其文件結(jié)構(gòu)特征進(jìn)行抽取。實(shí)驗(yàn)證明,該方法能夠有效獲取高質(zhì)量的多語種翻譯詞匯?!娟P(guān)鍵詞】多語種翻譯詞匯;信息自動抽?。?span id="j5i0abt0b" class="hl">維基百科【中圖分類號】TP391.3 【文獻(xiàn)標(biāo)識碼】A 【文章編號】1674-0688(2016)07-0129-050 引言隨著世界經(jīng)濟(jì)一體化的進(jìn)展,各國之間互聯(lián)網(wǎng)交流更為廣泛、頻繁,互聯(lián)網(wǎng)信息的多語種特點(diǎn),給交流帶來的語言障礙日顯突出。為解決語言障礙
企業(yè)科技與發(fā)展 2016年7期2016-05-30
- 淺析利用維基百科開展中國政治話語對外傳播的可行性
路徑。本文以維基百科為例,試圖分析中國政治話語傳播開拓“維基模式”的可行性。一、維基百科的影響及特點(diǎn)維基百科由非營利性質(zhì)的維基媒體基金會負(fù)責(zé)管理。歷經(jīng)15年的積累和運(yùn)營,維基百科共收錄了超過3000萬篇條目,而其中英語維基百科已超過450萬篇,條目在數(shù)量上排名第一。據(jù)統(tǒng)計,維基百科大約有3.5億名登記注冊用戶,最高峰時曾擁有8萬名編輯。目前維基百科一共有290種語言版本,其中英語、德語、法語和荷蘭語這四種語言版本已經(jīng)有超過100萬篇條目,而意大利語、波蘭語
對外傳播 2016年6期2016-05-14
- 聚沙成塔:維基百科上億次編輯行為的驚人力量
譯聚沙成塔:維基百科上億次編輯行為的驚人力量阿德里安娜·拉弗朗斯(Adrienne LaFrance)白 蓮/譯選自美國《大西洋月刊》雜志 2016年3月16日是什么驅(qū)使著幾十萬志愿者自發(fā)參與建造廣受各國公眾信任的在線百科全書?在維基百科英文版篇幅最長的50篇文章中,你可以找到關(guān)于彗星、美國國家鐵路客運(yùn)公司站點(diǎn)、沉船、小說中的宇航員,以及邪典電影(Cult Film)的列表。另外,有關(guān)巴爾的摩的歷史時間線、不同國家的電動車使用情況、槍支、荷蘭的發(fā)明,還有珍
國外社會科學(xué)前沿 2016年7期2016-03-15
- 基于不同語義資源的詞語相似度算法綜述
;語義資源;維基百科DOI:10.16640/j.cnki.37-1222/t.2016.05.2111 引言隨著云時代的來臨,大數(shù)據(jù)越來越受人們關(guān)注。伴隨著辦公室無紙化推行,人們逐漸習(xí)慣于利用計算機(jī)進(jìn)行數(shù)字化處理數(shù)據(jù),自然語言處理的研究也飛速發(fā)展。詞語是自然語言處理的最小單位,詞語相似度的計算在自然語言處理的各個領(lǐng)域占有很重要的地位。詞語相似度計算研究的是計算兩個詞語相似度的方法,詞語之間有著非常復(fù)雜的關(guān)系,應(yīng)用中常常將這種復(fù)雜的關(guān)系用簡單的數(shù)量來度量。
山東工業(yè)技術(shù) 2016年5期2016-03-04
- 基于維基百科的語義相關(guān)度算法研究綜述
多研究都證明維基百科是計算語義相關(guān)度的一個好資源。最先利用維基百科進(jìn)行語義相關(guān)度研究的是STRUBLE M和 PONZETTO S P[1],他們把應(yīng)用在 Word-Net上效果比較好的一些經(jīng)典算法應(yīng)用到維基百科中,實(shí)驗(yàn)結(jié)果表明,在大數(shù)據(jù)集上,在維基百科的效果要好于在 WordNet的效果。隨后,ZESCH J和 GUREVYC I[2]對維基百科的分類圖和文檔圖進(jìn)行了圖論分析并與GermaNet進(jìn)行了比較,同樣證明了維基百科可以作為一種語義知識資源代替一
網(wǎng)絡(luò)安全與數(shù)據(jù)管理 2015年14期2015-09-21
- 基于維基百科的本體構(gòu)建研究
003)基于維基百科的本體構(gòu)建研究李勇 (解放軍外國語學(xué)院,洛陽471003)維基百科作為一個多語種的大型知識庫,正逐漸被人們應(yīng)用于不同的領(lǐng)域。剖析維基百科的基本結(jié)構(gòu),分析對從信息盒、類別結(jié)構(gòu)和定義句中獲取本體概念和實(shí)例的相關(guān)原理和方法,闡述利用維基百科獲取本體關(guān)系的原理,分析基于規(guī)則匹配、機(jī)器學(xué)習(xí)和認(rèn)知科學(xué)的關(guān)系抽取方法。本體構(gòu)建;維基百科;概念;關(guān)系0 引言本體(Ontology)在哲學(xué)上是對客觀存在事物的系統(tǒng)解釋和說明。在計算機(jī)科學(xué)中的定義是由Gru
現(xiàn)代計算機(jī) 2015年11期2015-09-18
- 政府單位與公有領(lǐng)域的圖片
調(diào)自由版權(quán)的維基百科,已成為全球媒體暨出版單位的科技圖片重要來源。維基百科的圖片主要可分為三大類:公有領(lǐng)域、維基共享資源、GNU自由文件授權(quán)條款。公有領(lǐng)域部份,包括政府單位所提供圖片。本文檢視維基百科之美國太空總署(NASA)、俄羅斯聯(lián)邦航天局、歐洲太空總署等九個航天單位條目,發(fā)現(xiàn)只有NASA釋出公有領(lǐng)域圖片。可見美國之所以主導(dǎo)全球科學(xué)傳播,和美國政府的開放、大器有關(guān)。美國歷次航天任務(wù)NASA皆釋出大量高分辨率圖片,供全球媒體及出版單位自由使用,其他國家的
科學(xué)文化評論 2015年5期2015-05-30
- 英議員為選舉篡改百科詞條
國多名議員的維基百科詞條在議會大選前遭到刪改,“篡改者”就位于英國議會大廈內(nèi)。據(jù)英國《獨(dú)立報》26日報道,10多個有關(guān)現(xiàn)任議員的維基百科詞條曾在大選前夕被人在線編輯,許多涉及議員丑聞的文字“神秘消失”,包括虛報開支、婚外情和犯罪記錄等。一些頁面還增加了許多“額外內(nèi)容”,比如宣揚(yáng)某某議員在選區(qū)內(nèi)如何努力工作的文字,以及“正面宣傳”的媒體鏈接。通過追溯IP地址,電腦專家發(fā)現(xiàn)詞條編輯者就來自英國議會大廈內(nèi)部,但目前尚未發(fā)現(xiàn)牽涉到議員的直接證據(jù)。維基百科的互動性準(zhǔn)
環(huán)球時報 2015-05-272015-05-27
- 關(guān)于在我國發(fā)展眾籌融資模式的思考
ding)在維基百科中被定義為透過網(wǎng)絡(luò)平臺展示宣傳計劃內(nèi)容、創(chuàng)意作品,并與大眾解釋讓此作品量產(chǎn)或?qū)崿F(xiàn)的計劃。有興趣支持、參與及購買的群眾,可借由“贊助”的方式,讓此計劃、設(shè)計或夢想實(shí)現(xiàn)。在一定的時限內(nèi),完成事先設(shè)定募資的金額目標(biāo)后即為募資成功,可以開始進(jìn)行計劃。endprint眾籌融資(Crowdfunding)在維基百科中被定義為透過網(wǎng)絡(luò)平臺展示宣傳計劃內(nèi)容、創(chuàng)意作品,并與大眾解釋讓此作品量產(chǎn)或?qū)崿F(xiàn)的計劃。有興趣支持、參與及購買的群眾,可借由“贊助”的方
消費(fèi)導(dǎo)刊 2014年12期2015-02-13
- 基于維基百科和網(wǎng)頁相似度分析的主題爬行策略
足,提出結(jié)合維基百科和網(wǎng)頁相似度分析的主題爬行策略。利用維基百科分類樹的結(jié)構(gòu)對主題進(jìn)行描述;下載網(wǎng)頁后對網(wǎng)頁進(jìn)行相應(yīng)處理,結(jié)合文本相關(guān)性和Web鏈接分析來計算候選鏈接的優(yōu)先級。實(shí)驗(yàn)表明,該爬蟲搜索結(jié)果與主題相關(guān)度明顯高于傳統(tǒng)爬蟲,爬蟲爬全率有一定提高。該主題爬蟲主題描述方法和爬行策略有一定的推廣價值,尤其在轉(zhuǎn)基因生物領(lǐng)域中,該爬蟲中有一定的創(chuàng)新性。關(guān)鍵詞: 維基百科; 文本相關(guān)性; 鏈接分析; 相似度計算中圖分類號: TN911?34; TP391.4 文
現(xiàn)代電子技術(shù) 2014年20期2014-10-14
- 中文維基百科編輯參與率低的原因分析及對策研究
琳皓摘 要 維基百科是一部具有開放性、自由性、中立性和公眾集體參與編撰的在線百科全書。網(wǎng)絡(luò)百科全書的成功依賴于廣大用戶的積極參與和貢獻(xiàn)。但是,在國內(nèi)維基用戶的編輯參與率不高。論文探討了維基編輯參與率低的原因,有技術(shù)設(shè)施因素、網(wǎng)民心理因素和管理制度因素。針對其原因,提出了相應(yīng)對策:降低門檻,讓人們?nèi)腴T不難;提供服務(wù)滿意度,激發(fā)興趣回報社區(qū);完善激勵機(jī)制,精神和物質(zhì)雙重獎勵。關(guān)鍵詞 維基百科 在線編輯 網(wǎng)絡(luò)百科全書 網(wǎng)民心理分類號 G250.73維基百科(Wi
新世紀(jì)圖書館 2014年5期2014-07-16
- 維基百科與美國學(xué)生期末作業(yè)
■王卓一維基百科與美國學(xué)生期末作業(yè)■王卓一美國大學(xué)生 資料圖片安妮·舒格在讀高中時,一直被告誡不要凡事都去查維基百科。她的老師評價維基百科說,這個被廣泛應(yīng)用的百科全書網(wǎng)站“并不嚴(yán)肅,不值得信任”,只能在完成學(xué)業(yè)之外看看。但最近,美國大學(xué)的春季學(xué)年行將結(jié)束,剛剛在加州波莫納大學(xué)讀完大一的舒格卻驚訝地發(fā)現(xiàn),美國政治課老師布置的期末作業(yè),不是傳統(tǒng)的寫論文,而是為維基百科撰寫詳細(xì)的條目,這項(xiàng)特殊的期末作業(yè)占到了他們這些學(xué)生本學(xué)期35%的評分。高校試點(diǎn):提高詞條質(zhì)量
教育 2014年7期2014-06-07
- 維基百科中爭議性文章的發(fā)現(xiàn)方法研究
ger創(chuàng)建的維基百科英文版開始運(yùn)行。截止2010年3月,英文維基百科已經(jīng)擁有320萬個條目,成為條目數(shù)最多的語言版本,除英文外,還包含了其他多達(dá)271種語言,總條目數(shù)達(dá)到1 500萬個,總注冊用戶超過2 200萬人,總編輯次數(shù)突破8.6億次。維基百科各語言版本發(fā)展并不均勻,其中條目總數(shù)前15名的語言版本占總條目的71%[1]。一項(xiàng)由Nature雜志于2005年的調(diào)查數(shù)據(jù)顯示,維基百科中科學(xué)技術(shù)相關(guān)主題的準(zhǔn)確程度與大不列顛百科全書中的對應(yīng)詞條基本一致[2]。
中文信息學(xué)報 2014年4期2014-02-28
- IBM的監(jiān)視
張小失維基百科是互聯(lián)網(wǎng)上的一個熱門站點(diǎn),它就像一部電子詞典,介紹各種門類的知識,你也許并不在乎它,可是,IBM在乎它,專門派人跟蹤維基百科,為的只是監(jiān)視一個詞條:IBM。為什么?因?yàn)镮BM需要了解自己。因?yàn)镮BM認(rèn)為,未來的年輕人將更多地通過維基百科了解IBM,而不是通過IBM來了解IBM。而維基百科并不是一成不變的,它能夠隨著事物的發(fā)展變化而不斷地修改詞條,更新內(nèi)容。所以,IBM需要跟蹤、監(jiān)視維基百科,為的是掌握自己在這個世界上的形象。難道IBM不比維基
意林 2014年2期2014-02-11
- 中文維基百科編輯參與率低的原因分析及對策研究
中文維基百科編輯參與率低的原因分析及對策研究黃琳皓維基百科是一部具有開放性、自由性、中立性和公眾集體參與編撰的在線百科全書。網(wǎng)絡(luò)百科全書的成功依賴于廣大用戶的積極參與和貢獻(xiàn)。但是,在國內(nèi)維基用戶的編輯參與率不高。論文探討了維基編輯參與率低的原因,有技術(shù)設(shè)施因素、網(wǎng)民心理因素和管理制度因素。針對其原因,提出了相應(yīng)對策:降低門檻,讓人們?nèi)腴T不難;提供服務(wù)滿意度,激發(fā)興趣回報社區(qū);完善激勵機(jī)制,精神和物質(zhì)雙重獎勵。維基百科在線編輯網(wǎng)絡(luò)百科全書網(wǎng)民心理維基百科(W
新世紀(jì)圖書館 2014年5期2014-02-09
- 基于中文維基百科的詞語語義相關(guān)度計算
h提出的基于維基百科的顯性語義分析(Explicit Semantic Analysis,ESA)方法[4],對中文詞語之間的語義相關(guān)度進(jìn)行計算。將詞表示為帶權(quán)重的概念向量,計算目標(biāo)詞語之間的相關(guān)性就轉(zhuǎn)化為比較相應(yīng)的概念向量。本研究選取的概念由中文維基百科文章明確定義,即將指定的中文維基百科的一個頁面作為一個概念,引入概念(頁面)的先驗(yàn)概率,利用維基百科詞條的詞頻信息和頁面之間的鏈接信息對算法進(jìn)行了多種改進(jìn)。實(shí)驗(yàn)結(jié)果表明,引入頁面先驗(yàn)概率因子,能夠明顯改善
中文信息學(xué)報 2013年6期2013-10-15
- 借力HTML5技術(shù)在線多人協(xié)作編輯視頻,維基百科正式邁入視頻時代!
維基百科這家非營利性百科網(wǎng)站近日又有新的動作。五年的測試之后,維基百科終于開始允許所有編輯者自由添加編輯視頻內(nèi)容了。背后的技術(shù)伙伴是Kaltura,采用了基于HTML5的視頻播放技術(shù)。雖然此前用戶也可以在維基百科中的文章里添加視頻,而且各地的廣播公司也曾向維基百科和維基資源共享(Wikimedia Commons)捐贈過視頻資源,但是此次同Kaltura的合作則可以讓在線協(xié)作編輯視頻的難度大幅下降,很可能會把維基百科變成網(wǎng)上最大的視頻庫之一。這項(xiàng)計劃最早要
互聯(lián)網(wǎng)天地 2012年12期2012-11-18
- 中文維基百科的結(jié)構(gòu)化信息抽取及詞語相關(guān)度計算方法
的研究課題。維基百科作為一個以開放和用戶協(xié)作編輯為特點(diǎn)的Web 2.0知識系統(tǒng),具有知識面覆蓋度廣,結(jié)構(gòu)化程度高,信息更新速度快等優(yōu)點(diǎn)。維基百科中蘊(yùn)涵有豐富的語義知識,是目前眾多學(xué)者進(jìn)行語義知識獲取研究所青睞的語言資源。近幾年來,國外的許多學(xué)者專家以英文維基百科作為語料庫、語義知識庫,從不同的角度抽取語義知識進(jìn)行研究,取得了很多突破性的成果。Struble 和 Ponzetto最先利用維基百科進(jìn)行了語義相關(guān)度的研究[1]。他們把在WordNet知識庫上效果
中文信息學(xué)報 2012年3期2012-06-29
- 7000網(wǎng)站黑屏抗美國法案
百科全書”的維基百科英文網(wǎng)站18日用“黑屏”的方式抗議美國國會計劃出臺的《網(wǎng)絡(luò)反盜版法案》和《保護(hù)知識產(chǎn)權(quán)法案》。在維基百科的率領(lǐng)下,全球超過7000家網(wǎng)站也在當(dāng)天用同樣的方式“罷工”。雖然在19日各網(wǎng)站恢復(fù)運(yùn)作,但維基百科表示,捍衛(wèi)互聯(lián)網(wǎng)信息自由的斗爭絕不會停止。根據(jù)維基百科的統(tǒng)計,全球超過1.6億網(wǎng)民見證到了這一“前所未見的壯觀場面”。很多人18日一早登錄互聯(lián)網(wǎng)站,發(fā)現(xiàn)自己??吹墓雀杈W(wǎng)站標(biāo)志被涂成了一片黑色。搜索引擎谷歌這次雖然沒有關(guān)閉網(wǎng)站,但將美國網(wǎng)
環(huán)球時報 2012-01-202012-01-20
- 維基百科關(guān)網(wǎng)站抗議反盜版
早做作業(yè)”,維基百科網(wǎng)站創(chuàng)始人吉米·威爾士17日宣布,維基百科將在18日關(guān)閉24小時,以抗議美國新的反盜版法案。據(jù)英國廣播公司報道,威爾士17日在推特上警告說,“維基百科周三要抗議壞法律!”他解釋說,維基百科英文界面將關(guān)閉24小時。他還在聲明中說:“這對我們來說是一個不尋常的行動,同時也為世界人民不能訪問維基感到遺憾。我們只是不能忽視《禁止網(wǎng)絡(luò)盜版法案》和《保護(hù)知識產(chǎn)權(quán)法》侵犯言論自由,并在網(wǎng)絡(luò)審查制度方面為世界開創(chuàng)一個可怕的先例。”威爾士還援引民權(quán)領(lǐng)袖馬
環(huán)球時報 2012-01-182012-01-18
- 基于維基百科類別的文本特征表示
礎(chǔ)上,引入了維基百科的類別體系,將詞進(jìn)行有指導(dǎo)的聚類,即將文本中所有詞映射到維基百科類別上,采用維基百科的類別作為文本表示的特征。目前,維基百科是世界上最大的開放式百科全書,由人工標(biāo)注而成,具有較快的更新速度。維基百科的類別能把表達(dá)不明確的維基百科條目映射為理解能力更強(qiáng)的信息,如:“獅子王”、“美女與野獸”、“米老鼠”都被映射為“迪士尼動畫”這個維基類別,而人們很容易把“迪士尼動畫”和文化、藝術(shù)等主題類別聯(lián)系起來。雖然維基百科可以提供映射信息,其映射條目在
中文信息學(xué)報 2011年2期2011-06-28
- 基于維基百科的多文檔自動摘要系統(tǒng)研究*
就會更精確。維基百科是目前世界上最大的面向互聯(lián)網(wǎng)開放式的多語種百科全書,它的基本組成單元是“詞條”,每一個詞條都對應(yīng)一個維基頁面。根據(jù)BBC報道,通過測驗(yàn)證實(shí),維基百科在科技方面與《大英百科全書》一樣準(zhǔn)確[2]。因此,本文利用維基百科作為提供背景信息的外部資源。對于給定的關(guān)鍵詞搜索得到其對應(yīng)的維基百科頁面,選取與文檔集主題關(guān)聯(lián)度高的那部分內(nèi)容,通過與文檔集比對來縮小摘要句的選取范圍,并用這部分內(nèi)容對文檔集里的句子進(jìn)行過濾,提高為主題生成的最終摘要的精確度。
網(wǎng)絡(luò)安全與數(shù)據(jù)管理 2011年16期2011-05-14
- 維基百科的成長困境
想起來,期望維基百科能永遠(yuǎn)向前馳騁,實(shí)屬天真。自2001年成立以來,這個用戶編寫的網(wǎng)上百科全書就和網(wǎng)上任何其它東西一樣,以指數(shù)級擴(kuò)張。截止到兩年前,維基用戶平均每天為百科新增約2200篇文章;2007年9月,英文文章的數(shù)量已經(jīng)達(dá)到200萬篇,2009年8月更是達(dá)到了300萬,超過了中國擁有600年歷史的《永樂大典》,成為一般綜合知識的最大的集成者(至少維基百科自己的首頁上是這么說的)。但在2007年初,一些奇怪的事情發(fā)生了:維基百科的成長線放平緩了。人們突
網(wǎng)絡(luò)傳播 2009年11期2009-11-18
- 專業(yè)化分工與交易費(fèi)用控制的共贏
雅懷[摘要]維基百科大規(guī)模協(xié)作模式與基于雇傭關(guān)系的傳統(tǒng)合作相比具有自己的諸多特色,它在表面上與傳統(tǒng)經(jīng)濟(jì)理論具有明顯的矛盾,但深入的分析卻揭示了這兩者本質(zhì)上的契合。維基百科大規(guī)模協(xié)作模式看似漫不經(jīng)心的松散的大規(guī)模協(xié)作不是非專業(yè)化成功的典范,恰恰相反,它是專業(yè)化與交易費(fèi)用控制雙贏的例證。這一新模式對于正在尋求轉(zhuǎn)型方向與路徑的傳統(tǒng)企業(yè)具有重大的啟示意義與廣泛的應(yīng)用前景。[關(guān)鍵詞]維基百科;大規(guī)模協(xié)作;專業(yè)化;交易費(fèi)用控制[作者簡介]盧軍,長江大學(xué)政法學(xué)院副教授,
學(xué)術(shù)論壇 2009年6期2009-08-12
- 《維基百科》的特性及影響
白崇遠(yuǎn)摘要《維基百科》是近年來在互聯(lián)網(wǎng)上迅速發(fā)展起來的一種具有全新運(yùn)作模式和知識交流方式的新型開放互動式網(wǎng)絡(luò)百科全書。本文介紹了《維基百科》的發(fā)展概況、基本原理和分類體系結(jié)構(gòu),分析了維基百科全書的六大基本特征,并探討其對傳統(tǒng)百科全書所產(chǎn)生的影響。關(guān)鍵詞《維基百科》Wiki網(wǎng)絡(luò)百科全書開放互動傳統(tǒng)百科全書無不以恢弘龐大的卷帙、嚴(yán)謹(jǐn)細(xì)密的編纂結(jié)構(gòu)、強(qiáng)大專業(yè)的編寫隊(duì)伍著稱于世。然而,近年來隨著互聯(lián)網(wǎng)的高速發(fā)展,一種全新思路和運(yùn)作模式的開放互動式網(wǎng)絡(luò)百科全書蓬勃發(fā)
辭書研究 2009年2期2009-04-26
- 維基百科拒絕中國網(wǎng)絡(luò)審查制度
爾翻譯:曹謙維基百科,一個多語言版本的自由百科全書協(xié)作計劃,互聯(lián)網(wǎng)上最受歡迎的參考資料查詢網(wǎng)站.卻一直拒絕服從中國政府的審查制度。吉米·威爾士,時代周刊評選出的最具影響力100人之一,正在挑戰(zhàn)包括Google在內(nèi)的其他網(wǎng)絡(luò)公司,他要證明維基百科的要求在網(wǎng)絡(luò)公司與中國政府的協(xié)同操作下對中國將會是利大于弊。維基百科,這個在西方最受歡迎的網(wǎng)絡(luò)工具,自2005年10月在中國被禁止使用。然而Google、微軟和雅虎在接受了中國政府的審查制度后被允許使用。威爾士認(rèn)為,
中國經(jīng)貿(mào) 2006年10期2006-10-31