賽題背景
書(shū)法是漢字的書(shū)寫(xiě)藝術(shù),是中華民族對(duì)人類(lèi)審美的偉大貢獻(xiàn)。從古至今,有大量照亮?xí)ㄋ囆g(shù)星空的經(jīng)典之作,是中華文明歷經(jīng)漫長(zhǎng)歲月留下的藝術(shù)精華。
這些書(shū)法作品現(xiàn)在仍以各種形式呈現(xiàn)給世人:博物館里的字畫(huà)作品、旅游景點(diǎn)里的碑刻、建筑上的題詞、對(duì)聯(lián)、牌匾,甚至尋常家居里也會(huì)懸掛帶有書(shū)法藝術(shù)的字畫(huà)。在全球化、電子化的今天,書(shū)法的外部環(huán)境有了非常微妙的變化,對(duì)于年輕一代,古代書(shū)法字體越來(lái)越難以識(shí)別,一些由這些書(shū)法文字承載的傳統(tǒng)文化無(wú)法順利傳承。所以利用先進(jìn)的技術(shù),實(shí)時(shí)、準(zhǔn)確、自動(dòng)地識(shí)別出這些書(shū)法文字,對(duì)于記錄整理書(shū)法藝術(shù)和傳播書(shū)法背后的中國(guó)文化有著重要的社會(huì)價(jià)值。
利用人工智能技術(shù),現(xiàn)在的中文識(shí)別已經(jīng)有了很大的突破和極高的準(zhǔn)確率。但是對(duì)于各種真實(shí)場(chǎng)景下(比如國(guó)畫(huà)背景、建筑背景)的非楷書(shū)書(shū)法識(shí)別效果不佳。本次大賽希望征集到優(yōu)秀的、有創(chuàng)意的AI算法,解決這個(gè)問(wèn)題。
任務(wù)描述
書(shū)法是中華民族文化傳承的瑰寶,希望此次大賽能夠通過(guò)人工智能算法實(shí)現(xiàn)書(shū)法文字的自動(dòng)識(shí)別,解決實(shí)際場(chǎng)景中有些書(shū)法文字難以識(shí)別的問(wèn)題,要求參賽者給出測(cè)試數(shù)據(jù)集中每張圖片中文字的位置及對(duì)應(yīng)的內(nèi)容。
本次大賽會(huì)提供已標(biāo)注的訓(xùn)練圖片集供參賽者開(kāi)發(fā)、訓(xùn)練、生成模型和算法,參賽者用開(kāi)發(fā)和訓(xùn)練生成的模型和算法,識(shí)別測(cè)試圖片集中每張圖片書(shū)法文字的內(nèi)容以及文字對(duì)應(yīng)的位置并提交競(jìng)賽平臺(tái),以參賽者提交的結(jié)果準(zhǔn)確率作為競(jìng)賽排名成績(jī)的依據(jù)。
賽題內(nèi)容和方向
這套賽題完全是將傳統(tǒng)文化與人工智能接軌,華為云為所有參賽者提供已標(biāo)注的訓(xùn)練圖片集,參賽者則被推薦應(yīng)用華為云一站式AI開(kāi)發(fā)平臺(tái)ModelArts開(kāi)發(fā)訓(xùn)練生成特定的模型和算法,并憑借這些模型和算法識(shí)別測(cè)試圖片中書(shū)法文字的內(nèi)容及位置,最終以參賽者提交的結(jié)果準(zhǔn)確率作為評(píng)判成績(jī)的標(biāo)準(zhǔn)。
賽題價(jià)值
作為漢字的書(shū)寫(xiě)藝術(shù),書(shū)法是中華民族對(duì)人類(lèi)審美的偉大貢獻(xiàn)。在全球化、電子化的今天,對(duì)于中國(guó)新生代而言,散布在各種場(chǎng)景間的古代書(shū)法字體越來(lái)越難以識(shí)別,一些由這些書(shū)法文字承載的傳統(tǒng)文化無(wú)法順利傳承。針對(duì)這個(gè)問(wèn)題,作為本次大賽的出題方之一,華為云EI(企業(yè)智能)為準(zhǔn)確、自動(dòng)地識(shí)別出辨識(shí)度較低的書(shū)法文字,以便記錄整理書(shū)法藝術(shù)和傳播書(shū)法背后的中國(guó)文化的重要社會(huì)價(jià)值。本賽題聚焦人工智能方向,基于各種真實(shí)場(chǎng)景下(如國(guó)畫(huà)背景、建筑背景)的非楷書(shū)書(shū)法的圖片標(biāo)注,華為云鼓勵(lì)參賽者利用人工智能技術(shù),給出測(cè)試數(shù)據(jù)集中每張圖片中文字的位置及對(duì)應(yīng)內(nèi)容,達(dá)到精準(zhǔn)的識(shí)別。
賽題難點(diǎn)
1.賽題數(shù)據(jù)為模擬古文寫(xiě)作風(fēng)格生成的書(shū)法類(lèi)型的圖片,基本是按照文字豎列標(biāo)注的。讓參賽者在領(lǐng)略傳統(tǒng)中國(guó)文化的同時(shí)系統(tǒng)地應(yīng)用AI技術(shù)。傳統(tǒng)的檢測(cè)和識(shí)別方法可能很難達(dá)到較高的準(zhǔn)確率,建議采用深度學(xué)習(xí)技術(shù)。
2.其中賽題可以分為兩部分,文字檢測(cè)和文字識(shí)別。文字是物體的一種,所以文字檢測(cè)本質(zhì)上屬于物體檢測(cè)的特殊情況。物體檢測(cè)是近年來(lái)人工智能的研究熱點(diǎn),參賽者可以參考通用物體檢測(cè)方法,也可以使用近年來(lái)針對(duì)文字專(zhuān)門(mén)優(yōu)化的檢測(cè)算法。文字識(shí)別則既可以通過(guò)簡(jiǎn)單的物體分類(lèi)算法,也可以使用近年來(lái)發(fā)表的專(zhuān)門(mén)識(shí)別文字切片的算法。
3.賽題評(píng)判標(biāo)準(zhǔn)為文字字段識(shí)別F1值,即參賽者需要同時(shí)保證字段識(shí)別結(jié)果的precision和recall。字符和字段的precision和recall基本成正相關(guān),故而不再單獨(dú)考慮字符識(shí)別結(jié)果F1。文字檢測(cè)結(jié)果的precision和recall則間接影響了識(shí)別結(jié)果,即間接影響了最終得分和排名。