編者按:如果時光倒流回二十年前,五筆字型和WPS就代表了計算機。在當(dāng)時網(wǎng)絡(luò)還不普及的時代,能在計算機上打出一串串文字,就代表了你是一個計算機高手。而現(xiàn)在我們整天都在鍵盤上敲敲打打,把心里的想法變成文字。可大家有沒有想過,為什么敲擊鍵盤可以輸入文字呢?除了鍵盤,有沒有其他辦法輸入文字呢?甚至意識是不是能控制計算機呢?在此,主持人和嘉賓將分兩期對這一問題進(jìn)行深入探討。
主持人:
陳 捷 廣東省四會中學(xué)
嘉 賓:
金 琦 浙江師范大學(xué)附屬中學(xué)
邱元陽 河南省安陽縣職業(yè)中專
輸入的“速度與激情”
在當(dāng)今社會,“又好又快”幾乎成了人類完成各項任務(wù)的基本準(zhǔn)則。時光回溯,從最早的穿孔紙帶到后來得到人們普遍推廣的鍵盤輸入或者高級語音讀入等都可看出一點:人們在致力于更改輸入方式以方便各類人群使用的同時,也積極不懈地鉆研如何提高輸入的速度。特別是在各種輸入技術(shù)異軍突起的今天,不同個體的輸入需求幾乎都得到了滿足。所以,創(chuàng)造者們的開發(fā)激情就更加傾向于后者。如何在日益注重效率的現(xiàn)代化發(fā)展時期占據(jù)一席之地,贏得這個充滿激情的比賽?輸入也有“速度與激情”?我們嚴(yán)陣以待!
陳捷:硬件優(yōu)化——為愛車提一個檔次
看過電影《速度與激情》的朋友們都知道,一部亮瞎觀眾眼的跑車在電影里絕對是百分之百的點睛之筆。如果主人公駕駛一輛奇瑞QQ在迪拜塔上穿來穿去,這是一萬個畢加索也不能畫出的詭異??梢姡徊亢密囀菦Q定勝負(fù)的關(guān)鍵,同理,磨刀不誤砍柴工,要提高輸入速度,優(yōu)化的硬件條件也是不可或缺的。下面將以鍵盤和手寫板為例說明硬件優(yōu)化對輸入速度提高所發(fā)揮的作用。
1.鍵盤優(yōu)化
為什么鍵盤鍵位這么安排?早在1714年,打字機上就出現(xiàn)了鍵盤。在1868年,克里斯托夫·拉森·肖爾斯獲得了打字機模型專利,幾年后又首次規(guī)范了鍵盤,也就是現(xiàn)在的QWERTY鍵盤。
很多人開始學(xué)習(xí)使用鍵盤時會覺得奇怪,為什么每個鍵都處于這么奇怪的位置?不能按字母順序排列嗎?這樣會不會大大降低學(xué)習(xí)成本?原來,最早的打字機的鍵盤就是按照字母順序排列的,但打字機是全機械結(jié)構(gòu),如果打字速度過快,某些鍵的組合很容易出現(xiàn)卡鍵問題,于是肖爾斯將最常用的幾個字母安置在相反方向,最大限度避免卡鍵,取得了良好的效果。從此QWERTY鍵盤開始流行。
現(xiàn)在的機械技術(shù)已大大提高,肯定不會出現(xiàn)卡鍵的現(xiàn)象。那么鍵盤鍵位安排能不能進(jìn)一步改進(jìn)?1936年,August Dvorak教授設(shè)計了德沃拉克(DVORAK)鍵盤方案。DVORAK鍵盤布局原則是:①盡量左右手交替擊打,避免單手連擊;②越排擊鍵平均移動距離最??;③排在導(dǎo)鍵(食指)位置處的應(yīng)是最常用的字母。這種方案按照理想化的擊鍵率分布設(shè)計,打字速度提高了近乎一倍。但是,因為QWERTY鍵盤如此深入人心,大家都不愿意為此改變使用習(xí)慣,所以只有極少數(shù)專業(yè)場合使用DVORAK鍵盤。
2.手寫板優(yōu)化
手寫繪圖輸入設(shè)備對計算機來說是一種輸入設(shè)備,最常見的是手寫板,其作用和鍵盤類似。當(dāng)然,基本上只局限于輸入文字或者繪畫,也帶有一些鼠標(biāo)的功能。在手寫板的日常使用上,除用于文字、符號、圖形等輸入外,還可提供光標(biāo)定位功能,從而使手寫板可以同時替代鍵盤與鼠標(biāo),成為一種獨立的輸入工具。手寫板先后經(jīng)歷了三次重要變革。
第一代電阻手寫板:電阻手寫板主要由兩層薄膜構(gòu)成,其中上層薄膜可以輕微變形,下層固定不動。用手寫筆觸壓上層薄膜并使之變形時,會與下層的薄膜接觸,這樣就可以判斷手寫筆的軌跡了。雖然工作原理簡單、成本低廉,但使用者必須用力書寫才能有較好的識別效果。這樣一來,用的人很累,手寫板也容易損壞,因此很快就被淘汰了。
第二代電容手寫板:電容手寫板在技術(shù)上做了很多改進(jìn),但使用時仍需用力書寫,因此沒有得到市場的廣泛認(rèn)可。
第三代電磁手寫板:電磁手寫板采用了目前最先進(jìn)的電磁壓感技術(shù),使用時即使手寫筆沒有接觸手寫板,計算機也能感應(yīng)到手寫筆的位置,記錄書寫的筆跡。這意味著在單位時間里用戶可以書寫更多的內(nèi)容,大大提高了使用者的輸入速度,同時手寫板的使用壽命也延長了不少。
邱元陽:識別判斷——你的專用衛(wèi)星導(dǎo)航
一部好車是贏得比賽的充分條件,但不是必要條件。車再好,不會走、走錯路也是白搭,一不小心還會遇到世紀(jì)大塞車。所以,我們需要一個專業(yè)的衛(wèi)星導(dǎo)航系統(tǒng),為我們識別各種路面情況,從而決策出可行之路。同理,各種設(shè)備的輸入信號,最終都需要計算機能夠識別出來才會有意義,因此各種新型的輸入方式,實際上就是識別能力的比拼。精準(zhǔn)的輸入識別判斷能力,是我們獨一無二的分析系統(tǒng),提高識別能力有助于更加精準(zhǔn)判斷。
1.文字識別
除了傳統(tǒng)的鍵盤打字,還有手寫輸入、語音輸入、光電識別等,但由于它們在效率和識別率上還存在很多問題,所以仍然需要不斷地改進(jìn)。
手寫輸入的識別已經(jīng)達(dá)到很高的程度了,它成熟地應(yīng)用于手機、平板、手寫筆等設(shè)備上。但手寫輸入的效率仍然不高,輸入很慢,主要使用群體是不會打字的老年人。
光電識別(OCR)經(jīng)過這么多年的發(fā)展,已經(jīng)非常成熟了,而且不再依賴于掃描儀掃描圖片,可直接用手機拍照,針對現(xiàn)有的圖片甚至PDF文檔等,都可以完成文字識別,識別率也能讓人滿意。但是目前對復(fù)雜背景下文字的識別、特殊字體文字的識別、手寫稿文字的識別,還有很多問題沒有完全解決。例如,有些彩色文稿,文字和背景看起來區(qū)分非常明顯,但是在黑白和灰度模式下,它們卻可能沒有任何區(qū)別,完全混為一體了,甚至在圖像處理軟件中進(jìn)行閾值調(diào)整都無法分開,識別軟件往往就更無能為力了。
值得一提的是,對有些特殊的圖案,軟硬件可能會拒絕掃描、復(fù)印和打印。例如,錢幣,在一些掃描儀和打印機、復(fù)印機上,以及Photoshop等軟件上,就會拒絕進(jìn)行掃描、復(fù)印、打印操作。這是因為各國新版紙幣都統(tǒng)一使用了一種名為“EURion星座”的不易覺察的小記號,由五個圓環(huán)按照獵戶星座(Orion)排列,在紙幣上多處分布,最早在10歐元(EUR)紙幣上使用。例如,施樂復(fù)印機就是如此,當(dāng)發(fā)現(xiàn)這種記號后便拒絕打印、復(fù)印,以提高對制造假鈔的防范。
2.語音識別
語音輸入目前也已經(jīng)廣泛使用,百度網(wǎng)站的手機版上,就可以直接用語音來輸入要搜索的內(nèi)容,系統(tǒng)會自動識別成文字。QQ的語音輸入中,也有語音識別功能,方便計算機用戶不能聽到聲音時直接翻譯成文字。微軟的Windows系統(tǒng)和Office軟件也都集成了語音輸入功能,不僅能進(jìn)行語音識別,還能直接使用語音指令,以及把文字朗讀為語音。國外的IBM、國內(nèi)的科大訊飛,都是語音識別領(lǐng)域的佼佼者。TTS引擎還可以被第三方軟件直接使用,實現(xiàn)計算機語音功能。例如,“朗讀女”軟件,本身就非常小,只是借用了現(xiàn)成的TTS來進(jìn)行語音合成,當(dāng)然這還需要一定音色和語言的語音庫,語音庫就非常大了,如果再需要男聲、女聲、童聲,不同人的音色,甚至不同的方言,語音庫就需要很多個。目前的TTS已經(jīng)非常成熟,效果接近人聲,但是語調(diào)、音變、連讀等還不盡人意,仍有生硬的機器感。
無論是文字轉(zhuǎn)換成語音,還是語音轉(zhuǎn)換成文字,在語音輸入的領(lǐng)域之外,也還有其他用武之地。例如,將會議錄音、采訪錄音、評書播音等內(nèi)容快速整理成文字,以及計算機配音、機器對話、電子朗讀等。
3.圖像識別
相較前兩種識別方式而言,圖像信號的識別要復(fù)雜一些,因此常常可以作為一種安全機制。圖像輸入一般通過攝像頭、掃描儀、數(shù)位板、指紋器等設(shè)備實現(xiàn),一般的圖片不需要識別,特殊情況下才需要識別。例如,指紋識別、人臉識別、瞳孔識別等,這些特征因為不容易模仿和造假,可以作為安全措施采用,廣泛應(yīng)用于考勤、門禁、加解密等領(lǐng)域。圖像識別是采用圖像比對的方式進(jìn)行的,寬嚴(yán)尺度通??梢栽O(shè)定,閾值設(shè)置高,識別控制嚴(yán),但可能會造成經(jīng)常識別不通過;閾值設(shè)置低,識別率高,但可能造成誤識別,形成安全漏洞。
一般的圖像輸入設(shè)備,都是接收光信號,一次成像,但數(shù)位板和一些指紋識別器卻例外,它們接收的不是光信號,而是壓力感應(yīng)。這個特點可以使數(shù)位板模擬真實的運筆壓力,從而還原繪畫圖案,在CG領(lǐng)域廣泛使用。熟練的設(shè)計師可以像在紙上一樣,在數(shù)位板上進(jìn)行草圖創(chuàng)作,后期再進(jìn)行計算機處理。
金琦:輸入法改良——你會抄小路嗎
從A到B的路徑不止一條,選擇最短的路徑可以讓我們更快到達(dá)目的地。同樣,對于不同文字的輸入,使用不同的輸入法就相當(dāng)于選擇了不同的方向和不一樣的道路,很大程度上影響了你的平均輸入速度。當(dāng)然,對于那些只有極少由單字復(fù)合而成的語言,鍵盤按鍵的數(shù)量是足以覆蓋單字的范圍的。但對于類似于漢語這樣擁有幾萬個單字的語言,想要使用有限的鍵盤按鍵又快又好地復(fù)合出獨一無二的字形來,一套完整的輸入規(guī)則顯然十分必要。使用不同的輸入法對輸入速度的影響也是巨大的。我們將以漢字輸入為例,詳細(xì)介紹不同的輸入法對輸入速度的影響。
提起中文輸入,這是每個使用計算機的人都必須具備的一項技能,不管是用漢語拼音,還是五筆字型以及各種各樣的輸入法,輸入中文總不像輸入英文那樣方便,這也是每個中國人用計算機時遇到的第一個問題。中文信息處理中的漢字輸入問題一直是國內(nèi)計算機工作者為之付出不懈努力的一個關(guān)鍵問題,由于漢字屬于方塊字,同音字多、字符集大,為計算機漢字的輸入增大了難度,雖然不懈努力的結(jié)果有了從五筆字型的一枝獨秀到后來的“萬碼奔騰”,可以說是前仆后繼,但這個問題到現(xiàn)在也沒有得到徹底解決。
中文輸入有著非常長遠(yuǎn)的歷史,在DOS時代,中國人為了解決計算機處理中文的問題,開發(fā)出了DOS中文系統(tǒng),這種系統(tǒng)的主要功能就是解決漢字的輸入、處理、輸出三大難題,人們在中文輸入方面的研究也花費了大量的精力。中文輸入編碼曾是中國計算機史上的熱點,以至出現(xiàn)了各種各樣的輸入法爭霸天下的局面,特別是1993年、1994年被稱為“萬碼奔騰”的時代。當(dāng)時主要有三種設(shè)計思路,即音碼、形碼和音形碼,五筆字型堪稱形碼中的代表,由于輸入速度快、重碼率低,至今仍一直作為專業(yè)輸入人員的首選,其他一些如鄭碼、錢碼、肖碼、太極碼、黃金碼等,并沒有廣泛流行開來得到應(yīng)用,還有一些方法力圖從輸入技術(shù)上做文章,如數(shù)字小鍵盤輸入、鼠標(biāo)輸入等。總之,人們對中文輸入的研究一直沒有停步。
1.五筆字型輸入法
解決漢字輸入的一個早期方法是將每一個漢字對應(yīng)一個唯一的四位數(shù)數(shù)字,這就是區(qū)位碼,使用這種方法的人需要大量記憶,可以說是種死記硬背的方法,輸入速度不能滿足要求,與之規(guī)則相似的編碼中還有電報碼等。以五筆字型為代表的輸入方式是通過機械的方式對筆型進(jìn)行編碼,俗稱型碼,它將通過拆分后的漢字字根分布在英文鍵盤的每一個鍵上并盡可能地減少重碼,為了大量地輸入漢字提高輸入速度,人們不得不記住許多枯燥的規(guī)則,這種方法適合專業(yè)的錄入人員使用,能極大地提高錄入速度,但對一般的計算機使用者來說,它的學(xué)習(xí)難度較其他方法要大很多,必須經(jīng)過專門的培訓(xùn)才能真正掌握,而且一旦長時間不用很容易忘記。五筆字型一度成為人們熱衷學(xué)習(xí)的輸入技術(shù),甚至學(xué)習(xí)五筆字型也被異化為學(xué)習(xí)計算機技術(shù)的代名詞。
2.拼音輸入法
當(dāng)然,最基本、也是最普遍使用的還是依照漢語拼音規(guī)則制定的拼音輸入法。漢語拼音是一種標(biāo)準(zhǔn)的而且是人人掌握的漢字注音方式,所以在計算機漢字輸入方面的使用極為普遍,盡管其存在輸入速度慢、各地方言發(fā)音不準(zhǔn)等問題,但在實際的計算機使用中還是起到了巨大的作用。
后來出現(xiàn)了在拼音的基礎(chǔ)上帶有智能化特色的智能拼音輸入方法,采用人們普遍熟悉的拼音作為基本的編碼,融入適當(dāng)?shù)闹悄芄δ?,大大方便了普通用戶的使用,最為典型的是北京大學(xué)朱守濤開發(fā)的智能ABC輸入方法,它充分利用計算機的處理能力,讓它去適應(yīng)人的習(xí)慣,其具有的自動記憶、模糊匹配等特點大大降低了拼音輸入固有的重碼多的問題,使拼音真正成為一種簡單實用的輸入法,因此在中文Windows系統(tǒng)中,將它作為最基本的漢字輸入法。
3.智能輸入法
隨著計算機計算能力的逐步提高,智能輸入技術(shù)漸漸浮出水面,以前以單字、詞組方式進(jìn)行輸入的拼音,現(xiàn)在已經(jīng)能夠以整句輸入的方式來實現(xiàn),在計算機智能技術(shù)的幫助下,漢語拼音輸入的重碼問題得到了比較徹底的解決,輸入效率大大提高。由于中文語言的千變?nèi)f化,整句智能輸入的開發(fā)涉及語言學(xué)、計算機人工智能等多個領(lǐng)域,開發(fā)難度極大,國內(nèi)外軟件公司都將其作為一個發(fā)展方向來進(jìn)行研究。微軟中國公司投入大量的精力,研究微軟智能拼音;搜狗公司也推出了整句輸入的搜狗輸入法?,F(xiàn)在要提的是另一款前輩。中文之星對智能輸入的研究早在1992年就開始了,早期在中文之星2.0版本中推出的新全拼輸入法,一直被消費者津津樂道,其原理基本上與智能ABC類似,其在輸入的流暢性和智能化用戶詞庫方面做了很多改進(jìn)。1997年中文之星公司成功研制出了CLM(中文語言模型)技術(shù),這是一個分析了多達(dá)100億字的語言材料后所得到的智能技術(shù),使智能整句輸入邁上了一個新臺階。
拼音輸入技術(shù)走過了單字、詞匯的發(fā)展歷程,開始向整句智能輸入方向發(fā)展;手寫輸入在解決了單字識別率、手寫體識別后,人們開始要求速度和簡化操作過程,語音識別輸入方面在力圖打破地域限制的同時,對輸入準(zhǔn)確性和使用方便性的要求也越來越高。可以預(yù)計,由于智能技術(shù)帶來的諸多便利,越來越多的計算機使用者將采用智能輸入技術(shù),這不僅可以大大增進(jìn)計算機人機界面的友善性,而且還可以提高使用效率。隨著智能軟件、智能電子產(chǎn)品的普及,中文輸入這一最基本的計算機應(yīng)用領(lǐng)域,也會向前邁出一大步。
邱元陽:人車合一——輸入的未來展望
一直以來,各種輸入方式針對的對象都是計算機,通過各種各樣的接口和外設(shè)實現(xiàn)不同信號的輸入。如果,這個對象改成人呢?
人體同樣具有復(fù)雜的輸入輸出器官。聲帶、舌頭和嘴巴的配合,形成聲音的輸出“設(shè)備”,而耳朵(鼓膜)則充當(dāng)了聲音的輸入“設(shè)備”。不過人體上的“輸出設(shè)備”很少,大部分“外設(shè)”都是“輸入設(shè)備”。當(dāng)把對計算機輸入的控制技術(shù)應(yīng)用到人體時,結(jié)果卻不是我們想象的那么簡單。
人體是生物有機體,不是電子設(shè)備,不能簡單地輸入電子化和數(shù)字化的信號,人體輸入器官最終輸送到大腦的是神經(jīng)脈沖。人的視覺、聽覺、觸覺、嗅覺、痛覺,都是通過人體器官來接收信號,并最終轉(zhuǎn)換為神經(jīng)信號的。大腦通過不同神經(jīng)的脈沖信號,識別各種外界刺激。
生理學(xué)家們做過試驗,一個嬰兒時期因角膜受傷導(dǎo)致完全失明的人,在成年之后對他進(jìn)行復(fù)明手術(shù),移植角膜的技術(shù)當(dāng)時已經(jīng)非常成熟,手術(shù)也非常成功。但是令人意外的是,恢復(fù)視力的這個人,根本看不懂外部世界,只是感受到五顏六色的光線。原來,視覺的形成并不是人眼直接“看”到了外部世界,視網(wǎng)膜上的成像只是通過眾多的視細(xì)胞來接收光信號,并將光信號轉(zhuǎn)換為神經(jīng)脈沖傳遞到大腦,由大腦的視覺中樞進(jìn)行“解碼”識別。而這種識別,是建立在學(xué)習(xí)過程上的,從嬰兒時期開始,逐漸感知外部光線,不斷明確不同光信號的實際意義,最終形成完善的視覺系統(tǒng)。不同的生物物種,其眼睛的結(jié)構(gòu)和可視角度也不相同,但都能對外部世界有正確的反應(yīng)。越是高等的生物,視覺形成的過程越長。心理學(xué)的研究也表明,在幼兒時期過早地讓孩子識字會適得其反,因為孩子的視覺系統(tǒng)還沒有完善,可能在空間上還沒有上下左右的區(qū)分,他們倒著看東西與正著看完全一樣,而成人倒著看東西已經(jīng)不能適應(yīng)了。
試驗中復(fù)明的人,因為缺少視覺學(xué)習(xí)過程,忽然的復(fù)明讓他不知所措,在紛雜的大腦視覺反應(yīng)中,“看”不明白各自代表著什么意義。經(jīng)過一段時間的適應(yīng),他慢慢能夠識別出看到的人臉,能夠區(qū)分開動物和人,能夠區(qū)分物體的映像和純粹的光線反射,再后來能夠通過視覺感知物體的運動,但仍然不能正常行走,常常會被路沿和臺階絆倒,因為他仍然不能區(qū)分圖像中某些輪廓和線條的真正含義,這是需要經(jīng)驗積累和學(xué)習(xí)的。最后,他才慢慢能夠通過視覺圖像估計物體的遠(yuǎn)近(雙眼視差),形成立體視覺和清晰的圖像,視覺系統(tǒng)完成重建,達(dá)到正常人的水平。
視覺依賴的是光信號的輸入,攝像頭可以作為計算機的眼睛,那能否作為人的眼睛呢?科學(xué)家們做了試驗,為成年已經(jīng)有了視覺經(jīng)驗之后失明的人進(jìn)行特殊的手術(shù),“安裝”攝像頭。攝像頭采集的光信號先轉(zhuǎn)換為電信號,通過手術(shù)方式植入志愿者腦部帶有很多電極的電板,對志愿者的視覺中樞進(jìn)行刺激。試驗的結(jié)果讓人振奮,嘗試接通不同位置的電極后,受試志愿者終于感覺到了攝像頭圖像中的強光部分。雖然還遠(yuǎn)遠(yuǎn)沒有達(dá)到看到圖像的程度,但是能夠真切地感受到光線的刺激,這已經(jīng)是很大的突破了。不通過眼睛,而是通過視覺中樞的刺激,來感覺光線,是個了不起的進(jìn)步,目前已經(jīng)做到了讓受試者識別出海面上白色的船帆(體驗描述是一片亮光),相信在不遠(yuǎn)的將來,通過攝像頭來產(chǎn)生視覺、通過麥克風(fēng)來產(chǎn)生聽覺、通過電子鼻來產(chǎn)生嗅覺等都可能成為現(xiàn)實。
陳捷:結(jié)束語
每項新技術(shù)的誕生、發(fā)展、乃至成熟都是一個復(fù)雜及漫長的過程,都是在跟時間比賽。對于輸入技術(shù)的探討也許永不止步,我們這場速度與激情的比賽也將沒有終點。不過,地平線上的風(fēng)景總是最讓人期待的,也就是這份得不到的渴望驅(qū)動我們迎風(fēng)破浪去探索技術(shù)的極致。