賽迪智庫
智能技術的本質要義進一步豐富,與其它現(xiàn)代信息技術進行交叉融合、深度滲透、廣泛應用,實現(xiàn)技術的一體化、群體化、顛覆性突破,為推動我國產(chǎn)業(yè)體系智能高端、政府治理精準科學、社會服務普惠于民奠定堅實基礎。
2016年是智能技術內(nèi)涵不斷深化、應用初步發(fā)展、產(chǎn)業(yè)生態(tài)開始建立的一年,是政府、企業(yè)、學界、民眾等對智能技術的關注度和認同度逐步升溫的一年。機器學習、機器感知、智能識別、自然語言理解、虛擬現(xiàn)實、區(qū)塊鏈等技術取得重要突破。智能技術的本質要義進一步豐富,與其它現(xiàn)代信息技術進行交叉融合、深度滲透、廣泛應用,實現(xiàn)技術的一體化、群體化、顛覆性突破,為推動我國產(chǎn)業(yè)體系智能高端、政府治理精準科學、社會服務普惠于民奠定堅實基礎。
(一) 信息系統(tǒng)集成化推動智能技術取得重大突破
人工智能(Artificial Intelligence,AI),是利用計算機等信息技術對人的意識和思維的模擬,是研究開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統(tǒng)的一門新技術,屬于計算機科學的一個分支。計算機的技術基礎是集成電路,因此,集成電路也是智能技術的基礎。大規(guī)模集成電路成為信息采集、存儲、傳輸、計算等活動的基本載體。集成電路進步越快,信息的采集、存儲、傳輸、計算能力也就越強,電子產(chǎn)品的智能化程度也就越高。
正是有了集成電路的不斷進步,我們才有了性能強大的計算機,越來越輕薄但是卻更加智能的手機等終端電子產(chǎn)品,有了越來越復雜的信息系統(tǒng),積累了數(shù)量驚人的海量數(shù)據(jù)。基于這些高性能計算機、高速度互聯(lián)網(wǎng)、高智能信息產(chǎn)品的智能技術,才表現(xiàn)得越來越聰明,甚至在很多方面都超過了人的能力。
近年來智能技術的發(fā)展,歸根結底是由集成電路技術的進步所引發(fā)的。摩爾定律是揭示集成電路技術進步速度的一個經(jīng)驗性規(guī)律,是英特爾(Intel)公司的創(chuàng)始人之一戈登·摩爾(Gordon Moore)提出來的。其內(nèi)容為:當價格不變時,集成電路上可容納的元器件的數(shù)目,約每隔18~24個月便會增加一倍,性能也將提升一倍。換言之,每一美元所能買到的電腦性能,將每隔18~24個月翻一倍以上。
20世紀中期以來六十多年的時間里,摩爾定律得到很好的驗證,它大體上比較準確地反映了集成電路技術進步的速度。然而,由于目前制作集成電路的硅晶體管已經(jīng)非常細微,電路線寬已經(jīng)到了20納米以下,接近了原子等級,也達到了物理極限,很難再制造出更細的電路和集成度更高的電路模塊,人們對摩爾定律能否持續(xù)開始懷疑。最近,集成電路領域的專家們對集成電路技術的繼續(xù)進步表現(xiàn)出了新的信心,認為摩爾定律將在未來幾十年繼續(xù)有效。
目前,國內(nèi)在人工智能芯片研制方面取得重大突破。2016年4月,中科院計算所研發(fā)了多用途深度學習芯片—寒武紀3號,支持k-鄰近、k-均值、樸素貝葉斯、線性回歸等10種代表性機器學習算法。寒武紀三號的工藝為65nm級,主頻為1GHz,峰值性達到每秒10560次基本操作,面積3.51mm?,功耗為0.596W。寒武紀對于機器學習算法運算性能與GPU相當,但面積和功耗僅有GPU的百分之一。
寒武紀芯片的設計亮點主要有運算單元設計和存儲層次設計兩方面。一是運算單元設計旨在高效完成機器學習頻繁的運算操作,重點設計了機器運算單元(MLU),分為計數(shù)器、加法器、乘法器、加法樹、Acc和Misc等6個流水線階段。二是存儲層次設計能夠提高機器學習算法中數(shù)據(jù)的片內(nèi)重用,降低片外訪存帶寬需求,重點設計了HotBuf(HB)、ColdBuf(CB)和OutputBuf(OB)3個片上數(shù)據(jù)緩存,分別對應最短重用距離、較長重用距離和輸出數(shù)據(jù)的存放功能。寒武紀與TrueNorth芯片的重要區(qū)別是寒武紀是面向機器學習的神經(jīng)網(wǎng)絡,包括MLP(多層感知機)、CNN和DNN等,用突觸連接的權值表示傳遞的信息;而TrueNorth則是SNN,用脈沖的頻率或者時間表示傳遞的信息。
(二) 機器學習加快平臺化開源化
2016年3月,谷歌公司的機器學習電腦AlphaGO與世界冠軍李世石進行了五場圍棋比賽,AlphaGo以4:1擊敗李世石,引起全世界震驚。AlphaGO通過跟棋手下棋或者和自己對弈的輸贏情況,自主學習下棋經(jīng)驗,找到更加復雜的應對策略。機器學習(Machine Learning, ML)是研究計算機怎樣模擬人類學習行為,讓計算機在沒有事先明確編程的情況下做出正確反應的科學,涉及概率論、統(tǒng)計學、逼近論、凸分析、算法復雜度理論等多門學科。學習是人類獲取新的知識或技能、不斷改善提升自身能力的智能行為。機器學習就是讓計算機像人類一樣具有學習知識和技能從而不斷改進提升的能力。機器學習要綜合應用心理學、生物學和神經(jīng)生理學以及數(shù)學、自動化和計算機科學,結合各種學習方法如機械學習、傳授學習、類比學習、歸納學習、分析學習、事例學習等,從數(shù)據(jù)中自動分析獲得和認知規(guī)律,從而達到不斷自我完善、自我提高的智能境界。
深度學習是機器學習的一個分支,即構建人工神經(jīng)網(wǎng)絡、模仿人腦思維邏輯方法的機器學習。人類的大腦和神經(jīng)系統(tǒng)在處理信息時是分層次和級別的,從低層到高層,其對事務的識別和認知能力就越來越抽象和復雜。深度學習提供了一種更智能的技術方法。一般的機器學習中,為了讓機器具有認知能力,首先是以某種方式提取某個事物的特征,提取方式有時候是人工設計或指定的,有時候是在給定相對較多數(shù)據(jù)的前提下,由計算機自己總結出來的。目前以深度學習為核心的某些機器學習應用,在滿足特定條件的應用場景下,已經(jīng)達到了超越現(xiàn)有算法的識別或分類性能。
國內(nèi)互聯(lián)網(wǎng)企業(yè)大力建設機器學習平臺。2016年11月30日,百度公司在2016百度云智峰會上發(fā)布了“天智平臺”。該平臺融合了圖像技術、語音技術、自然語言處理等技術,打通了機器學習全流程,內(nèi)置20多種高性能算法,支持Spark MLlib、用戶畫像數(shù)據(jù)、多種應用場景模板,具有開源化、靈活化、高效性、可伸縮,適合研究機構的科學家、研發(fā)人員進行使用。endprint
2016年12月18日,騰訊公司聯(lián)合香港科技大學、北京大學,開發(fā)出了基于Java和Scala語言的Angel平臺,面向機器學習的高性能分布式計算框架。它采用參數(shù)服務器架構,解決了上一代框架的擴展性問題,支持數(shù)據(jù)并行及模型并行的計算模式,能支持十億級別維度的模型訓練。Angel平臺還采用了多種業(yè)界最新技術和騰訊自主研發(fā)技術,如SSP(Stale synchronous Parallel)、異步分布式SGD、多線程參數(shù)共享模式HogWild、網(wǎng)絡帶寬流量調(diào)度算法、計算和網(wǎng)絡請求流水化、參數(shù)更新索引和訓練數(shù)據(jù)預處理方案等。這些技術使Angel性能大幅提高,達到常見開源系統(tǒng)Spark的數(shù)倍到數(shù)十倍,能在千萬到十億級的特征維度條件下運行。在系統(tǒng)易用性上,Angel提供豐富的機器學習算法庫及高度抽象的編程接口、數(shù)據(jù)計算和模型劃分的自動方案及參數(shù)自適應配置,同時,用戶能像使用MR、Spark一樣在Angel上編程。另外,Angel還支持深度學習,它支持Caffe、TensorFlow和Torch等業(yè)界主流的深度學習框架,為其提供計算加速。國內(nèi)互聯(lián)網(wǎng)龍頭企業(yè)加快布局機器學習平臺。
(三) 機器感覺和應用取得關鍵突破
機器學習、深度學習讓機器有了大腦,傳感技術則讓機器有了豐富的感覺。傳感技術是利用物理、化學、生物等技術手段從自然界感知并獲取所需信息的技術。傳感技術可分為光電傳感技術、多傳感技術和生物傳感技術,其中光電傳感技術又稱為光傳感技術,是將光信號轉化為電信號的一種傳感技術。光電傳感技術可用于檢測直接引起光量變化的非電量,如光強、光照度、輻射測溫、氣體成分分析等,也可用來檢測能轉換成光電量變化的其他非電量,如零件直徑、表面粗糙度、應變、位移、振動、速度、加速度、以及物體形狀、工作狀態(tài)等,光電傳感技術具有非接觸、響應快、性能可靠等特點,目前主要應用于工業(yè)自動化裝置和機器人技術中。傳感器是能夠感知和獲取信息的技術裝置。它能將感受到的信息按一定規(guī)律變換成為電信號或其他所需形式的信息輸出,以滿足信息的傳輸、處理、存儲、顯示、記錄和控制等要求。當前傳感器發(fā)展趨勢是微型化、數(shù)字化、智能化、多功能化、系統(tǒng)化、網(wǎng)絡化。傳感網(wǎng)是將一定范圍內(nèi)的傳感器鏈接起來所組成的無線或有線網(wǎng)絡。傳感網(wǎng)具有實時數(shù)據(jù)采集、監(jiān)督控制和信息共享與存儲管理等功能,通過網(wǎng)絡可以實時獲取數(shù)據(jù)信息、監(jiān)控各種環(huán)境、設施及內(nèi)部運行機理。家電、交通管理、農(nóng)業(yè)生產(chǎn)、建筑物安全、旱澇預警等,都能夠通過傳感網(wǎng)得到有效的監(jiān)測,有的甚至能夠通過網(wǎng)絡進行遠程控制。
物聯(lián)網(wǎng)是通過互聯(lián)網(wǎng)將更多的傳感網(wǎng)連接起來,實現(xiàn)更大范圍的物與物、人與物的網(wǎng)絡連接。利用局部網(wǎng)絡或互聯(lián)網(wǎng)等通信技術把傳感器、控制器、機器、人員和物等通過新的方式聯(lián)在一起,形成人與物、物與物相聯(lián),實現(xiàn)信息化、遠程管理控制和智能化的網(wǎng)絡。物聯(lián)網(wǎng)是互聯(lián)網(wǎng)的延伸,它包括互聯(lián)網(wǎng)及互聯(lián)網(wǎng)上所有的資源,兼容互聯(lián)網(wǎng)所有的應用。物聯(lián)網(wǎng)的核心和基礎仍然是互聯(lián)網(wǎng),是在互聯(lián)網(wǎng)基礎上的延伸和擴展的網(wǎng)絡;物聯(lián)網(wǎng)是互聯(lián)網(wǎng)的延伸,其用戶端延伸和擴展到了人與物、物與物之間,進行信息交換和通信,也就是物與物、人與物的相息。由于傳感技術、網(wǎng)絡技術的迅猛發(fā)展,網(wǎng)絡接入和應用大面積普及,人人都可以通過移動終端連上互聯(lián)網(wǎng),任何物品都可以通過傳感網(wǎng)納入互聯(lián)網(wǎng),幾乎達到了無所不在的網(wǎng)絡、無所不在的感知的狀態(tài)。借助寬帶互聯(lián)網(wǎng),人們又可以遠程感知、遠程控制,機器可以裝上“千里眼”、“順風耳”,地球變成了一個信息透明的“地球村”。感知是生物特有的感受能力,也就是對外界光、色、聲、味、力、冷、熱、痛等等的神經(jīng)感覺和大腦體驗。沒有生命的物品,是沒有感知能力的。
但是,信息技術的發(fā)展,讓人類給機器裝上了傳感器和感知網(wǎng),機器就有了類似生物的感知能力。傳感器的種類越來越多,因此機器能感知的信息范圍也越來越大。而且,由于傳感器技術越來越先進,機器的感知能力也越來越精準。傳感器一般由敏感元件、轉換元件、變換電路和輔助電源四部分組成,敏感元件直接感受被測量,并輸出與被測量有確定關系的物理量信號;轉換元件將敏感元件輸出的物理量信號轉換為電信號;變換電路負責對轉換元件輸出的電信號進行放大調(diào)制;轉換元件和變換電路一般還需要輔助電源供電。
傳感器有許多類別。按被測物理量來分類,常見的有:溫度傳感器、濕度傳感器、氣敏傳感器、壓力傳感器、位移傳感器、流量傳感器、液位傳感器、力傳感器、速度傳感器、加速度傳感器、轉矩傳感器,等等。根據(jù)工作原理可分為電阻式、電感式、電容式及電勢式傳感器,等等。根據(jù)能量轉換原理可分為有源傳感器和無源傳感器。有源傳感器將非電量轉換為電能量,如電動勢、電荷式傳感器等;無源程序傳感器不起能量轉換作用,只是將被測非電量轉換為電參數(shù)的量,如電阻式、電感式及電容式傳感器等。感知是對外界事物某方面物理化學或生物特性的基本認識,而認知則是對外界事物本質特征的更深層、更全面的認識,包括綜合屬性、歷史記憶、思維能力、社會屬性等方面的認識。
從機器感知到機器認知,是從具體屬性感知能力向抽象思維能力提升的關鍵一步,是智能技術的質的跨越。認知技術是智能技術向高端發(fā)展的產(chǎn)物,它具備綜合感知、判斷識別和抽象思維能力,能完成以往只有人類才能夠完成的任務。認知技術不是一項單一的技術,而是綜合利用所有的科技成果,尤其是各類智能技術,包括前述機器學習、深度學習,等等。
目前,國內(nèi)公司重點布局機器視覺業(yè)務。北京曠視科技公司專注于人臉識別技術和相關產(chǎn)品應用研究,面向開發(fā)者提供服務,能提供一整套人臉檢測、人臉識別、人臉分析以及人臉3D技術的視覺技術服務,通過提供云端API、離線SDK,以及面向用戶的自主研發(fā)產(chǎn)品形式,將人臉識別技術廣泛應用到互聯(lián)網(wǎng)及移動應用場景中。 Face++通過和眾多互聯(lián)網(wǎng)公司合作,并通過“脫敏”技術掌握了500萬張人臉圖片數(shù)據(jù)庫,互聯(lián)網(wǎng)圖片人臉識別LFW的準確率達到99.6%,合作伙伴包括阿里、360等一批大型的圖片、社交、設備類企業(yè)。格靈深瞳公司是將計算機視覺和深度學習技術應用于商業(yè)領域的科技公司,自主研發(fā)的深瞳技術在人和車的檢測、跟蹤與識別方面居于世界領先水平。endprint
(四) 智能技術在信息密集行業(yè)率先商業(yè)化
智能技術在工業(yè)生產(chǎn)中的應用,引起生產(chǎn)方式、制造方法、商業(yè)模式的重大變革,產(chǎn)生了智能制造。智能制造的模式有很多,不同行業(yè)也有不同特點。其中,個性化定制就是智能制造的一種模式,適用于消費品行業(yè)。以前的生產(chǎn)方式是大規(guī)模生產(chǎn)。企業(yè)根據(jù)市場調(diào)研來設計產(chǎn)品,用生產(chǎn)流水線大規(guī)模生產(chǎn)組裝出標準化的產(chǎn)品,再通過商業(yè)批發(fā)零售賣給消費者。這種生產(chǎn)方式的特點是效率高、成本低。但是這種生產(chǎn)方式只能生產(chǎn)出標準化的工業(yè)品,不能滿足消費者的個性化需求。一旦銷售不出去,就造成商品積壓和浪費。
在智能技術的支撐下,現(xiàn)代工業(yè)企業(yè)能夠采用個性化定制的生產(chǎn)模式,靈活地接受消費者的個性化訂單,既滿足了消費者需求,又避免了盲目生產(chǎn)的浪費,還能取得較高的利潤。例如,在服裝行業(yè),消費者可以利用智能手機或智能鏡子量體裁衣,通過電子商務向服裝企業(yè)下單付費。智能的服裝工廠接單后才開始選料、裁剪、縫制、包裝衣服,并交付物流將貨品送達消費者。這個過程中,最關鍵的技術就是生產(chǎn)工廠所使用的智能技術,能夠將來自四面八方、成千上萬的訂單有條不紊地分解成對工人或機器的簡單指令,并將各種物料按時按量從倉庫提取出來送達生產(chǎn)車間,工人和機器只需按照指令進行操作即可。沒有智能技術,這么復雜的大規(guī)模生產(chǎn)是很難有序組織的。
智能技術在生產(chǎn)性服務業(yè)中的應用,引起了服務方式和商業(yè)模式的重大變革,產(chǎn)生了智能物流、智能設計、創(chuàng)客空間、互聯(lián)網(wǎng)金融等新型生產(chǎn)性服務業(yè)。
智能物流就是利用條形碼、射頻識別技術、傳感器、全球定位系統(tǒng)等各種智能技術改造物流運輸環(huán)節(jié),促進物流過程中貨物與車輛、倉儲、配送等資源的優(yōu)化匹配,實現(xiàn)物流的自動化、可視化、可控化、智能化、網(wǎng)絡化,提高物流效率、降低成本,減少自然資源和社會資源消耗。
智能設計就是綜合利用三維CAD、虛擬現(xiàn)實等智能設計工具,設計師、工程師、用戶、制造工人等多方共同參與、協(xié)同設計復雜工業(yè)產(chǎn)品的過程。
創(chuàng)客空間是指第三方專業(yè)運營的社區(qū)化的創(chuàng)意設計工作空間,有共同興趣的人們圍繞一個專業(yè)領域的發(fā)展目標,在互聯(lián)網(wǎng)上或線下聚會、社交、開展合作。
互聯(lián)網(wǎng)金融是指金融業(yè)務與互聯(lián)網(wǎng)的融合創(chuàng)新,既包括傳統(tǒng)金融機構利用互聯(lián)網(wǎng)開創(chuàng)新型業(yè)務,也包括互聯(lián)網(wǎng)企業(yè)開展創(chuàng)新性互聯(lián)網(wǎng)金融業(yè)務。前者如互聯(lián)網(wǎng)保險、網(wǎng)上銀行、互聯(lián)網(wǎng)轉賬存款貸款,后者如支付寶、微信支付、移動支付、P2P信貸、眾籌,等等。
互聯(lián)網(wǎng)眾籌,是互聯(lián)網(wǎng)金融的一種,發(fā)起人通過互聯(lián)網(wǎng)平臺向公眾發(fā)起籌資,公布籌資人、籌資目的及相關信息,吸引投資者通過互聯(lián)網(wǎng)投資并獲取相應收益。與傳統(tǒng)金融方式相比,具有低門檻、多樣性、依靠大眾力量、注重創(chuàng)意等特點,經(jīng)常被用來支持某種特定活動,包含災害重建、民間集資、競選活動、創(chuàng)業(yè)募資、藝術創(chuàng)作、自由軟件、設計發(fā)明、科學研究以及公共專案等。
智能技術在生活性服務業(yè)中的應用,同樣也引起了服務方式和商業(yè)模式的變化,給人民帶來方便快捷的個性服務,有力地改善了生活品質。例如,滴滴出行、智能導航、遠程醫(yī)療、智慧社區(qū)服務,都是已經(jīng)大范圍普及的智能生活服務。
滴滴出行,是流行在中國境內(nèi)的一款智能交通服務平臺,被稱為手機“打車神器”,深受用戶喜愛。它通過智能手機向用車者和司機提供就近聯(lián)系、就近匹配的服務。目前,滴滴出行已經(jīng)開辟了出租車、專車、快車、順風車、代駕及大巴等多項服務。
智能導航,不僅提供衛(wèi)星定位和道路、航空、航海等導航服務,還能提供實時路況信息,幫助人們選擇最佳出行路線。
遠程醫(yī)療,就是大醫(yī)院或??漆t(yī)院利用智能技術和互聯(lián)網(wǎng),對醫(yī)療條件較差的邊遠地區(qū)、海島或艦船上的傷病員進行遠距離診斷、治療和咨詢。這是一種能夠在較低開支條件下滿足偏遠地區(qū)人們高質量醫(yī)治需求的醫(yī)療服務?,F(xiàn)代遠程醫(yī)療還提供網(wǎng)上掛號、網(wǎng)上咨詢、健康監(jiān)測、居家醫(yī)護等服務。
智慧社區(qū)服務,就是借助智能技術和互聯(lián)網(wǎng)對社區(qū)居民提供個性化生活服務,包括智能樓宇、智能家居、居家養(yǎng)老、城市生命線管理、食品藥品管理、票證管理、家庭護理、個人健康、數(shù)字學習、社交娛樂諸多領域。智慧社區(qū)是社區(qū)管理服務的一種新理念,既是社會管理的新模式,也是居民生活的新方式。
(五) 智能識別技術進入產(chǎn)業(yè)化階段
人臉識別技術在身份確認中的商業(yè)應用不斷加深。谷歌公司正在研發(fā)人臉識別手機,致力于通過手機內(nèi)置處理系統(tǒng)實現(xiàn)人們面部特征的識別,以應用于人臉識別授權交易中。美國紐約機場將利用人臉識別技術對入境旅客與其證件照片進行比對審核。我國部分地區(qū)推出了基于人臉識別的ATM機,取款人無需攜帶銀行卡,通過人臉識別驗證即可獲取金融服務。微眾銀行APP引入人臉識別技術,作為用戶綁定第二張銀行卡時的安全確認保障。同時,人臉識別技術將從身份確認向情感識別方向進發(fā)。機器可以從人類的面部表情中讀懂其心理活動。目前,微軟公司推出的Azure云服務可準確識別出人臉的表達情緒。
在強大后臺學習能力的支撐下,圖像識別技術能力不斷增強,其社會角色定位逐步由輔助決策發(fā)展為主導執(zhí)行。一是輔助決策。圖像識別技術是人們與外部世界交互的重要媒介,為人們生產(chǎn)生活提供了強大的輔助支撐。機器把人們從繁雜無序的圖像信息搜索工作中解放出來,成為人們搜索行為的延伸和踐行者。人們在獲取機器的圖像識別反饋信息后,再做出下一步行為判斷。例如,百度識別APP通過圖像識別技術可以實現(xiàn)“拍照購物”功能,為用戶提供心儀商品的精準匹配功能。二是主導執(zhí)行。圖像識別技術進一步發(fā)展為人們作用于外部世界的重要工具,為人們生產(chǎn)生活提供了有力的主導驅動。在幫助人們獲取圖像信息搜索結果的同時,機器會根據(jù)搜索結果作出決策判斷,為人們提供成套解決方案。例如,劍橋大學研發(fā)了基于圖片識別的無人駕駛技術,通過高像素相機拍攝街景照片,系統(tǒng)實時將圖片中的路況分成路面、路標、行人等12個類別,從而形成路況信息分析報告,指揮車輛運行。endprint
圖像識別技術在安防領域率先打開突破口。安防監(jiān)控已從簡單的畫面感知和存儲向監(jiān)控圖像智能分析方向發(fā)展,能夠實時處理捕捉畫面。圖像識別技術對前端環(huán)境感知的靈敏性,以及對后端視頻數(shù)據(jù)分析的精準性成為其彰顯商業(yè)價值的關鍵。
目前,??低暪就瞥隽薙mart2.0“智”系統(tǒng),該系統(tǒng)為視頻監(jiān)控終端嵌入了“大腦”,監(jiān)控終端可以實時對視頻畫面進行行為檢測、異常偵測、特征識別、統(tǒng)計分析操作。一旦發(fā)現(xiàn)可疑,即可立即向云端Smart平臺發(fā)送報警信息。飛瑞斯科技也研發(fā)了基于人臉識別的視頻監(jiān)控系統(tǒng),該系統(tǒng)聯(lián)通了公安人像庫和人口綜合信息系統(tǒng),在捕捉視頻畫面的同時,能夠迅速對進入畫面的人像進行鑒別,實現(xiàn)對犯罪分子的精準追蹤。
生物特征識別已構建起完善的技術體系,形成了生物特征信號傳感、活體檢測、信號質量評價等十大關鍵技術。生物特征傳感技術是生物特征信息的“轉換器”,將指紋、虹膜、掌紋等生物特征轉化為計算機可處理的數(shù)字信號;活體檢測技術是生物特征信息的“判決器”,判斷驗證提交的生物特征是否來自生命個體;生物特征信號質量評價技術是生物特征信息的“評價器”,對受損低質量生物特征信號進行篩選和排查;生物信號的定位與分割技術是生物特征信息的“追蹤器”,能從采集到的生物原始信號中剔除冗余數(shù)據(jù);生物特征信號增強技術是生物特征信息的“放大器”,能對提取出的特定生物特征信息進行信號增強處理;生物特征信號的校準技術是生物特征信息的“校正器”,能對參與比對的兩個生物特征信號進行平移、尺度和旋轉變換等對齊處理;生物特征表達與抽取技術是生物特征信息的“表達器”,用特定差異化特征信息對指紋、掌紋、虹膜等進行電信號表征;生物特征匹配技術是生物特征信息的“測度器”,能夠計算兩個生物特征樣本特征向量間的相似度;生物特征數(shù)據(jù)庫檢索與分類技術是生物特征信息的“搜索器”,可以對海量生物特征數(shù)據(jù)進行分類存儲與檢索;生物特征識別系統(tǒng)性能評價技術是生物特征識別系統(tǒng)的“評估器”,能夠對識別系統(tǒng)進行客觀、準確的評價。
(六) 自然語言理解技術進一步成熟
自然語言理解技術是幫助計算機處理和讀懂人類語言的技術,涉及機器翻譯、語音識別、人機交互、信息抽取等應用內(nèi)容。自然語言處理技術發(fā)展歷經(jīng)了興起、低谷和再興的螺旋上升期。一是技術興起期。20世紀50年代,自然語言理解技術興起于美國,科研人員認為不同語言是對“同一語義”的不同編碼,希望用計算機技術翻譯語言。
1954年,美國喬治城大學和IBM公司合作成功將超過60句俄語翻譯成英語,實現(xiàn)從一種語言到另一種語言的機器自動翻譯。二是技術低谷期。由于1966年發(fā)布的一份研究報告指出自然語言理解技術并未達到預期,所以自然語言理解研究陷入了長達20年的低潮期。三是技術再興期,20世紀80年代以來,研究者發(fā)現(xiàn)簡單地堆砌語言規(guī)則并無法真正實現(xiàn)自然語言的理解。通過引入大量文本數(shù)據(jù)的自動學習和統(tǒng)計,能夠更好解決自然語言處理問題。
目前,自然語言處理技術遇到語料規(guī)模不足和語料涵蓋不夠兩大發(fā)展瓶頸。一是大規(guī)模語料數(shù)據(jù)庫建設難度較大。主流自然語言處理技術的基礎是基于統(tǒng)計學習的,因此構建大規(guī)模語料庫是提高機器語言翻譯準確率的必由之路。但是,語料庫建設的大部分工作都是由人工完成的,語料資源不足、人工處理工作量大是自然語言處理技術發(fā)展的主要難題。二是語料庫的內(nèi)容涵蓋性有所欠缺。任何語料庫都難以囊括單一領域的全部案例,而且語料庫的標注體系往往難以把握:類別劃分過粗,就難以全面細致地描述語言;類別劃分過細,則標注信息過于龐大,標注效率較低。
自然語言理解方法為機器提供與人類流暢溝通的技術鏈接。自然語言理解技術的基本方法包括基于規(guī)則的處理方法和基于統(tǒng)計的處理方法。基于規(guī)則的處理方法起源于理性主義,試圖用有限的、嚴格的規(guī)則來描述無限的語言現(xiàn)象,通過對一些特殊語言或語句的研究得到對于人類語言的普適認識。轉換生成語法是基于規(guī)則的處理方法的代表性算法。而基于統(tǒng)計的處理方法起源于經(jīng)驗主義,側重于從人們所實際使用的大規(guī)模語言數(shù)據(jù)中提取統(tǒng)計規(guī)律。貝葉斯方法、隱馬爾科夫、最大熵、維特比算法、支持向量機方法是基于統(tǒng)計的處理方法的代表性算法?;谝?guī)則的處理方法在20世紀50年代至80年代期間,在自然語言理解領域占有重要地位。
20世紀80年代以后,基于統(tǒng)計的處理方法開始崛起,推動機器翻譯取得重要突破,同時句法剖析、詞類標注、參照消解等自然語言理解算法都把統(tǒng)計方法作為標準算法。相較基于規(guī)則的處理方法,基于統(tǒng)計的處理方法有一定優(yōu)勢。一是穩(wěn)定性較好?;诮y(tǒng)計的處理方法的糾錯能力較強,能夠在語言翻譯時有效分辨出不符合語法規(guī)則的語言。而基于規(guī)則的處理方法對于固定語言規(guī)則以外的表達則無能為力。二是普遍適應性較強?;诮y(tǒng)計的處理方法并不需要大量語言學家、語音學家、各領域專家共同參與構建一個語言規(guī)則框架,而只需要得到大規(guī)模語料的統(tǒng)計規(guī)律,對資源數(shù)據(jù)的細化處理要求不高。三是靈活性強。基于統(tǒng)計的處理方法可以根據(jù)數(shù)據(jù)統(tǒng)計模型對參數(shù)不斷進行優(yōu)化,以更好地提高機器理解語言的準確度。而基于規(guī)則的處理方法一旦確定好語言轉換的規(guī)則,就很難進行動態(tài)調(diào)整。
語音識別、機器翻譯、人機對話等自然語言理解技術深入拓展生活應用場景。在語音識別方面,谷歌公司向全球第三方開發(fā)者免費開放了語音識別Google Cloud Speech API,Google Cloud Speech API包含80多種語言,能夠在實時流媒體或批處理模式下支持任意應用,為開發(fā)者提供全套API,使機器能夠看到、聽懂和翻譯語言。百度公司在自然語言識別方面取得最新突破,發(fā)布了手機百度動物語意識別功能,以快速語音識別、高效語境辨析、精準預警分析、及時交互對答等功能實現(xiàn)對生物種類、動物意愿的辨析。寶馬集團、三星集團、松下公司與語音識別系統(tǒng)開發(fā)商Nuance公司聯(lián)合開發(fā)了車載“智能助理”技術,該技術能夠準確辨識車主發(fā)出語音的有效性和語言意圖。英特爾公司聯(lián)合語音識別技術公司Sensory,在最新芯片產(chǎn)品中嵌入TrulyHandsfree語音識別技術接口,為智能終端廠商提供語音識別喚醒功能。endprint
浪潮公司與Altera、科大訊飛等公司開展合作,開發(fā)了基于深度學習的語音識別方案,利用高級編程模式OpenCL實現(xiàn)語音識別功能從CPU到FPGA架構遷移。在機器翻譯方面,微軟、谷歌等公司都在研發(fā)實時語音翻譯系統(tǒng),能夠實現(xiàn)對不同種類語言的快速同聲翻譯。百度公司發(fā)布了融合統(tǒng)計和深度學習方法的在線翻譯系統(tǒng),通過以海量神經(jīng)元網(wǎng)絡模仿人腦理解語言的方式,實現(xiàn)機器翻譯質量的顯著提升。在人機對話方面,微軟公司加快消費類聲學產(chǎn)品研發(fā)步伐,推出了語音助手微軟小娜APP。蘋果公司力圖拓展Siri在汽車領域的應用,收購了VocalIQ公司。
(七) 智能技術和虛擬現(xiàn)實技術融合發(fā)展
虛擬現(xiàn)實(Virtual Reality,VR)是指把計算機技術構建的三維虛擬場景再現(xiàn)于顯示設備上的人機交互技術。虛擬現(xiàn)實與增強現(xiàn)實(Augmented Reality,AR)的區(qū)別在于虛擬場景的投射物和人的感受不同。一是投射物不同。虛擬現(xiàn)實中虛擬場景投射于顯示設備上;而增強現(xiàn)實則把虛擬場景投射于實際環(huán)境中。二是人的感受不同。在虛擬現(xiàn)實中,人與實際環(huán)境是分割的,完全沉浸于虛擬環(huán)境中;而在增強現(xiàn)實中,人與實際環(huán)境是融為一體的。近兩年,國外科技公司加快了虛擬現(xiàn)實產(chǎn)品的推出速度。微軟公司在2014年斥資1.5億美元從ODG購買了可穿戴設備技術,于2015年發(fā)布了虛擬現(xiàn)實影像技術Holograms和設備Holoenns,并最終于2016年推出了Hololens開發(fā)者版本。2014年,谷歌公司與高通公司領投頭戴式顯示器、觸摸手套、壓縮圖像系統(tǒng)等虛擬現(xiàn)實設備生產(chǎn)商—Magic Leap公司。
Facebook公司在2014年投資20億美元收購Oculus公司,并于2016年對外發(fā)布了虛擬現(xiàn)實游戲外設Oculus Rift。索尼公司于2015年發(fā)布了可搭配PS4的Project Morpheus虛擬現(xiàn)實顯示器。英特爾公司研發(fā)了RealSense追蹤技術,實現(xiàn)對人們手勢和面部情緒的識別。三星公司聯(lián)合Oculus公司打造了智能佩戴技術設備—三星Gear VR,為用戶提供了電影般虛擬現(xiàn)實場景中的浸入式體驗。HTC公司于2015年與Valve公司合作開發(fā)了設備Vive VR。國內(nèi)科技公司也加快虛擬現(xiàn)實技術設備研發(fā),同時更注重虛擬現(xiàn)實服務平臺的建設。暴風影音公司于2014年推出了虛擬現(xiàn)實設備—暴風魔鏡,圍繞場景廣告、游戲體驗、演唱會網(wǎng)絡直播等方面為用戶提供高品質的內(nèi)容服務。繼2016年3月向Magic Leap公司投資7億美元后,阿里巴巴于同年4月成立了VR實驗室,該實驗室將協(xié)同阿里旗下影業(yè)、音樂等開展優(yōu)質VR內(nèi)容生產(chǎn)、VR設備開發(fā)等平臺建設。騰訊公司于2015年推出了Tencent VR項目,將會開發(fā)一款集成傳感器和專用屏幕的頭戴現(xiàn)實設備(HMD),該設備可與miniStation微游戲構建形成虛擬現(xiàn)實開發(fā)平臺。樂視公司于2016年發(fā)布了虛擬現(xiàn)實戰(zhàn)略,力圖垂直整合虛擬現(xiàn)實產(chǎn)業(yè)價值鏈中的云平臺、內(nèi)容制作以及終端設備,并聯(lián)合內(nèi)容提供方打造虛擬現(xiàn)實內(nèi)容平臺。目前,樂視公司已發(fā)布了虛擬現(xiàn)實硬件設備—手機式VR頭盔LeVR COOL1。
虛擬現(xiàn)實已初步形成集動態(tài)環(huán)境建模、立體顯示和傳感、系統(tǒng)開發(fā)工具應用、三維圖形生成、系統(tǒng)集成等為一體的關鍵技術體系。動態(tài)環(huán)境建模技術是虛擬現(xiàn)實的核心技術,它通過抽取實際環(huán)境的三維數(shù)據(jù),在信息空間建立虛擬環(huán)境模型,實現(xiàn)物質從物理空間到虛擬空間的轉換映射。立體顯示和傳感器技術是用戶進入虛擬世界的入口,它通過高靈敏、高精度跟蹤用戶表情、肢體的瞬時變化情況,為用戶提供虛擬現(xiàn)實顯示影像的環(huán)繞真實感和沉浸感。系統(tǒng)開發(fā)工具應用技術是虛擬現(xiàn)實應用創(chuàng)新的載體,虛擬現(xiàn)實系統(tǒng)開發(fā)工具的便利性、集成性和可操作性能夠為開發(fā)者提供簡便易行的開發(fā)環(huán)境和平臺。實時三維生成技術是虛擬現(xiàn)實高品質成像的支撐,該技術的關鍵是在保證三維影像的構建質量和復雜度的前提下,確保圖形刷新率高于30楨/秒。
系統(tǒng)集成技術是虛擬現(xiàn)實流暢運轉的順滑劑,系統(tǒng)集成技術包括信息同步、模型標定、數(shù)據(jù)轉換、數(shù)據(jù)管理模型、識別和合成等方面,支撐了大量感知信息的處理和虛擬模型的構建。
(八) 區(qū)塊鏈技術改變?nèi)祟惿?/p>
區(qū)塊鏈技術的本質是按一定時間窗口對信息數(shù)據(jù)進行分塊,并以信息出現(xiàn)的時間順序把信息區(qū)塊組織成鏈狀連接的信息記錄。區(qū)塊鏈技術改變了以往關系型數(shù)據(jù)存儲模式(Oracle、MySQL、Microsoft SQL Server)和非關系型數(shù)據(jù)存儲模式(HBase、MongoDb、Oracle BDB)的構建形式,形成了按時間順序排列事件數(shù)據(jù)的“時間軸數(shù)據(jù)存儲模式”。
區(qū)塊鏈技術的初期應用主要植根于金融領域,致力于推動實體資產(chǎn)的數(shù)字化表征,建立一個不依賴中心機構、由全社會集體維護的分布式資產(chǎn)登記、支付交易體系—數(shù)字貨幣。目前,比特幣是數(shù)字貨幣較為知名的實際案例。比特幣誕生于2008年,是一個完全基于點對點(P2P)的電子現(xiàn)金交易體系,該體系可以由交易雙方直接進行交易活動,而不受控于第三方交易服務機構。
區(qū)塊鏈技術的本質是數(shù)據(jù)分布式記錄、集體維護的底層數(shù)據(jù)庫技術。該技術除了可承載交易數(shù)據(jù)外,還可有其它信息形式。因此,區(qū)塊鏈的應用并不僅局限于數(shù)字貨幣,還可拓展至醫(yī)療服務、資產(chǎn)管理、出行服務等領域。
在醫(yī)療服務方面,區(qū)塊鏈技術可以把各個醫(yī)院彼此獨立的病人電子病歷庫連接起來,構建全球共同維護的電子病歷數(shù)據(jù)庫。如果醫(yī)生對病人身體健康信息進行更新,該更新信息就會以區(qū)塊鏈的形式進行驗證和記錄,并向全網(wǎng)進行廣播。當該病人的健康記錄被再次調(diào)取時,區(qū)塊鏈就會驗證該健康記錄是否被篡改過。這樣,無論在全球任何地方,人們都可以隨時使用儲存在區(qū)塊鏈的個人病歷、生理特征數(shù)據(jù)、DNA編碼序列等信息。
在資產(chǎn)管理方面,區(qū)塊鏈技術與物聯(lián)網(wǎng)技術結合可以對人們名下的房屋、汽車等實物資產(chǎn)進行在線虛擬化,形成“數(shù)字智能資產(chǎn)”。一旦債務人出現(xiàn)違約情況,其名下財產(chǎn)即可以區(qū)塊鏈形式在線進行分布式授權與全網(wǎng)所有權變更登記,實現(xiàn)資產(chǎn)的一鍵式劃轉。同時,知識產(chǎn)權等無形資產(chǎn)也可以免去各種繁瑣的認證手續(xù),依托具有時間序列的區(qū)塊鏈技術,便捷地進行知識產(chǎn)權的認定、查詢和維權工作。
在出行服務方面,區(qū)塊鏈技術也可以打造汽車租賃解決方案,汽車租賃只需“點、簽、開”等三步即可完成。首先,顧客選擇想要租賃的汽車,該交易將會被上傳到區(qū)塊鏈公共賬戶上;然后,顧客會在線簽署一份租賃和保險協(xié)議,同時協(xié)議信息也會上傳到公共賬戶上;最后,系統(tǒng)會持續(xù)維護該汽車的租賃占用信息直至交易結束。我國人民銀行于2015年成立了區(qū)塊鏈技術的專門研究團隊,并在2016年1月舉行了數(shù)字貨幣研討會。國內(nèi)企業(yè)也在金融領域開展區(qū)塊鏈技術的應用拓展。
依托區(qū)塊鏈技術,小蟻公司推動物理世界資產(chǎn)和權益的數(shù)字化登記和轉讓,提供基于點對點的在線登記發(fā)行、轉讓發(fā)行、轉讓交易、清算交割、清算交割等金融服務。同時,小蟻公司還可通過“區(qū)塊鏈IPO”方式為創(chuàng)業(yè)公司募集資金,以完備的市場估值、股權流動性等運營機制為保障,提供股權眾籌管理功能,以去中心化交易機制實現(xiàn)公司股權的在線交易服務。井通科技利用區(qū)塊鏈技術為企業(yè)封裝自主沉淀資金和客戶信用信息,開發(fā)出了“井通企業(yè)級錢包”,為海航集團提供了集采購信息獲取、資金流轉、結算交付等于一體的全流程無縫連接服務,還可為集團供應商向金融機構發(fā)起的供應鏈融資提供支持。endprint