蘆偉
半年前,我做過一次關(guān)于“AI在AV的現(xiàn)狀與發(fā)展”的專題策劃,當(dāng)時聯(lián)系了多位AV行業(yè)廠商及專家,但都被委婉拒絕了。究其原因,主要來自于兩方面,一是自身還沒有AI實踐應(yīng)用,感覺沒什么可說的;二是對AI認(rèn)識不深,行業(yè)對AI應(yīng)用的也不多,怕說的不合適讓別人笑話。
半年之后,再次策劃AI專題,聯(lián)系采訪對象的時候,發(fā)現(xiàn)情況發(fā)生了一些變化。首先,愿意接受采訪的人多了,無論目前是否有AI應(yīng)用,但至少有了自己的見解和看法。其次,對于AI持肯定態(tài)度,也愿意去實踐去發(fā)展。
我認(rèn)為這就是一種進步。AI是一種必然趨勢,它會涉及到各行各業(yè)、方方面面。雖然AI進入AV行業(yè)的步伐不像互聯(lián)網(wǎng)行業(yè)那么快,但必然會到來。提前認(rèn)識、思考、規(guī)劃AI,對于未來保持競爭地位很有必要。雖然到目前為止,AI仍是眾說紛紜,甚至不乏盲人摸象的看法,但這不正是一種新技術(shù)到來之前的常態(tài)嗎?當(dāng)一切塵埃落地,沒什么可以討論的時候,機會也就消失了。目前只有通過不斷地碰撞、交流,思路才會越來越清晰,才會越有的放矢,知道發(fā)展的方向和目標(biāo)。
對于本次AI專題,不少行業(yè)之士給予了充分肯定,其中北京利國電子副總經(jīng)理關(guān)點的看法很有代表性。他希望行業(yè)媒體或者組織協(xié)會,以后能夠多組織一些關(guān)于AI與AV結(jié)合的交流活動,集思廣益、拋磚引玉,很可能就會產(chǎn)生出一些顛覆式的應(yīng)用。
AV人眼中的AI
不管其他行業(yè)怎么說,現(xiàn)在我們來看看AV人怎么認(rèn)識AI的吧。
利國電子副總經(jīng)理關(guān)點認(rèn)為,AI是一種用于模擬人類的智能,并用于擴展和延申人類智能的技術(shù),并通過這類技術(shù)形成多種提高人類工作效率的工具。它與大數(shù)據(jù)、計算能力的發(fā)展是不能分開的,特別是當(dāng)前世界海量的視頻音頻數(shù)據(jù)越來越多。對于這些數(shù)據(jù)的檢索分析已經(jīng)遠(yuǎn)遠(yuǎn)超出人類的能力,AI技術(shù)將會輔助甚至代替人類對這些音視頻數(shù)據(jù)進行處理工作。
“我認(rèn)為AI將會持續(xù)火熱,而且慢慢融合到我們生活和工作中,可能我們都不會感覺到,但是它無處不在。一方面,隨著IoT技術(shù)的普及,越來越多的傳感器、數(shù)據(jù),以及身邊的移動設(shè)備計算能力的提高,都將會推動AI的發(fā)展,另一方面,國家對AI非常重視,中國人有機會引領(lǐng)這次顛覆式的變革機會。”
贏康股份軟件部經(jīng)理張??”硎荆珹I代表著先進的生產(chǎn)力,是技術(shù)發(fā)展的大趨勢。在未來,不用AI輔助生產(chǎn)和采用AI輔助生產(chǎn)兩種方式的區(qū)別,在相當(dāng)一部分場景下就像刀耕火種和采用農(nóng)業(yè)機械生產(chǎn)之間的區(qū)別一樣大。AI技術(shù)的全面應(yīng)用還需要時間,但在部分領(lǐng)域已得到長足發(fā)展,如語音識別、圖像識別、基于地理位置的應(yīng)用(滴滴打車、快遞調(diào)度)、電子商務(wù)(如阿里的千人千面系統(tǒng))等。在我們看得見和看不見的地方,開始影響我們的生活,而且這種影響還會持續(xù)并愈發(fā)深遠(yuǎn)。
AI與AV的結(jié)合機會
雖然目前AI在AV中的應(yīng)用還不多,還處于初級階段,但彼此結(jié)合的機會還是很多的。
關(guān)點認(rèn)為,AV可能是各個行業(yè)中,在應(yīng)用層最需要結(jié)合AI技術(shù)的行業(yè)。這是因為首先,廠商的AV產(chǎn)品,可以為AI的數(shù)據(jù)計算提供視頻的原始數(shù)據(jù)支持,或者利用在整個系統(tǒng)中的各個AV產(chǎn)品對一些重要數(shù)據(jù)進行搜集,然后提供給AI分析工具進行分析,幫助AI進行機器學(xué)習(xí),提高AI的智能水平;其次,隨著AV產(chǎn)品的計算能力提升,還可以在AV產(chǎn)品中集成AI學(xué)習(xí)和分析功能,提升分布運算或簡化用戶交互的功能。
顯而易見,AI將會對AV行業(yè)中的視頻數(shù)據(jù)檢索、識別、分析、自動控制提供特別大的幫助,當(dāng)然這也就會幫助AV廠家擴展現(xiàn)有產(chǎn)品的功能,提高廠家的競爭力。
張??”硎荆珹V即看和聽,是人類最基本的需求之一。如果有一項技術(shù)能改善看和聽的效率效果,必然會得到廣泛應(yīng)用。目前一些終端(如遙控器、電視)已經(jīng)和語音識別結(jié)合起來;攝像頭、閘機等設(shè)備在圖像識別結(jié)合方面也有了長足進步。隨著AI技術(shù)變得更加有效低廉,以及人們對“AV系統(tǒng)要緊貼應(yīng)用”這一訴求的日益普遍化,AI和AV的結(jié)合將愈發(fā)廣泛和深入。
“以前的AV系統(tǒng)只是一臺冰冷冷的機器,而結(jié)合了AI的AV系統(tǒng)則是一個上到?jīng)Q策人員和系統(tǒng)管理員,下到日常使用人員的好秘書。它會有自己的眼睛、耳朵和感覺,會有自己的思考,并會通過學(xué)習(xí)來不斷完善自己的思考能力。它會用語言和圖像和你交流,會根據(jù)你的話語、手勢乃至眼神和習(xí)慣來調(diào)度日益復(fù)雜的AV系統(tǒng)為你服務(wù)。當(dāng)然,完全智能化的AV系統(tǒng)離我們的日常生活還有一段距離,但這種具備感知能力和智慧的系統(tǒng)才是最符合我們?nèi)祟惲?xí)慣和需求的,也是技術(shù)發(fā)展的一個永恒趨勢?!?/p>
為何AI在AV應(yīng)用不多
相比于AI在互聯(lián)網(wǎng)、金融、安防、廣電等行業(yè)的如火如荼,AI在AV這里是雷聲不大雨點也小,大家談的不多,應(yīng)用更少。雖然目前有所進步,但距離火熱還差很遠(yuǎn),這是為什么呢?
上海寰視市場總監(jiān)靳鍇認(rèn)為主要有三方面的原因:
(1)數(shù)據(jù)來源的限制。AI最主要的基礎(chǔ)是數(shù)據(jù)分析,只有通過海量數(shù)據(jù)進行深度學(xué)習(xí)后才能產(chǎn)生AI智能決策。但目前AV行業(yè)的主要數(shù)據(jù)來源于不同的職能部門,數(shù)據(jù)單一、結(jié)構(gòu)多樣,不同數(shù)據(jù)之間沒有互通,難以收集到可用的海量數(shù)據(jù)分析生成AI模型。但可喜的是,國家層面已看到該弊端,很多職能部門在AV系統(tǒng)的建設(shè)上已在努力推動扁平化架構(gòu)、橫向暢通,使得數(shù)據(jù)應(yīng)用可以融合和互通。
(2)數(shù)據(jù)安全的限制。由于AI需要大量真實的數(shù)據(jù)演練來生成模型,而這些數(shù)據(jù)是否脫敏、是否泄密,都是各部門首要考慮的風(fēng)險因素。出于信息安全的考慮,數(shù)據(jù)無法批量開放,只能處理后以有限的方式提供。這就制約了數(shù)據(jù)樣本的多樣性,AI的準(zhǔn)確度也會受到影響。
(3)人為偏見。人工智能近年來有了井噴式的發(fā)展,但它的發(fā)展時間畢竟短暫,人類對于人工智能的信任度、可靠性仍存有很大疑慮,對其快速發(fā)展是否會取代人類仍存在爭議。此外,受制于認(rèn)知的局限性,人們已習(xí)慣依據(jù)主觀經(jīng)驗進行判斷決策。
因此,沒有前端積極主動地配合和推動,企業(yè)難以實現(xiàn)AI的廣泛應(yīng)用。
對此問題,關(guān)點的看法是AI實際上應(yīng)用已經(jīng)很多,但是AI屬于一個生態(tài)圈。AV產(chǎn)品作為其中的一個產(chǎn)品需要與其它非AV行業(yè)的產(chǎn)品進行技術(shù)融合,這個過程需要水平比較高的一些跨界人才,諸如知識豐富的產(chǎn)品經(jīng)理,能夠把AV產(chǎn)品帶入并融合到AI的生態(tài)圈里,為用戶創(chuàng)造新的功能或者產(chǎn)品,甚至是顛覆性的功能或者產(chǎn)品。目前這個生態(tài)圈還沒有完全建立起來,AV與AI的跨界人才更是奇缺,此造成AV中的AI應(yīng)用比較少。
AI對AV的沖擊或變革
任何一種新生事物的出現(xiàn),都會對原行業(yè)現(xiàn)狀和結(jié)構(gòu)造成影響,AI也不例外。
對于張??碚f,AI對AV的影響可能導(dǎo)致兩種結(jié)果,一是“變革”,二是“沖擊”。
“變革”就是傳統(tǒng)AV企業(yè)擁抱AI技術(shù),解決了行業(yè)當(dāng)前存在的一些問題,并升級技術(shù)到符合用戶日益苛刻的要求。這是一種行業(yè)內(nèi)部的變革過程,是主動行為。
“沖擊”是外來的高科技企業(yè)對AV行業(yè)發(fā)起“降維打擊”,從出人意料的角度和更高的維度奪走整個行業(yè)的生存空間,類似于支付寶干掉了ATM機生產(chǎn)商。這并非是危言聳聽,如果哪一天手機能夠管理好所有視聽需求,那視頻會議系統(tǒng)、會議管理軟件、傳輸系統(tǒng)等廠商,可能就變得沒有存在的必要了;而顯示系統(tǒng)、音頻廠家等公司也難免受到波及,這是一種被動行為。
應(yīng)對方法就是放開視野,擁抱變化。IT及AI領(lǐng)域有大量開源資源是AV可以利用的,這些資源雖然未必是技術(shù)上最頂尖的那一批,但幫助AV用較低的成本緊跟時代的潮流,還是足夠的。
靳鍇認(rèn)為,AI給AV行業(yè)帶來最大的變革是智能化決策。通過AI實現(xiàn)智能化決策,主要有三個發(fā)展階段。
第一階段為輔助決策階段,也就是現(xiàn)在人們通常所說的大數(shù)據(jù)信息呈現(xiàn)。目前,視聽行業(yè)正處于AI應(yīng)用發(fā)展的第一階段。第二階段,應(yīng)該是可以根據(jù)數(shù)據(jù)分析產(chǎn)生決策預(yù)案,比第一階段更深入更高級,人們不再需要對所呈現(xiàn)的海量大數(shù)據(jù)進行分析研判,而是可以直接根據(jù)AI算法分析后提供的預(yù)案,來選擇最優(yōu)方案執(zhí)行。第三階段為全人工智能階段,從前端數(shù)據(jù)采集、信息處理,到最優(yōu)方案的產(chǎn)生與選擇,再到落實執(zhí)行、跟蹤反饋等,全程無需人工干預(yù),全部由AI自動執(zhí)行。
例如,某地發(fā)生火災(zāi),通過指揮中心的AI智能分析后,自動研判現(xiàn)場情況,根據(jù)算法提供最優(yōu)救援方案并自動通知對應(yīng)部門,同時實時追蹤各職能部門的救援執(zhí)行進展,再通過實時狀態(tài)反饋后計算產(chǎn)生新的處理方案,靈活調(diào)整……這樣的變革對AV行業(yè)來說也是一種巨大的沖擊。
當(dāng)?shù)竭_(dá)第三階段以后,所有原始數(shù)據(jù)匯聚到資源池后都由AI算法自動處理完成,全程無需人工干預(yù),勢必對大數(shù)據(jù)呈現(xiàn)所需的載體帶來很大的影響。那么應(yīng)該如何應(yīng)對?靳鍇認(rèn)為:創(chuàng)新是對抗沖擊的重要手段!面對AI,我們不能固步自封,而是要深入挖掘用戶的需求和應(yīng)用,并通過持續(xù)研發(fā)投入和快速創(chuàng)新迭代,結(jié)合AI技術(shù)來開發(fā)滿足用戶智能化決策需求的應(yīng)用。
擁抱AI
擁抱AI,并希望在AI的技術(shù)浪潮中,尤其在AI和AV的結(jié)合當(dāng)中占據(jù)領(lǐng)先位置,這是贏康、利國、上海寰視等很多AV 廠商的共同愿望。
張??⊥嘎?,贏康一直探索研發(fā)一些AI智能平臺,預(yù)計明年下半年可以推出。
利國目前有些AI深度學(xué)習(xí)的項目,正處于測試和用戶驗證階段。同時也在和一些AI深度學(xué)習(xí)、圖像識別等公司合作,嘗試尋找一些產(chǎn)品機會。
在AV行業(yè),上海寰視主要解決的是音視頻信號處理、傳輸和調(diào)度的問題。靳鍇表示,從AI層面,寰視更多考慮的是如何結(jié)合AI實現(xiàn)更智能化的調(diào)度,使得人工干預(yù)的程度更低,實現(xiàn)指揮中心的全面人機交互智能化調(diào)度。寰視正在進行相關(guān)研究和應(yīng)用開發(fā),不久的將來,就可以看到上海寰視與AI深度融合的產(chǎn)品。
從以上可以看出,AI距離AV并不遠(yuǎn),AI也并不可怕。如果一味拒之門外,最終AI依然會打破大門,對AV行業(yè)造成巨大沖擊。但如果AV業(yè)者積極擁抱AI、探索應(yīng)用,AI則會造福AV,讓AV更智能、應(yīng)用更廣泛、競爭力更加強大。