刀刀
4月1日,百度給我們講了一個高大上的愚人節(jié)玩笑,一鼓作氣發(fā)布了四項(xiàng)“神技”:能甄別食材安全,幫助用戶掌握食品信息的“筷子”——百度“筷搜”;能可視化還原夢境的百度dulife手環(huán);對著手機(jī)吹一口氣,就能檢測出身體健康狀況并得到專家診斷和健康指導(dǎo)的百度iBreath;以及能模擬觸覺、嗅覺等感覺的百度視頻4D觸感技術(shù)——在介紹這項(xiàng)技術(shù)的視頻里,姑娘因?yàn)橥ㄟ^屏幕“摸”到了都教授的臉而興奮不已。而天真的網(wǎng)友在發(fā)現(xiàn)根本無法下載到“百度視頻4D版APP”后,憤而在“百度知道”里留言道——“你,們,騙,我!”
有人說,四項(xiàng)神技的發(fā)布是百度工程師患上了集體臆想癥。也有人覺得,這是個認(rèn)真的玩笑,其中暗示了百度的發(fā)展大計(jì)。
百度當(dāng)然是認(rèn)真的——至少“百度視頻4D”在這一天的玩笑中收獲了百萬級的點(diǎn)擊和關(guān)注。
百度視頻PC端搜索于2007年上線,百度視頻移動客戶端(百度視頻App)于2011年發(fā)布。截至目前,百度視頻App累計(jì)用戶突破2億,日均搜索播放量超過1億次。但一般用戶只把它看作是百度搜索框上方眾多標(biāo)簽中的一個,或手機(jī)里眾多視頻APP應(yīng)用工具中的一個——而實(shí)際上百度視頻搜索是技術(shù)圈的產(chǎn)物,嚴(yán)格意義上來說,并非視頻圈的玩家。
但在百度“大數(shù)據(jù)引擎驅(qū)動未來”的發(fā)展戰(zhàn)略下,作為高冷技術(shù)控的百度視頻搜索,如今有了更強(qiáng)的動力,“讓用戶在搜索視頻時感受到技術(shù)帶來的神奇變化”,也有了更強(qiáng)的欲望,通過大數(shù)據(jù)的挖掘來與娛樂行業(yè)深度互動。
我們有大數(shù)據(jù),你知道嗎'
“通過用戶的搜索、瀏覽、觀看等行為,我們可以知道任何影視內(nèi)容在任何時候的受歡迎程度。”胡一川說。
作為百度視頻技術(shù)負(fù)責(zé)人,胡一川在闡釋百度視頻的技術(shù)創(chuàng)新成果時提到,“用戶每天在百度視頻會進(jìn)行數(shù)億次的搜索、瀏覽和觀看請求。借助搜索聚合技術(shù),百度視頻能打通百度貼吧、百度知道等平臺,實(shí)現(xiàn)對大數(shù)據(jù)的全面匯聚。我們不僅可以知道任何影視內(nèi)容在任何時候的受歡迎程度,而且,我們可以分析看這些影視內(nèi)容的用戶的特征,例如:用戶性別、年齡、學(xué)歷,包括這個群體中男女的比例、年齡的分布等等。在對視頻用戶的觀看趨勢以及行為軌跡清晰把控的基礎(chǔ)上,借助大數(shù)據(jù)分析進(jìn)行影視作品的市場決策、用戶挖掘、營銷推廣,能夠?qū)崿F(xiàn)事半功倍的效果?!?/p>
直到今天,影視圈內(nèi)外的許多人仍在津津樂道Netflix是如何利用大數(shù)據(jù)成就了《紙牌屋》——雖然也早有人指出,那不過是Netflix利用《紙牌屋》的成功包裝出來的一個美麗故事。但不管大數(shù)據(jù)與《紙牌屋》的制作有無關(guān)系,2013年,大數(shù)據(jù)技術(shù)的崛起與其熱情洋溢的自我宣揚(yáng),確實(shí)令中國影視行業(yè)對數(shù)據(jù)的認(rèn)識有了一次“大躍進(jìn)”般的進(jìn)步,并且極大地提升了這個行業(yè)對大數(shù)據(jù)應(yīng)用前景的期待。
雖然百度暫時還沒有向影視行業(yè)提供數(shù)據(jù),但大數(shù)據(jù)未來將如何發(fā)展,很多人都把殷殷期待投向了百度。同時,技術(shù)和人才也都在涌向百度。
在加入百度前,胡一川是“今晚看啥”的聯(lián)合創(chuàng)始人兼CTO?!敖裢砜瓷丁庇?012年6月上線,定位為電影搜索及個性化推薦引擎。2012年11月下旬,“今晚看啥”由百度收購,并入百度垂直搜索業(yè)務(wù)體系。胡一川則開始全面負(fù)責(zé)百度視頻的數(shù)據(jù)挖掘與個性化推薦相關(guān)項(xiàng)目的規(guī)劃、設(shè)計(jì)與實(shí)施。而“今晚看啥”所做的事情,與百度視頻搜索如今正在做的事情,頗有共通之處。當(dāng)然,后者的格局、野心都更大。
極速,低流量,并且知道你想看什么'
在4月份的技術(shù)分享會上,百度視頻發(fā)布了幾項(xiàng)能夠提升用戶體驗(yàn)的創(chuàng)新技術(shù)成果,包括極速視頻搜索技術(shù)、視頻連環(huán)畫播放技術(shù)、百度視頻影視基因庫及其鉆研已久的個性化推送技術(shù)等。
百度視頻想告訴大家,在你點(diǎn)擊搜索按鈕之前,搜索行為其實(shí)就已經(jīng)開始了。極速搜索技術(shù)能夠通過百度的大數(shù)據(jù)計(jì)算能力預(yù)測用戶的搜索結(jié)果,請求和獲取相關(guān)信息。在保證搜索的可靠性和穩(wěn)定性的基礎(chǔ)上,極速搜索系統(tǒng)可將用戶的視頻搜索請求時間縮短至原來的十分之一,并且擁有非常高的預(yù)測準(zhǔn)確率。
受網(wǎng)絡(luò)環(huán)境限制,用戶觀看視頻時經(jīng)常會出現(xiàn)緩沖不及時的卡頓情況,影響用戶的觀影體驗(yàn)。針對這一現(xiàn)象,百度視頻開發(fā)了“連環(huán)畫模式”技術(shù),這項(xiàng)技術(shù)會根據(jù)當(dāng)前視頻的信息截取視頻的關(guān)鍵畫面,對關(guān)鍵畫面進(jìn)行排序,生成圖片庫。在因視頻緩沖不及時、無法正常觀影的時間段,百度視頻會根據(jù)播放請求,從畫面庫中讀取對應(yīng)的關(guān)鍵畫面進(jìn)行播放 ,以“連環(huán)畫”的形式展現(xiàn)視頻內(nèi)容,讓用戶在消耗最少流量的情況下可以用最短的時間獲取視頻的基本信息。據(jù)悉這項(xiàng)技術(shù)已申請專利,預(yù)計(jì)很快將正式上線。
百度視頻“影視基因庫”的建立,則類似于Netflix對電影作品所做的“微類型”分類。但百度視頻的操作方式與Netflix迥然不同。據(jù)悉Netflix 為旗下所有電影作品共計(jì)配置了七萬多種標(biāo)簽組合,并雇傭了大量人力經(jīng)過訓(xùn)練之后來為每一部作品貼標(biāo)簽。百度視頻則是首先咨詢了影視行業(yè)內(nèi)的研究人士及深度用戶,了解并確定了有哪些標(biāo)簽可以用于描述視頻內(nèi)容,然后再采用技術(shù)算法來給視頻貼標(biāo)簽。
比如,當(dāng)用戶搜索某個類型的視頻時,百度視頻的初期反饋結(jié)果不一定能夠滿足用戶的需求。比如用戶搜索“高智商科幻電影”,百度反饋的結(jié)果可能只是那些描述中帶有“高智商”或“科幻”的電影。但搜索了這個關(guān)鍵詞的用戶,最終還是會得到某些搜索結(jié)果。如果某個結(jié)果是錯誤的,那么用戶在點(diǎn)開視頻后就不會完整觀看視頻(很快就會關(guān)掉),這一動作就證明了這部電影肯定不符合“高智商”、“科幻”這兩個標(biāo)簽中的一個。
通過建立完整的“影視基因庫”,結(jié)合百度的自然語言處理技術(shù),百度視頻就能夠智能理解用戶的需求。比如用戶搜索“和動物有關(guān)的電影”時,系統(tǒng)會智能推薦《忠犬八公的故事》、《馴龍高手》等獲得海量用戶好評的動物相關(guān)影片。甚至當(dāng)用戶不知道想看什么影片時,都可以搜索“好看的電影”,系統(tǒng)將從觀影人數(shù)、評分高低等維度給用戶推薦優(yōu)質(zhì)影片。
同時,用戶的搜索行為分析證明,很多用戶會通過不斷增加關(guān)鍵詞的方式來尋找自己想要看的視頻。例如,用戶會先搜索“鄭多燕”(韓國健身明星,減肥操辣媽),然后再搜索“鄭多燕 甩油操”、“鄭多燕 豐胸收腹”等關(guān)鍵詞的組合,來尋找想看的視頻。同時,從數(shù)據(jù)中發(fā)現(xiàn),對于一個給定的關(guān)鍵詞,用戶會對某幾個特定關(guān)鍵詞組合特別感興趣?;诖?,百度視頻可以事先將這些特定的關(guān)鍵詞組合挖掘出來,將視頻進(jìn)行結(jié)構(gòu)化的標(biāo)記和分類。在用戶搜索一個關(guān)鍵詞時,百度視頻會將與其相關(guān)的關(guān)鍵詞組合展現(xiàn)出來,令用戶更加便捷地發(fā)現(xiàn)想看的視頻。數(shù)據(jù)顯示,經(jīng)過智能推薦,視頻列表的點(diǎn)擊率高于傳統(tǒng)列表頁3倍以上。
此外,百度視頻App通過分析用戶在手機(jī)、平板上的搜索、觀看視頻的行為,還為用戶自動發(fā)送個性化的消息推送。例如:當(dāng)用戶最常觀看的電視劇有最新集時,百度視頻App會自動給用戶同步推送;如果用戶經(jīng)常觀看新聞類短視頻,百度視頻App會及時提示國內(nèi)外的重點(diǎn)新聞;而對于體育迷來說,百度視頻App則會將重大賽事第一時間呈現(xiàn)給用戶。百度視頻期望運(yùn)用大數(shù)據(jù)技術(shù),為每位用戶打造出屬于自己的個性化視頻觀看平臺。
百度開放數(shù)據(jù)合作'
如今,百度已將大數(shù)據(jù)升級為公司戰(zhàn)略。
在4月24日的百度技術(shù)開放日上,李彥宏為百度大數(shù)據(jù)引擎站臺,百度將用數(shù)據(jù)合作的方式來幫助和改造傳統(tǒng)行業(yè)。對此,互聯(lián)網(wǎng)觀察者羅超解讀稱,“百度將大數(shù)據(jù)引擎做成一個開放平臺,形成標(biāo)準(zhǔn)的接口,讓每個行業(yè)不同企業(yè)可以根據(jù)自身需求各取所需。而它的首要目的是獲取數(shù)據(jù),然后是考慮變現(xiàn)。變現(xiàn)方式可能是增值服務(wù)、收費(fèi)云、數(shù)據(jù)分析結(jié)果、技術(shù)咨詢等方式,這將改變百度盈利模式過渡依賴‘搜索廣告的現(xiàn)狀”。
羅超指出:“大數(shù)據(jù)已經(jīng)給Google每天帶來2300萬美元的收入,一年約為82億美元。這已經(jīng)遠(yuǎn)遠(yuǎn)超過百度2013年51億美金的年收入了。因此,如果百度大數(shù)據(jù)引擎能夠成功,很可能會為之帶來源源不斷的數(shù)據(jù)以及現(xiàn)金流?!?/p>
憑借在大數(shù)據(jù)方面的長期積累和沉淀,如今,百度終于決意開辟新的戰(zhàn)場。
作為百度系的一員,百度視頻的大數(shù)據(jù)也將為用戶/客戶提供從智能推薦到數(shù)據(jù)分析的多面服務(wù)。百度視頻未來產(chǎn)生的數(shù)據(jù),對于影視產(chǎn)業(yè)鏈各個環(huán)節(jié)的市場行為,也必將產(chǎn)生重要影響。但前提是,“百度視頻能在未來充分利用好百度的大數(shù)據(jù)資源,恰到好處地運(yùn)用到用戶體驗(yàn)的改善上去,讓用戶習(xí)慣于把百度視頻當(dāng)作入口,精準(zhǔn)找到自己想要的影視內(nèi)容,甚至精準(zhǔn)找到UGC內(nèi)容”。互聯(lián)網(wǎng)分析師葛甲認(rèn)為,“這個目標(biāo)實(shí)現(xiàn)起來任重而道遠(yuǎn),但卻是百度視頻唯一的正確方向,也是大數(shù)據(jù)從漂浮狀態(tài)落地的為數(shù)不多的落腳點(diǎn)”。
據(jù)悉,百度近期已低調(diào)上線了一款新的大數(shù)據(jù)產(chǎn)品“百度預(yù)測”(http://trends.baidu.com/),目前可提供景點(diǎn)舒適度預(yù)測、城市旅游預(yù)測、流行感冒預(yù)測等信息查詢,未來則有望推出電影票房預(yù)測等服務(wù)。可以肯定的是,未來互聯(lián)網(wǎng)的發(fā)展必將極大地改變影視內(nèi)容的制作、觀賞和視頻消費(fèi)市場的分享。大數(shù)據(jù)在其中的作為則更加令人期待。