告訴大家,這項(xiàng)技術(shù)的關(guān)鍵,根本不在于“搖一搖”,而是要?dú)w功于里面一項(xiàng)很神秘的核心技術(shù):音頻指紋識(shí)別。
如果你過年的時(shí)候不怕長(zhǎng)輩生氣,看春晚把電視調(diào)成了靜音,你就會(huì)發(fā)現(xiàn)一個(gè)無情的事實(shí):手腕搖斷了都不會(huì)有明星送祝福。因?yàn)樵陂_啟“搖一搖”這種功能的時(shí)候,你要先保證你的手機(jī)能“聽到”電視發(fā)出的聲音,這樣手機(jī)上的麥克風(fēng)才能采集音頻信號(hào),并對(duì)音頻信號(hào)進(jìn)行一些特征的預(yù)處理后,提取到音頻的指紋。
音頻的“指紋”是什么?音頻指紋之于音頻就如同指紋之于人,它是每段音頻關(guān)于音頻數(shù)據(jù)內(nèi)容的壓縮簽名。目前比較通用的音頻指紋是音頻的頻譜特征,其好處就在于它可以“透過外在看本質(zhì)”,收集到的音頻信號(hào)會(huì)先被無情地卸掉偽裝,也就是進(jìn)行數(shù)字采樣和降噪等預(yù)處理,然后再通過加窗的方式分幀,對(duì)于每幀音頻信號(hào)會(huì)提取出音頻的頻譜特征。最后將一系列連續(xù)的特征序列拼接成單獨(dú)一個(gè)向量,我們就得到傳說中的音頻指紋了。
看到這里,大家可能想到了一個(gè)發(fā)家致富的新思路:要是我把天貓晚會(huì)錄個(gè)音,然后每天在家循環(huán)播放邊聽邊搖,我是不是能把馬云爸爸搶破產(chǎn)???
馬云爸爸冷笑一聲:我們這個(gè)技術(shù)是實(shí)時(shí)互動(dòng)你知道嗎?
殘酷的實(shí)時(shí)也就意味著只有在特定的時(shí)刻才會(huì)進(jìn)行匹配。你上傳的音頻指紋是包含接收音頻信號(hào)的時(shí)間信息的,而數(shù)據(jù)庫(kù)中相對(duì)應(yīng)的音頻聲紋也是有設(shè)定好的時(shí)間標(biāo)簽。所以只有在特定的時(shí)刻才會(huì)觸發(fā)相應(yīng)的互動(dòng)活動(dòng)。想搶錢哪有那么容易?勸你還是在屏幕前乖乖守著直播看表?yè)u手機(jī)吧。