余森林 唐旻圓
摘要:文章以音樂識別軟件作為研究對象,對該類別產(chǎn)品的服務(wù)設(shè)計進(jìn)行分析研究。通過對此類軟件產(chǎn)品的比較、分析和較為詳盡的測評,獲得一些有效的數(shù)據(jù)信息。文章詳細(xì)探討了音樂識別軟件的要素特點(diǎn),分析了用戶需求,展望了音樂識別產(chǎn)品向語音識別的方向轉(zhuǎn)型的趨勢,并指出功能導(dǎo)向型的設(shè)計方式正在在逐漸向服務(wù)導(dǎo)向型設(shè)計在過渡,這一轉(zhuǎn)變,是為了引起用戶通產(chǎn)品之間更多的情感共鳴。
關(guān)鍵詞:服務(wù)設(shè)計 音樂識別 語音識別
中圖分類號:TB47 文獻(xiàn)標(biāo)識碼:A
文章編號:1003-0069(2018)10-0131-03
引言
互聯(lián)網(wǎng)的全面覆蓋改變了信息的搜索方式,智能手機(jī)的出現(xiàn)造就了新的音樂聆聽方式,音樂識別軟件出現(xiàn)是由于音樂APP的大熱。音樂識別軟件一直以準(zhǔn)確、快速的識別深受用戶喜愛,軟件除了識別功能外,還為用戶在使用過程中提供了獨(dú)一無二的情感體驗(yàn)?!拔㈦娮?、智能化等信息技術(shù)的廣泛應(yīng)用為信息社會變革提供了技術(shù)基礎(chǔ),社會整體性進(jìn)入可持續(xù)發(fā)展、數(shù)字化聯(lián)系、智能化產(chǎn)品和交互性溝通為特征的狀態(tài)”。
一、音樂識別軟件的要素特點(diǎn)
音樂APP使用便捷,在線曲庫曲目數(shù)量龐大,受到了大多民眾尤其是年輕人的歡迎。隨之而產(chǎn)生的音樂識別軟件也發(fā)展迅速,如今幾乎每一款音樂APP都會提供“聽歌識曲”的服務(wù)。當(dāng)人們聽到未知的曲目時,會很自然地掏出手機(jī)打開音樂識別軟件對音頻進(jìn)行識別,這類軟件的出現(xiàn),簡化了搜索的過程,大大提高了搜索效率,“形成了具有號召力的生活方式和服務(wù)”。
主流的音樂識別軟件有三款分別為Track ID、Shazam以及SoundHound,這三款軟件的工作原理基本相同,都是用戶通過手機(jī)的錄制曲目片段,然后將其通過軟件上傳至各自的數(shù)據(jù)庫進(jìn)行搜索和匹配,再將匹配的結(jié)果發(fā)至用戶。不過實(shí)際上,音樂識別軟件的識別原理并非真的“聆聽”,而是識別該段曲目的特征節(jié)奏,并在軟件對應(yīng)的音頻庫里找出對應(yīng)的曲目。
Track ID曾是索愛手機(jī)內(nèi)置的音樂識別軟件,2006年11月,索尼愛立信公司推出了首款Walkman手機(jī)W830c,這也是第一臺內(nèi)置音樂識別軟件的手機(jī)。索尼公司在此款軟件上并未進(jìn)行衍生產(chǎn)品的開發(fā),始終將其音樂識別功能放在首位,力求準(zhǔn)確地識別出每一次用戶搜尋的音頻出處。Shazam最初需要通過撥打熱線(美國地區(qū))并保持通話狀態(tài)來獲取音樂片段,隨后用戶將收到短信,其中包含曲目名稱和藝術(shù)家姓名。Shazam做到的不僅是音樂識別,還能夠識別電視節(jié)目和廣告,并能夠根據(jù)用戶的搜索內(nèi)容提供相關(guān)的信息(限美國地區(qū))。SoundHound公司除了開發(fā)展音樂識別軟件外,又設(shè)計了Houndify和Hound兩款軟件。Hound的用途與Shazam的衍生功能相似,能夠通過對用戶的搜索習(xí)慣的分析,向用戶他們推薦類似的節(jié)目。Houndify是一款智能語音識別產(chǎn)品,致力于構(gòu)建一個大型的在線AI會話平臺,這也是語音識別技術(shù)發(fā)展的新趨勢。
筆者對三款產(chǎn)品進(jìn)行了測試,發(fā)現(xiàn)它們之間還是存在一些差異,測試過程中,將會對每首曲目進(jìn)行三次識別,識別成功將標(biāo)記為“√”,識別失敗將標(biāo)記為“×”,識別錯誤將標(biāo)記為“*”,具體數(shù)據(jù)詳見(如圖1)(注:進(jìn)行對比時,手機(jī)放置在距離音響20cm處,每首曲目播放時音量一致。另,一旦識別成功,無論是否滿三次,均將不再繼續(xù)識別。)
從圖片的數(shù)據(jù)中,我們可以清晰看到:Shazam具有最高的識別能力,幾乎做到了全部準(zhǔn)確識別,而SoundHound的識別準(zhǔn)確度低于另外兩款軟件,Track ID介于兩者之間。三款軟件均未成功識別《金句Medley》這首曲目,并且對于純音樂的識別能力都較弱。由于Track ID的開發(fā)公司索尼曾于2008年6月2日收購了Gracenote,所以曲庫曾經(jīng)更為全面。但索尼卻于2013年12月把Gracenote的所有權(quán)售予美國第二大報業(yè)集團(tuán)美國論壇公司(Tribune Company),所以,在三款軟件各自的曲庫數(shù)量基本持平的條件下,識別度準(zhǔn)確率卻未能在同一水準(zhǔn)。
互聯(lián)網(wǎng)環(huán)境下,數(shù)據(jù)爆炸式的增長,傳統(tǒng)的儲存與訪問的方式,已經(jīng)無法滿足互聯(lián)網(wǎng)發(fā)展的要求?!啊剖蔷W(wǎng)絡(luò)的一種形象化的說法,被看作是互聯(lián)網(wǎng)的基礎(chǔ)服務(wù)資源,如服務(wù)器的硬件、軟件、數(shù)據(jù)和應(yīng)用服務(wù)的集中和統(tǒng)一,這些資源在使用者看來是可以無限擴(kuò)展的,并且可以隨時獲取,按需使用,隨時擴(kuò)展,按使用量付費(fèi)”。音樂識別服務(wù)可以說是一種云服務(wù),“云服務(wù)并不僅僅只是大服務(wù)器集群,其強(qiáng)調(diào)開放生態(tài),參與共享,跨界融合,從本質(zhì)上重塑了用戶認(rèn)知,消費(fèi)方式和商業(yè)模式”。
音樂識別軟件所呈現(xiàn)的“產(chǎn)品+服務(wù)”模式是產(chǎn)品設(shè)計的一種新思路,是設(shè)計由實(shí)體產(chǎn)品轉(zhuǎn)向“解決方案”的最佳代之一。軟件既具備實(shí)用到功能,又能為用戶提供與眾不同的服務(wù)體驗(yàn),“以人為核心的服務(wù)設(shè)計在生產(chǎn)與消費(fèi)中越來越重要”。
二、音樂識別軟件的用戶需求分析
音樂APP的出現(xiàn),“培養(yǎng)”了民眾用手機(jī)聽音樂的習(xí)慣,隨之產(chǎn)生的音樂識別軟件,讓手機(jī)作為音樂播放產(chǎn)品的功能更加完整。要“培養(yǎng)”民眾使用音樂APP和音樂識別軟件的習(xí)慣,首先要充分了解用戶的“服務(wù)性心理”,“服務(wù)性心理指用戶對基本功能滿足意外人性化、個性化需求的心理情感特征,進(jìn)而才能使用戶和產(chǎn)品之間的交互產(chǎn)生情感共鳴。信息社會里的個人消費(fèi)既關(guān)注外形,更注重物品帶來的心理滿足”。追求好的情感體驗(yàn)意味著對于設(shè)計師也提出了新的要求,設(shè)計的重點(diǎn)應(yīng)該放在產(chǎn)品設(shè)計對民眾的社會生活所帶來的影響上。電子行業(yè)發(fā)展迅速,新奇的產(chǎn)品不再能激起消費(fèi)者的購買欲望,用戶更關(guān)注的是產(chǎn)品使用過程中能否獲得更好的體驗(yàn)。迄今為止,大家已經(jīng)探討了太多的功能和應(yīng)用,但都敵不過產(chǎn)品帶給用戶的直觀感受和情景體驗(yàn)。
三款產(chǎn)品均為免費(fèi)軟件,雖然Shazam和SoundHound都提供付費(fèi)版本,但功能上區(qū)別不大,只是屏蔽了多余的廣告信息。音樂識別軟件的關(guān)鍵特征是操作簡便和識別準(zhǔn)確,三款軟件在進(jìn)入主頁面后,都只需按下頁面中的主按鈕就可以進(jìn)行曲目錄制并搜索,識別結(jié)束后,還會提示用戶是否要關(guān)注該首曲目的演唱者。(如圖2)軟件會記錄用戶的搜索歷史,并進(jìn)行分析,以便向用戶推薦類似風(fēng)格的曲目。SoundHound和Shazam已經(jīng)可以無縫對接Apple Music、Spotify和YouTube,可以將識別的曲目一鍵添加入音樂列表,便于用戶試聽和下載。利用手機(jī)的定位功能,軟件會標(biāo)記用戶發(fā)現(xiàn)這首歌的位置,還可以看到周邊使用該軟件的用戶正在搜尋或聆聽的音樂。
三款軟件均可將曲目及其相關(guān)信息分享到微博、Facebook等社交平臺,無形間也為軟件起了到宣傳作用,兩全其美。這符合了移動互聯(lián)網(wǎng)時代用戶的分享和社交需求,在社交平臺里音樂不但能夠彰顯個性,而且還充當(dāng)了人與人之間溝通的橋梁(如圖3)。
在這個追求個性、實(shí)現(xiàn)自我的年代里,產(chǎn)品的個性化設(shè)計已經(jīng)成為潮流,產(chǎn)品的賣點(diǎn)也早已不拘泥于技術(shù)上的新潮,還需要滿足更多消費(fèi)者個性化的潛在需求。音樂播放產(chǎn)品早已走過了硬件主導(dǎo)的階段,進(jìn)入了“硬件+軟件+服務(wù)”的階段,產(chǎn)品的造型設(shè)計、技術(shù)創(chuàng)新和功能開發(fā)都離不開服務(wù)系統(tǒng)設(shè)計的“統(tǒng)領(lǐng)”,這些也都是企業(yè)想要獲取可觀利潤必須要考慮到的。
世界環(huán)境與發(fā)展委員會曾下過定義,“人類社會的可持續(xù)發(fā)展只能以生態(tài)、環(huán)境和自然資源的持久、穩(wěn)定的支承能力為基礎(chǔ)”。音樂識別軟件無需制造和生產(chǎn)實(shí)體的工業(yè)產(chǎn)品,符合了可持續(xù)發(fā)展觀的最基本原則。作為由傳統(tǒng)的,以產(chǎn)品生產(chǎn)經(jīng)濟(jì)為基礎(chǔ)的工業(yè)經(jīng)濟(jì),轉(zhuǎn)變?yōu)橐苑?wù)為基礎(chǔ)的服務(wù)型經(jīng)濟(jì)的代表之一,音樂識別功能成為了幾乎每一位音樂愛好者的選擇。所以,音樂識別軟件是最為人們所熟知、使用頻率最高的符合服務(wù)設(shè)計規(guī)范的產(chǎn)品之一。
現(xiàn)在音樂識別軟件的主要功能是記錄用戶的使用行為,并進(jìn)行分析,向用戶推薦出符合用戶偏好的音樂。音樂識別軟件需要滿足的不僅是用戶對搜索功能的需要,還需滿足用戶額外的心理需求,并“積極鼓勵和引導(dǎo)新的價值觀和消費(fèi)理念”。除去音樂本身對心靈所帶來的療愈作用,如何滿足用戶的社交需求、如何將曲目信息進(jìn)行精簡的歸納整理等,都是設(shè)計師在設(shè)計之初就需要考慮到的。電子產(chǎn)業(yè)發(fā)展迅速,僅靠高新技術(shù)和酷炫外型不再能夠打動消費(fèi)者。評價一件產(chǎn)品的好壞與否,除了產(chǎn)品本身制作精良以外,更應(yīng)當(dāng)注重的是對用戶生理、心理、行為和文化認(rèn)知等因素的了解與分析,然后根據(jù)分析設(shè)計出一套操作起來簡潔高效的系統(tǒng),這套系統(tǒng)同時也能夠?yàn)槠髽I(yè)帶來可觀的“盈利”,這才能算得一件好的產(chǎn)品。這里的盈利不僅局限于經(jīng)濟(jì)利益,“好的設(shè)計不僅應(yīng)考慮商業(yè)回報,還應(yīng)當(dāng)實(shí)現(xiàn)社會、環(huán)境和文化價值”。
三、音樂識別軟件的服務(wù)設(shè)計前景展望
隨著SoundHound公司旗下Hound軟件的推出,Shazam對于電視節(jié)目的識別與推薦的功能也不再獨(dú)特。許多的音樂APP例如QQ音樂、蝦米FM等都推出了“聽歌識曲”的功能,功能單一的音樂識別軟件已經(jīng)走向式微,Track ID因其作風(fēng)保守,已于2017年9月15日不再提供服務(wù)。隨著民眾對于電子設(shè)備依賴,是語音識別成為了當(dāng)今的熱點(diǎn)的重要原因之一。2015年6月,SoundHound公司上線了他們的新產(chǎn)品Houndify的安卓內(nèi)測版,音樂識別只是該公司邁出的第一步,他們一直以來所專注于研究的是語音識別和對自然語言的處理,Houndify就是用來解決人類對于語音助手的更大需求(如圖4)。與其類似的智能語音識別產(chǎn)品還有蘋果Siri(HomePod)、Google Home、三星bixby、亞馬遜Alexa(Echo)和我國自主研發(fā)的Rokid等。音樂識別正在逐漸地向語音識別進(jìn)化、轉(zhuǎn)變,語音即將成為未來人際互動的主要形式。
筆者認(rèn)為,智能語音識別產(chǎn)品是由音樂識別軟件發(fā)展而來的。音樂識別軟件在支持精確識別的同時也是可以提供模糊識別功能的,模糊識別指的是,例如:在識別未知歌曲時,軟件上會顯示“請哼唱出歌曲旋律”,這樣,即使是不知名的歌曲僅憑用戶哼唱出大概的旋律,也會有很大幾率通過軟件識別出歌曲。然而,市面上現(xiàn)存的音樂識別軟件均已將“模糊識別”的功能移除,僅支持精確識別,因?yàn)椤澳:R別”功能已經(jīng)被移植入了智能語音助手里,例如:當(dāng)用戶向智能語音助手詢問一個不確定的地名時,智能音箱會根據(jù)用戶所在地區(qū),盡可能準(zhǔn)確地向用戶提供該地點(diǎn)的相關(guān)信息,這與音樂識別軟件的“模糊識別”如出一轍。
由音樂識別轉(zhuǎn)型過渡到語音識別助手這一趨勢,這正是企業(yè)“力求將處在大的商業(yè)環(huán)境中與設(shè)計相關(guān)的諸多因素進(jìn)行整合,并創(chuàng)造出新型‘商業(yè)模式的整體解決方法”。如今,智能語音助手出現(xiàn)了一種新的發(fā)展,虛擬的智能語音助手逐漸實(shí)體化,例如Echo、Rokid以及Google Home,這種新興的智能音箱成為了科技界和設(shè)計界重點(diǎn)關(guān)注的產(chǎn)品。這類產(chǎn)品不再是對傳統(tǒng)音箱的功能更新,真正吸引人的產(chǎn)品所帶來的新型人機(jī)交互模式,這是一種操作系統(tǒng)和產(chǎn)品形態(tài)的組合,更是“產(chǎn)品+服務(wù)”的一種全新模式。這一服務(wù)性的轉(zhuǎn)變,將圍繞著用戶的需求不斷變化。音樂識別只是未來大型的AI會話平臺所邁出的第一步,讓語音識別產(chǎn)品能夠真正服務(wù)于人類,做到將生活中的瑣事化繁為簡,將語音識別的功能可持續(xù)地發(fā)展下去,才是研發(fā)者和設(shè)計師最終的目的。
目前智能語音識別產(chǎn)品還處于非常早期的階段,未來將會有更多該類型的產(chǎn)品走入民眾的生活,因此需要對產(chǎn)品的功能與服務(wù)進(jìn)行進(jìn)一步的升級,才可以發(fā)揮更大的作用。持續(xù)將服務(wù)創(chuàng)新的理念和方法融入智能語音識別產(chǎn)品的設(shè)計策略,并不斷進(jìn)行更為深入的研究和探索,對于該產(chǎn)品的發(fā)展是必不可少的。
結(jié)語
現(xiàn)代社會人與物、人與人、物與物之間的聯(lián)系達(dá)到了前所未有的緊密。數(shù)字時代,互聯(lián)網(wǎng)拉近的不僅僅是人與人之間的距離,更使得虛擬體驗(yàn)與硬件產(chǎn)品之間彼此交融??茖W(xué)進(jìn)入了綜合性的發(fā)展,跨學(xué)科的融合創(chuàng)新為設(shè)計提供了新的思路雖然音樂識別軟件受到多數(shù)用戶的歡迎,但這種僅支持音樂識別、分享和下載的產(chǎn)品若不根據(jù)用戶需求作出改進(jìn)終將遭到淘汰。產(chǎn)品設(shè)計逐漸由功能型設(shè)計轉(zhuǎn)向服務(wù)型設(shè)計,產(chǎn)品設(shè)計的趨勢“是以物質(zhì)產(chǎn)品為基礎(chǔ),以用戶價值為核心的全過程設(shè)計”。產(chǎn)品設(shè)計已經(jīng)超越了對于物化產(chǎn)品的關(guān)注,而進(jìn)入了系統(tǒng)設(shè)計的范疇,只有將產(chǎn)品的服務(wù)系統(tǒng)設(shè)計逐漸完善,才能夠真正地將設(shè)計從以產(chǎn)品為中心轉(zhuǎn)變成為以人為中心,做出真正可持續(xù)的產(chǎn)品。