視頻的清晰度,比四年前更低了?
2024年10月8日,全網(wǎng)粉絲數(shù)超千萬的“影視颶風”團隊把這一問題拋給各大視頻平臺。在題為“4K清晰度不如4年前,視頻變糊是你的錯覺嗎”的視頻中,“影視颶風”UP主潘天鴻提到,視頻平臺通過多種方式,過度降低了視頻的碼率,甚至會給視頻后期添加銳化,使其看起來不那么 “糊”。最后,他得出結(jié)論:在同等分辨率的條件下,我們現(xiàn)在看到的視頻清晰度可能達不到四年前的水平。
視頻壓縮,本是個由來已久的話題。1972年左右,堪薩斯州立大學的電氣工程師、計算機科學家Nasir Ahmed提出使用DCT編碼壓縮圖像。DCT的基本原理與如今的壓縮算法類似,它將圖像分成不同的小塊,舍棄高頻信息,保存低頻信息,最終得到的圖像與最初版本并不完全相同,但大多時候,這種差異不會被人們察覺。
進入21世紀,我們先后擁有了H.264、H.265、AV1等新的編碼技術(shù)。2020年7月,最新的H.266編碼也已發(fā)布。算法不斷更新的背景下,為何視頻清晰度在倒退?
事實上,視頻壓縮早已不只是關(guān)乎技術(shù),更關(guān)乎用戶的體驗,和流媒體視頻平臺需要算的一筆賬。
在創(chuàng)作者圈子中,視頻上傳平臺后會“變糊”,早已是一個公開的秘密。
創(chuàng)作者李山就曾留意到這種現(xiàn)象。他做過幾次旅游vlog視頻,內(nèi)容大多是沿途風景。拍攝和制作時,他尤其注意細節(jié),想讓視頻呈現(xiàn)更好的畫質(zhì)??梢曨l上傳平臺后,他發(fā)現(xiàn)畫質(zhì)下降得比較明顯,原本具有豐富細節(jié)的樹葉、草叢等植被,“變成了塊狀”。
影響李山視頻的關(guān)鍵因素,并非大多數(shù)觀眾熟知的1080P、4K等“分辨率”的概念,而是“碼率”。簡單而言,“碼率”指的是單位時間內(nèi)傳輸?shù)臄?shù)據(jù)量。視頻中的每一個細節(jié)——從色彩變化到物體運動,都是由數(shù)據(jù)構(gòu)成的。在相同的分辨率下,單位時間內(nèi)傳輸?shù)臄?shù)據(jù)越多(即碼率越高),視頻展現(xiàn)出來的畫面就會更加細膩和真實。
而視頻“變糊”,就是平臺通過壓縮降低了視頻的碼率。創(chuàng)作者萬泉曾于2014年開始,做過兩年多的UP主,他的視頻大多上傳至嗶哩嗶哩平臺(后簡稱“B站”)。萬泉記得,視頻上傳前,B站會提醒視頻的碼率不要超過6Mbps,否則平臺會對視頻進行編碼壓縮。
“那時候會有相當多的攻略,告訴你怎么去規(guī)避(B站的)二次壓縮這件事。”萬泉告訴南風窗。南風窗記者搜索發(fā)現(xiàn),不少創(chuàng)作者分享的技巧提到,如果UP主不自行壓縮直接投稿,視頻的碼率會被平臺壓縮得更低。
降低碼率,是因為它受到網(wǎng)絡帶寬的限制。對于流媒體視頻平臺來說,播放高碼率的視頻就像是容許多輛大卡車同時通過,給公路增加了負擔,平臺需要支付更多的流量成本。而對觀眾而言,能否正常觀看高碼率視頻,也受到自身網(wǎng)絡環(huán)境的影響,如果家里的“網(wǎng)絡公路”容不下多輛卡車通過,視頻播放便會卡頓、不流暢。
于是,為了節(jié)省網(wǎng)絡帶寬費用,也保證用戶在不同網(wǎng)絡條件下的觀看體驗,流媒體視頻平臺有必要對視頻進行壓縮。平臺常用的H.264(AVC)、H.265(HEVC)、VP9以及AV1等視頻編碼格式,目的就在于將視頻文件大幅縮小,降低碼率的同時盡量減少畫質(zhì)損失。
而在必要的壓縮之外,影視颶風的視頻中提到的,是更多“過度的壓縮”。
以H.265編碼格式為例,它比H.264編碼格式更為高效,能夠在保證相同畫質(zhì)水平的基礎上,減少50%左右的數(shù)據(jù)量,也就是將碼率降低至H.264編碼下的近一半水平。這樣一來,既能給觀眾提供相當?shù)漠嬞|(zhì)體驗,又能節(jié)省平臺流量成本,實現(xiàn)雙贏。
但影視颶風對比發(fā)現(xiàn),事實上H.265編碼格式的視頻,在碼率大幅降低的情況下,并未保持與H.264相近的畫質(zhì)。以B站為例,2019年前后,B站給創(chuàng)作者上傳的1080P視頻設定了一個6Mbps碼率的上限,平臺壓縮視頻后,碼率也能達到4—5Mbps。而如今,一個1080P的視頻,碼率可能只有1—1.5Mbps。
更為直觀的是,2023年7月,一位UP主對比了同一視頻在AV1、H.265、H.264三種編碼下的畫質(zhì),發(fā)現(xiàn)H.264編碼的視頻反而是最清晰的。AV1、H.265兩種高效率編碼,確實降低了視頻的碼率,卻并未真正保證畫質(zhì)的清晰度。
視頻和游戲業(yè)務對流量消耗越來越大,流量越高成本越高,這是國內(nèi)視頻產(chǎn)業(yè)難盈利的重要原因。
碼率的下降,可能已經(jīng)超過了“高效壓縮”的界限。
那么,為什么?這最終仍要回到平臺降低碼率的目的,也就是帶寬成本“降本”。
早在2014年,搜狐公司創(chuàng)始人張朝陽就在采訪中提到,“高居不下的成本帶寬成本是造成(當時)搜狐虧損的重要原因”。他進一步解釋,搜狐的視頻和游戲業(yè)務對流量消耗越來越大,流量越高成本越高,這是國內(nèi)視頻產(chǎn)業(yè)難盈利的重要原因。他同時透露,搜狐視頻一年的帶寬成本達到數(shù)億元人民幣。
而根據(jù)2024年3月發(fā)布的《中國網(wǎng)絡視聽發(fā)展研究報告(2024)》,截至2023年12月,我國網(wǎng)絡視聽用戶規(guī)模達10.74億,網(wǎng)絡視聽的“第一大互聯(lián)網(wǎng)應用”地位愈加穩(wěn)固。用戶規(guī)模增長的背后,平臺也背上了帶寬成本壓力,不得不通過壓縮視頻、降低碼率來降本增效。
畢竟,2020年B站UP主“動動槍”就曾計算過,像《影流之主》這樣一個4000萬播放量的視頻,平臺要把它推給每一個觀眾,大約要消耗10萬GB的流量,以當時阿里云公開的流量價格計算,花費的流量費用超過了兩萬。
從流媒體視頻平臺的財報數(shù)據(jù)中能看到,近年來各平臺都在努力降低帶寬成本。B站2021年財報顯示,自2019年以來,B站的服務器和帶寬成本支出占總成本的比重不斷下降,由2019年的16.5%,降到了10.2%。2023年財報中同樣寫到,相比于2022年,B站的收入成本下降了5.3%,主要原因是降低了服務器和帶寬成本、員工成本、內(nèi)容成本及其他成本,具體而言,帶寬成本較上一年下降了15.7%。
但同樣要支付帶寬成本,為何YouTube的視頻能夠提供更高碼率?2020年,微信公眾號“紅流AKASHIO”曾推送了一篇文章,詳細講解了Google是如何與各運營商談判、降低YouTube的寬帶成本的。
文章梳理出了國內(nèi)外帶寬成本問題的兩個關(guān)鍵差異。一方面,運營商與平臺方的關(guān)系不同。國內(nèi)的運營商比平臺方更強勢,平臺需要向運營商支付帶寬費用,來保障用戶的訪問體驗。而在國外,Google比運營商更強勢,運營商反而需要主動與Google的機房對接,來改善自己用戶的訪問速度。
另一方面,海內(nèi)外運營商的收益模式也不同。海外運營商也許沒有從YouTube那里賺到錢,但卻從C端個人用戶手中收取更高昂的網(wǎng)費,但國內(nèi)運營商面向個人的收費則更低。2022年,運營商財經(jīng)網(wǎng)統(tǒng)計對比了我國與美國、韓國、英國等國的5G套餐資費,得出結(jié)論:“我國的5G套餐資費確實處于最低水平?!?/p>
更重要的是,國內(nèi)運營商還要承擔互聯(lián)網(wǎng)普及的社會責任。
如此一來,國內(nèi)運營商面向流媒體視頻平臺的高收費,似乎也無可厚非。畢竟在這背后,是縮小城鄉(xiāng)、區(qū)域間數(shù)字鴻溝的愿景。
在未來,壓縮算法技術(shù)的不斷更新,能為平臺提供新的解法,以化解帶寬成本與用戶體驗之間的矛盾嗎?在實際應用中,我們看到的反而是新的挑戰(zhàn)。其中之一便是,算法的更新帶來了編碼復雜度的增加,這意味著平臺需要為視頻編碼過程投入更多的時間和算力,而算力的消耗,也會帶來額外的成本投入和基礎設施升級。
也許技術(shù)的發(fā)展迭代,就是不斷地在蹺蹺板的起落中,找到那個最佳平衡點的位置。
由影視颶風的視頻引發(fā)的討論,表現(xiàn)出視頻平臺與觀眾對于視頻清晰度的不同認知與定義。
長期以來視頻平臺所呈現(xiàn)的,是以1080P、4K等分辨率為標準的清晰度等級。當觀眾越發(fā)認識到了碼率的重要性,編碼算法這一新的變量又冒了出來,告訴人們視頻可以在碼率較低的情況下達到較高的畫質(zhì)。直到有觀眾較真地進行了對比,才發(fā)現(xiàn)算法的“高效”可能只是大幅節(jié)省帶寬的手段。
視頻畫質(zhì)的好壞究竟要如何定義?還有更多的變量需要納入考量。2022年,嗶哩嗶哩技術(shù)發(fā)布了一篇科普文章,題為“是什么影響了視頻的碼率”,介紹了碼率背后的多個影響因素。要評價一個視頻的畫質(zhì),碼率是一個重要指標,但這并不簡單地等同于“碼率越高越好”。
碼率與視頻信息的復雜程度有關(guān)。假如一個視頻從頭到尾都是一張純色圖片,即使它壓縮后碼率很低,觀眾也不會察覺出畫質(zhì)的差異。相反,在李山的旅游vlog里,樹葉、草叢具有更多的紋理細節(jié),屬于需要更多碼率支撐的“高頻信息”,如果碼率被壓縮得太低,觀眾就能看出明顯的失真。
國內(nèi)運營商面向流媒體視頻平臺的高收費,似乎也無可厚非。畢竟在這背后,是縮小城鄉(xiāng)、區(qū)域間數(shù)字鴻溝的愿景。
Netflix使用的視頻質(zhì)量評估算法VMAF的評分結(jié)果顯示,不同類型的視頻要達到基本相同的畫質(zhì),所需要的碼率差距很大。動畫片中有很多大色塊,運動也相對簡單,在Netflix上即使以4K規(guī)格播放,碼率也常常在1—2Mbps之間。而一部電影中有大量運動鏡頭,一些畫面可能還有灰塵、水汽等細節(jié),如果同樣保持4K分辨率,碼率常常需要在16Mbps及以上。
視頻中不同TWY3fSVauEEcTCDXey59J8ykXPH/e+NvKWwTPcrsbJ0=部分的重要性,也影響著碼率的分配?!爸匾币馕吨叭搜鄹舾小保芯堪l(fā)現(xiàn),越是簡單規(guī)則、在畫面中停留時間長的內(nèi)容,人眼對其越敏感。相較于一片雜亂無章的草地,人眼更容易注意到藍天中漸變色彩的失真;同時,對于人眼來說,一個長時間停留的人物,要比快速走過的人影更加“重要”。
人臉也是重要的信息之一。嗶哩嗶哩多媒體算法組的蔡春磊曾在一次講座中提到,編碼算法的前提假設,其一就是人眼對結(jié)構(gòu)性信息的丟失很敏感,如果人臉、眼睛、鼻子等輪廓模糊,觀眾就能感知出來。
也正因此,視頻的壓縮是有選擇性的。即使在一個視頻內(nèi)部,信息的復雜和重要程度也并不均衡,碼率可以根據(jù)視頻內(nèi)容進行動態(tài)調(diào)整。例如相比于靜止的背景,運動中的人物更復雜,那么給后者分配更多的碼率,就能夠做到壓縮視頻的同時不影響觀眾的觀感。
而算法對信息的壓縮結(jié)果究竟如何?它們對信息的篩選是正確的嗎?要回答這些問題,人們又開發(fā)出了視頻質(zhì)量評價指標,上述的VMAF就是其中之一,同樣常用的指標還有峰值信噪比(PSNR)、結(jié)構(gòu)相似性(SSIM)。這些指標的目的,都是要更貼近人眼所感知的信息,以此對視頻畫質(zhì)做出評價。
但它們有時也會被迷惑。一個博主在測試VMAF對視頻的畫質(zhì)評價時發(fā)現(xiàn),如果只是將視頻畫面的對比度增強,VMAF的評分值會有所提高。但實際上,視頻的信息量并未真正提升,且原有的馬賽克、噪點依舊存在。
“學術(shù)界一直都在不斷探索,去尋找若干個貼合人眼主觀感知的客觀指標?!敝醪┲餍緞拥男盘枏氖乱曨l壓縮相關(guān)算法的開發(fā)已有8年,他告訴南風窗記者:“這些指標都不能完全等價于人眼主觀(感受),也無法適用于所有的場景?!?/p>
如何更好地平衡視頻壓縮與畫質(zhì)觀感,是未來平臺與研究者們將要持續(xù)探討的話題。而不論如何,相信自己的眼睛,也許是最簡單、卻也最能抵達正確答案的方式。
(文中李山、萬泉為化名)