顏媛媛
如果你是一名職場(chǎng)人士,通義聽悟可以幫你記錄和回顧你的每一場(chǎng)會(huì)議;
如果你是一位學(xué)生朋友,通義聽悟可以讓你不遺漏老師講授的每一個(gè)重點(diǎn);
如果你是一名金融分析師或媒體從業(yè)人員,通義聽悟可以存檔你每一次的調(diào)研訪談;
如果你想以最快的時(shí)間看完你最喜愛(ài)的視頻博主的直播分享,通義聽悟可以使你以成倍的速度抓住最精彩的內(nèi)容。
根據(jù)阿里云智能首席技術(shù)官周靖人介紹,聽悟集成了阿里最先進(jìn)的語(yǔ)音和語(yǔ)言技術(shù)。其內(nèi)置阿里新一代工業(yè)級(jí)語(yǔ)音識(shí)別模型,識(shí)別準(zhǔn)確率在多個(gè)權(quán)威中文數(shù)據(jù)集上名列第一;融合自研語(yǔ)音語(yǔ)義多模態(tài)說(shuō)話人算法,能對(duì) 10 人以上說(shuō)話場(chǎng)景進(jìn)行角色區(qū)分;接入通義千問(wèn)大模型后,能夠?qū)ι先f(wàn)字的音視頻內(nèi)容進(jìn)行摘要總結(jié),事實(shí)準(zhǔn)確與要點(diǎn)完備性國(guó)內(nèi)領(lǐng)先,支持跨多音視頻內(nèi)容的精準(zhǔn)問(wèn)答理解。
事實(shí)上,通義聽悟的前身是阿里云內(nèi)部一個(gè)名為“聽悟”的產(chǎn)品,主要功能包括實(shí)時(shí)會(huì)議、音頻轉(zhuǎn)寫功能,“聽悟”自2022 年年底就開始小范圍內(nèi)測(cè)。而如今,在阿里云通義千問(wèn)大模型的加持下,通義聽悟成為人們工作學(xué)習(xí)的AI 助手,從會(huì)議討論、教學(xué)培訓(xùn)到調(diào)研訪談,通義聽悟都能極大提高人們的工作效率。
通義聽悟具有極強(qiáng)的工具屬性,而在看重軟件生產(chǎn)力的辦公領(lǐng)域,能夠幫助“打工人”自動(dòng)做筆記、提取PPT、整理訪談的通義聽悟一亮相就受到大眾的高度關(guān)注。目前通義聽悟提供小程序和PC 網(wǎng)頁(yè)兩個(gè)使用途徑,其中,移動(dòng)端通義聽悟界面設(shè)計(jì)相對(duì)簡(jiǎn)單,提供“上傳手機(jī)音視頻”“實(shí)時(shí)記錄”“權(quán)益加油站”三個(gè)選項(xiàng),通常簡(jiǎn)單的會(huì)議記錄喜歡用手機(jī)直接做“實(shí)時(shí)記錄”,不過(guò)遺憾的是通義聽悟建議在PC 端體驗(yàn)更多功能,這意味著手機(jī)端更多的操作還是以“上傳手機(jī)音視頻”為主(如圖1)。
上傳之前,通義聽悟會(huì)讓用戶選擇“轉(zhuǎn)寫語(yǔ)言”及是否“區(qū)分發(fā)言人”,提前做好預(yù)設(shè)之后,明顯能更準(zhǔn)確地獲得文字轉(zhuǎn)寫記錄。而在選擇上傳內(nèi)容界面,讓筆者比較驚喜的是除頂部工具條按照“圖片”“音頻”“視頻”“文檔”做了分類,方便用戶選擇本地文件外,用戶還可以打開第三方應(yīng)用提取音視頻文件。
比較有意思的是通義聽悟自身介紹時(shí)表示可以打通同阿里云盤的內(nèi)容關(guān)聯(lián),但在移動(dòng)版通義聽悟內(nèi)容選擇界面,其加入了“中國(guó)移動(dòng)云盤”這一選項(xiàng)(如圖2)。筆者嘗試點(diǎn)擊“中國(guó)移動(dòng)云盤”后發(fā)現(xiàn),能很好地識(shí)別網(wǎng)盤里面的內(nèi)容,但是無(wú)法提取文件。
順帶嘗試了一下“錄音機(jī)”發(fā)現(xiàn)同樣無(wú)法提取,而顯示的是系統(tǒng)“錄音機(jī)”功能界面,但即便是錄音無(wú)法導(dǎo)入,從測(cè)試結(jié)果看,移動(dòng)版通義聽悟在第三方應(yīng)用兼容上還有待提升。轉(zhuǎn)而嘗試PC 版通義聽悟。
打開通義聽悟官方網(wǎng)站(tingwu.aliyun.com)后,用戶使用手機(jī)號(hào)即可登錄。進(jìn)入首界面之后比較直觀的就是“開啟實(shí)時(shí)記錄”和“上傳音視頻”兩個(gè)選項(xiàng),點(diǎn)擊“開啟實(shí)時(shí)記錄”后即可開始錄音(如圖3)。
在點(diǎn)擊“開始錄音”按鈕以前,用戶可以和移動(dòng)版一樣選擇“轉(zhuǎn)寫語(yǔ)言”和“翻譯”,點(diǎn)擊“開始錄音”按鍵后,通義聽悟會(huì)開始工作。PC 端的通義聽悟在語(yǔ)音編輯這塊帶給筆者極大的驚喜。用戶停止同步錄音后,會(huì)跳轉(zhuǎn)到編輯界面。左側(cè)為智能總結(jié)界面,非常清晰地展示“關(guān)鍵詞”“全文概要”等內(nèi)容,用戶也可以手動(dòng)進(jìn)行編輯(如圖4)。
而在左側(cè)的編輯界面中,用戶可以利用PC 鍵盤進(jìn)行高效編輯,而且還可以直接插入圖片、表格等元素,在功能上完全可以和部分輕辦公的在線文檔一較高低。除了高效編輯功能的搭載外,通義聽悟在頂部快捷工具欄上還設(shè)置了翻譯、高亮標(biāo)注、AI 實(shí)驗(yàn)室等功能。
相對(duì)于人們熟悉的高亮標(biāo)注、翻譯功能,AI 實(shí)驗(yàn)室提供“發(fā)言人區(qū)分”“問(wèn)題回顧”“待辦事項(xiàng)”等細(xì)分功能,開啟這些功能后,智能算法會(huì)根據(jù)自己的理解對(duì)本次記錄中的內(nèi)容進(jìn)行標(biāo)注與分類。完成一系列操作之后,用戶可以點(diǎn)擊界面左側(cè)邊欄,選擇導(dǎo)出文件,除文字內(nèi)容可以以doc\pdf\srt 等多種格式導(dǎo)出外,筆記、音頻文件也可以按用戶需求進(jìn)行導(dǎo)出。除強(qiáng)大的編輯功能外,多人訪談的錄音轉(zhuǎn)文字應(yīng)用也是通義聽悟的一大特色,其能自動(dòng)根據(jù)語(yǔ)音對(duì)文字內(nèi)容進(jìn)行分類,讓用戶能夠?qū)Χ嗳藭?huì)議或者電話采訪錄音進(jìn)行高效轉(zhuǎn)錄及整理(如圖5)。
隨著遠(yuǎn)程教育的發(fā)展,網(wǎng)課資源變得格外豐富,不過(guò)動(dòng)輒數(shù)百小時(shí)的視頻課程,雖然直觀生動(dòng)地對(duì)知識(shí)點(diǎn)進(jìn)行了講解,可對(duì)于中高年級(jí)學(xué)生而言,一些難度相對(duì)較低的課程,文本形式的內(nèi)容獲取方式更為高效,而較難的內(nèi)容,配合文本概要,同樣能起到事半功倍的效果。
通義聽悟可以實(shí)現(xiàn)學(xué)習(xí)視頻的批量轉(zhuǎn)寫,幫助用戶輕松掌握學(xué)習(xí)秘籍。打開“上傳音視頻”功能,選擇“上傳本地音視頻文件”并上傳,即可生成課程記錄。最棒的還是PC 版通義聽悟打通了同阿里云盤的鏈接,可以選擇“導(dǎo)入阿里云盤文件”并上傳(如圖6)。
初次使用需要用戶先綁定阿里云盤賬號(hào),用戶通過(guò)手機(jī)APP 掃碼、賬號(hào)密碼或手機(jī)驗(yàn)證碼等多種方式登錄并同意通義聽悟綁定阿里云盤賬號(hào)。完成綁定后會(huì)彈出文件目錄讓用戶選擇,文字分級(jí)菜單讓用戶選擇起來(lái)非常方便,而右上角的“音頻”“視頻”兩個(gè)選項(xiàng)也為用戶篩選提供了便利。
通義聽悟在內(nèi)容識(shí)別整理方面絕對(duì)是令人驚喜的,其播放課程視頻,文字與視頻進(jìn)度可以實(shí)現(xiàn)一一對(duì)應(yīng),用戶可以點(diǎn)擊文字跳轉(zhuǎn)進(jìn)度,隨心切換感興趣的內(nèi)容。以左側(cè)工具欄中的“關(guān)鍵詞”為例,用戶點(diǎn)擊相應(yīng)關(guān)鍵詞之后,視頻會(huì)滾動(dòng)到相應(yīng)的部分,而內(nèi)容框也會(huì)出現(xiàn)該視頻內(nèi)容的文字翻譯,為用戶提供最詳細(xì)的內(nèi)容拆解。
通義聽悟非常強(qiáng)悍的是它會(huì)為用戶總結(jié)全文概要、章節(jié)速覽,方便學(xué)生了解課程要點(diǎn),回顧講解片段。對(duì)于網(wǎng)課學(xué)生而言,這樣的整理能夠?yàn)橛脩艄?jié)省下大量筆記時(shí)間,進(jìn)而讓學(xué)生在網(wǎng)課過(guò)程中更集中注意力在課程內(nèi)容本身。
除全程記錄課程要點(diǎn)外,通義聽悟更難能可貴的是支持問(wèn)題回顧。用戶打開通義聽悟?qū)嶒?yàn)室,開啟問(wèn)題回顧,即可查看課程中的答疑內(nèi)容。
而有了詳細(xì)的原文內(nèi)容之后,用戶就可以在通義聽悟里面進(jìn)行原文內(nèi)容的重點(diǎn)標(biāo)注,讓學(xué)習(xí)和復(fù)習(xí)效率更高。同時(shí),通義聽悟支持中英互譯,在頂部翻譯功能入口,開啟翻譯即可??梢赃x擇雙語(yǔ)顯示/ 只看譯文。
最受學(xué)生好評(píng)的還是筆記整理功能,用戶可以在右側(cè)筆記中,記錄核心知識(shí)點(diǎn),將課程原文一鍵摘取至筆記中。在該功能的加持下,幾小時(shí)的課程,往往只需5 分鐘即可完成筆記。而這一系列操作都可以在通義聽悟右側(cè)文本編輯界面中完成,而每完成一個(gè)課程的筆記整理后,即可點(diǎn)擊頁(yè)面左側(cè)“導(dǎo)出”按鈕,將轉(zhuǎn)寫結(jié)果、筆記等內(nèi)容導(dǎo)出至本地或阿里云盤。你可以選擇需要的文件格式。
在語(yǔ)音轉(zhuǎn)文字領(lǐng)域,通義聽悟?qū)儆凇靶氯恕币话愕拇嬖冢幱谕茝V階段的通義聽悟自然會(huì)有不少福利讓用戶領(lǐng)取。首先便是時(shí)長(zhǎng),畢竟無(wú)論是會(huì)議記錄還是音視頻內(nèi)容翻譯,動(dòng)輒數(shù)小時(shí)一次的內(nèi)容,需要不少時(shí)長(zhǎng)話費(fèi)。目前通義聽悟的時(shí)長(zhǎng)活動(dòng)主要有三個(gè),分別是“每日登錄通義聽悟,自動(dòng)獲得2 小時(shí)轉(zhuǎn)寫時(shí)長(zhǎng)”“每邀請(qǐng)1 名好友注冊(cè)并登錄通義聽悟賬號(hào),邀請(qǐng)者可獲得2 小時(shí)轉(zhuǎn)寫時(shí)長(zhǎng)”和“輸入口令兌換轉(zhuǎn)寫時(shí)長(zhǎng)”(如圖7)。
這三個(gè)活動(dòng)中,“輸入口令兌換轉(zhuǎn)寫時(shí)長(zhǎng)”能夠領(lǐng)取的時(shí)長(zhǎng)最多,筆者只兌換了兩個(gè)口令時(shí)長(zhǎng)加上日常登錄積累,已經(jīng)積累了快50 小時(shí)使用時(shí)長(zhǎng)了。相對(duì)使用時(shí)長(zhǎng),比較尷尬的是存儲(chǔ)空間,筆者已經(jīng)綁定阿里云盤的情況下,也就獲得了2GB 的存儲(chǔ)空間,可視頻轉(zhuǎn)錄基本一個(gè)視頻就在1GB 上下,相當(dāng)于2 個(gè)視頻課程就會(huì)容量告急,何況不少在線視頻課程容量都在1GB 以上,而一旦容量使用完成,就沒(méi)辦法再進(jìn)行任何轉(zhuǎn)錄操作了(如圖8)。
從筆者的使用經(jīng)驗(yàn)看,一旦通義聽悟有促銷活動(dòng)出來(lái),用戶一定要將存儲(chǔ)空間放到第一位,只有擴(kuò)大了存儲(chǔ)空間,才能無(wú)所顧忌地實(shí)現(xiàn)轉(zhuǎn)錄,否則就需要完成一個(gè)視頻的轉(zhuǎn)錄、刪除掉以后再完成下一個(gè)。
總體而言,無(wú)論工作還是學(xué)習(xí),通義聽悟表現(xiàn)出的生產(chǎn)力工具屬性都大為讓人驚喜,尤其是筆記整理、問(wèn)答顯示等使用功能的配備,更讓其成為極優(yōu)秀的“學(xué)伴”!