眼下,信息的傳播速度空前加快,數(shù)據(jù)的價(jià)值日益凸顯,智能互聯(lián)的理念逐步滲透到社會(huì)的各個(gè)層面,從智能家居的普及到智慧城市的構(gòu)建,從在線教育的興起到遠(yuǎn)程醫(yī)療的應(yīng)用,數(shù)字技術(shù)的廣泛應(yīng)用不斷刷新著人們的認(rèn)知邊界。
在科技日新月異的今天,智能數(shù)字人技術(shù)正以其獨(dú)特的魅力,搭建起虛擬與現(xiàn)實(shí)之間溝通的橋梁,引領(lǐng)著數(shù)字娛樂(lè)、教育、醫(yī)療等多個(gè)領(lǐng)域的深刻變革。作為數(shù)字人底層技術(shù)基礎(chǔ)設(shè)施服務(wù)商的數(shù)字栩生(北京)科技有限公司(以下簡(jiǎn)稱“數(shù)字栩生”),自成立以來(lái),通過(guò)不斷創(chuàng)新與突破,在技術(shù)研發(fā)、應(yīng)用場(chǎng)景等方面取得了顯著成果,迅速在行業(yè)內(nèi)嶄露頭角。這些成果不僅展現(xiàn)了數(shù)字栩生的科技實(shí)力和市場(chǎng)競(jìng)爭(zhēng)力,也為數(shù)字人技術(shù)的發(fā)展和應(yīng)用提供了有益的借鑒。
堅(jiān)持自主研發(fā)
真實(shí)度顯著躍升
數(shù)字栩生的核心團(tuán)隊(duì)成員來(lái)自北京理工大學(xué)、中國(guó)科學(xué)院自動(dòng)化所、北京電影學(xué)院高精尖中心等科研院所,集合了光學(xué)、圖形學(xué)與計(jì)算機(jī)科學(xué)等各領(lǐng)域?qū)<?,形成了藝術(shù)與技術(shù)雙輪驅(qū)動(dòng)的獨(dú)特優(yōu)勢(shì)。正是這樣的團(tuán)隊(duì)配置,為數(shù)字栩生的技術(shù)創(chuàng)新提供了堅(jiān)實(shí)的保障。
數(shù)字栩生的核心技術(shù)聚焦在光場(chǎng)重建技術(shù)(Light Field Reconstruction)和四維面部數(shù)據(jù)采集系統(tǒng)。傳統(tǒng)的數(shù)字人制作往往面臨著逼真度不足的問(wèn)題,難以在視覺(jué)上達(dá)到與真人無(wú)異的效果。而數(shù)字栩生通過(guò)自主研發(fā)的光場(chǎng)重建技術(shù),結(jié)合智能解耦算法,實(shí)現(xiàn)8K精度,使得數(shù)字人的面部特征、皮膚質(zhì)感、光影效果等復(fù)雜元素進(jìn)行精細(xì)分離與重構(gòu),從而在保持高度個(gè)性化的同時(shí),實(shí)現(xiàn)了超逼真的外貌表現(xiàn)。這一技術(shù)不僅提升了數(shù)字人的視覺(jué)質(zhì)量,更重要的是,它顯著縮短了數(shù)字人的制作周期,降低了制作成本,使得高質(zhì)量的數(shù)字人制作更加高效。
如果說(shuō)光場(chǎng)重建技術(shù)是數(shù)字人靜態(tài)美的塑造者,那么四維面部數(shù)據(jù)采集系統(tǒng)則是其動(dòng)態(tài)魅力的賦予者。該系統(tǒng)通過(guò)引入時(shí)間軸的概念,實(shí)現(xiàn)了對(duì)面部動(dòng)態(tài)效果的全面升級(jí)。傳統(tǒng)的三維數(shù)字人人臉采集技術(shù)受限于靜態(tài)或單一角度的數(shù)據(jù)捕捉,難以準(zhǔn)確捕捉并還原復(fù)雜的面部動(dòng)態(tài)變化。而四維面部數(shù)據(jù)采集系統(tǒng)則通過(guò)高精度、多視角、連續(xù)幀的數(shù)據(jù)采集,結(jié)合先進(jìn)的自動(dòng)解算算法,能夠捕捉到包括微笑、眨眼、表情變化在內(nèi)的細(xì)微面部動(dòng)態(tài),生成帶時(shí)間軸的序列幀數(shù)據(jù)。
這些數(shù)據(jù)的豐富性和準(zhǔn)確性,為后續(xù)的面部重建和驅(qū)動(dòng)提供了條件,不僅使得數(shù)字人的面部動(dòng)態(tài)效果更加自然流暢,而且極大地豐富了數(shù)字人的情感表達(dá)和互動(dòng)能力。
數(shù)字栩生的光場(chǎng)重建技術(shù)與四維面部數(shù)據(jù)采集系統(tǒng),共同構(gòu)建了一個(gè)從靜態(tài)到動(dòng)態(tài)、從外觀到內(nèi)涵全方位提升的數(shù)字人制作體系。這兩項(xiàng)技術(shù)的融合與創(chuàng)新,不僅推動(dòng)了數(shù)字人技術(shù)的邊界拓展,更為數(shù)字人產(chǎn)業(yè)的繁榮發(fā)展注入了新的活力。
除兩大核心技術(shù)之外,在數(shù)字人驅(qū)動(dòng)方面,數(shù)字栩生提出了“AI小腦”概念,為數(shù)字人的個(gè)性化、智能化交互提供了新的解決方案?!癆I小腦”是數(shù)字栩生技術(shù)中臺(tái)的重要組成部分,它負(fù)責(zé)將人與數(shù)字人的交互轉(zhuǎn)化為人工智能系統(tǒng)可理解的信號(hào),并再將人工智能系統(tǒng)的反饋轉(zhuǎn)化為數(shù)字人個(gè)性化的表情、動(dòng)作和語(yǔ)言。通過(guò)與真實(shí)人類的腦結(jié)構(gòu)相呼應(yīng),“AI小腦”實(shí)現(xiàn)了數(shù)字人的情感表達(dá)與深度學(xué)習(xí),使得數(shù)字人在與人交互時(shí)能夠展現(xiàn)出更加真實(shí)、自然的情感反應(yīng)。
與此同時(shí),在技術(shù)創(chuàng)新的基礎(chǔ)上,數(shù)字栩生不斷推出具有市場(chǎng)競(jìng)爭(zhēng)力的解決方案,“靈瀧”是數(shù)字栩生推出的面向高校教育場(chǎng)景的光場(chǎng)掃描采集設(shè)備,能讓學(xué)生在很短的時(shí)間內(nèi)對(duì)于數(shù)字人制作有全面的了解。
除此之外,數(shù)字栩生推出的基于單張照片的數(shù)字人生成技術(shù),能夠通過(guò)一張普通照片,快速生成可交互的2.5D版本的數(shù)字人。這個(gè)技術(shù)路徑不但降低了數(shù)字人的制作門檻,更拓寬了數(shù)字人的應(yīng)用場(chǎng)景。
多領(lǐng)域廣泛布局
應(yīng)用場(chǎng)景豐富多樣
數(shù)字栩生的創(chuàng)新成果不僅體現(xiàn)在針對(duì)數(shù)字人技術(shù)的突破,更體現(xiàn)在其豐富的應(yīng)用場(chǎng)景中。從文化傳承到游戲互娛,從企業(yè)形象到公共服務(wù),數(shù)字栩生的數(shù)字虛擬人正在多個(gè)領(lǐng)域發(fā)揮著作用。
在文化傳承的廣闊舞臺(tái)上,數(shù)字栩生可以將歷史名人、傳統(tǒng)文化元素以三維高逼真的數(shù)字人形式復(fù)現(xiàn),使魯迅先生的深邃目光、梅蘭芳先生的精湛唱腔得以跨越時(shí)空,生動(dòng)再現(xiàn)于現(xiàn)代人的眼前耳畔,更通過(guò)細(xì)膩的情感表達(dá)與互動(dòng)設(shè)計(jì),讓觀者仿佛穿越時(shí)空,與歷史名人進(jìn)行了一場(chǎng)跨越世紀(jì)的心靈對(duì)話。這種超現(xiàn)實(shí)的沉浸式體驗(yàn),極大地豐富了文化傳播的形式,激發(fā)了公眾對(duì)傳統(tǒng)文化的興趣與熱愛(ài),為傳統(tǒng)文化的活態(tài)傳承開(kāi)辟了新路徑。
在游戲互娛領(lǐng)域,數(shù)字栩生的創(chuàng)新技術(shù)為游戲世界帶來(lái)了耳目一新的變化。此前,中國(guó)首款電影級(jí)云原生VR互動(dòng)游戲《春草傳》正式發(fā)布,數(shù)字栩生為游戲角色“春草”提供了獨(dú)家技術(shù)支持。在數(shù)字面部實(shí)時(shí)驅(qū)動(dòng)上,數(shù)字栩生研發(fā)了“春草”定制的面部技術(shù)解決方案,完成了表演級(jí)的面部實(shí)時(shí)捕捉和輸出,讓導(dǎo)演可以直接看到“春草”真實(shí)細(xì)膩的表演效果。目前,“春草”作為數(shù)字人演員,已成功出道。“春草”的誕生,既豐富了虛擬經(jīng)濟(jì)產(chǎn)品的序列,也為數(shù)字人的發(fā)展提供了全新的行業(yè)思路。
在企業(yè)形象的塑造上,數(shù)字栩生的數(shù)字人技術(shù)更是展現(xiàn)出其可觀的商業(yè)潛力。通過(guò)定制化服務(wù),企業(yè)可以擁有專屬的數(shù)字人形象,這些形象不僅外觀符合企業(yè)品牌調(diào)性,更能通過(guò)智能交互技術(shù),實(shí)現(xiàn)與消費(fèi)者的深度溝通,有效增強(qiáng)品牌記憶點(diǎn),提升品牌形象的年輕化與國(guó)際化水平。在社交媒體、直播帶貨、新品發(fā)布會(huì)等多元場(chǎng)景中,數(shù)字人已成為眾多品牌競(jìng)相追逐的新寵。
在公共服務(wù)領(lǐng)域,數(shù)字栩生的數(shù)字人技術(shù)同樣大放異彩。在博物館、科技館、文化展廳等場(chǎng)所,AI數(shù)字人講解員以其親切自然的語(yǔ)言、精準(zhǔn)無(wú)誤的信息傳遞,為參觀者提供了個(gè)性化的導(dǎo)覽服務(wù),大大提升了參觀體驗(yàn)。例如,2024年7月,“金字塔之巔:古埃及文明大展”在上海博物館開(kāi)幕。在這場(chǎng)跨越時(shí)空的文明盛事里,數(shù)字栩生的國(guó)內(nèi)首位博物館終端3D數(shù)字人AI導(dǎo)覽員“小可”正式亮相,憑借其生動(dòng)立體的形象和智能的導(dǎo)覽服務(wù),成功搭建起古埃及文明與現(xiàn)代科技的橋梁;在手語(yǔ)服務(wù)方面,數(shù)字栩生與專業(yè)機(jī)構(gòu)合作,將其數(shù)字人技術(shù)整合到新聞播報(bào)和特殊教育環(huán)境中,以標(biāo)準(zhǔn)化的手語(yǔ)翻譯,為聽(tīng)障人士打造便捷新穎的觀看體驗(yàn)。
此外,在遠(yuǎn)程教育、醫(yī)療咨詢等場(chǎng)景,數(shù)字人技術(shù)的應(yīng)用也有效緩解了資源分配不均的問(wèn)題,讓更多人享受到高質(zhì)量的公共服務(wù)。
近年來(lái),數(shù)字栩生的科技成果和創(chuàng)新實(shí)踐得到了業(yè)界的廣泛認(rèn)可和贊譽(yù),收獲多個(gè)獎(jiǎng)項(xiàng)。例如,在由科技部、財(cái)政部、教育部、全國(guó)工商聯(lián)等單位共同指導(dǎo),科技部火炬中心等單位共同承辦的第十一屆中國(guó)創(chuàng)新創(chuàng)業(yè)大賽中,數(shù)字栩生憑借“可實(shí)時(shí)驅(qū)動(dòng)超寫(xiě)實(shí)數(shù)字人”項(xiàng)目,獲得北京賽區(qū)初創(chuàng)組“二等獎(jiǎng)”,并成功入圍全國(guó)總決賽,最終脫穎而出,獲得第十一屆中國(guó)創(chuàng)新創(chuàng)業(yè)大賽初創(chuàng)組“優(yōu)秀企業(yè)”榮譽(yù)稱號(hào)。另外,在由北京市文物局主辦的“2023年北京地區(qū)博物館新技術(shù)揭榜掛帥挑戰(zhàn)賽”中,其憑借“場(chǎng)館指引導(dǎo)覽智能交互數(shù)字人”項(xiàng)目斬獲一等獎(jiǎng)。這些榮譽(yù)的取得,不僅是對(duì)數(shù)字栩生過(guò)去成績(jī)的肯定,也是對(duì)其未來(lái)發(fā)展的激勵(lì)。
數(shù)字栩生方面表示,接下來(lái)將重點(diǎn)布局人工智能生成內(nèi)容(AIGC)領(lǐng)域,將AIGC與超寫(xiě)實(shí)數(shù)字人技術(shù)相結(jié)合,并且不斷迭代解決方案,持續(xù)提升數(shù)字人逼真度和交互性能,探索在元宇宙等前沿領(lǐng)域的應(yīng)用,為推動(dòng)該領(lǐng)域的發(fā)展持續(xù)貢獻(xiàn)力量。