繁體簡體

從技術(shù)創(chuàng)新走向產(chǎn)業(yè)應(yīng)用 越來越多虛擬數(shù)字人“上崗”了

華夏經(jīng)緯網(wǎng) > 新聞 > 大陸新聞 > 社會綜合      2022-12-30 09:36:10

隨著人工智能、虛擬現(xiàn)實等技術(shù)的發(fā)展,數(shù)字虛擬人頻頻出現(xiàn)在公眾的視野。作為以數(shù)字形式存在于數(shù)字空間中并具有擬人或真人外貌、行為和特點的虛擬人物,數(shù)字人是如何研發(fā)的?有哪些應(yīng)用?

走進人們?nèi)粘I?/p>

“大家好,谷小雨有禮了!”近日,在南宋德壽宮遺址博物館開館儀式上,一位身著古裝的虛擬數(shù)字人擔(dān)任主持人,吸引了觀眾的注意。仔細瞧,這位數(shù)字人柳葉細眉、衣袂飄飄、氣質(zhì)素雅、靈動可愛。它便是浙江廣電集團旗下浙江衛(wèi)視推出的宋韻文化推廣人。

“我們推出谷小雨,既是向傳統(tǒng)文化靠近,也是向年輕群體靠攏?!闭憬l(wèi)視谷小雨工作室負責(zé)人接受本報采訪時表示,谷小雨是由浙江衛(wèi)視研發(fā)的首個數(shù)字國潮產(chǎn)品。這個產(chǎn)品把宋韻元素與新媒介、新技術(shù)、新應(yīng)用融合,創(chuàng)新性地打造出谷小雨這個形象?!拔覀兿M每捎H可愛的人物形象、可感可觸的數(shù)字手段,讓廣大受眾尤其是年輕人喜歡上宋韻文化。”

谷小雨已在多種場合亮相——電視節(jié)目中,它吟唱宋詞、介紹宋代蹴鞠文化;世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會期間,它與嘉賓通過H5在線合拍;在南宋德壽宮遺址博物館,它成為導(dǎo)覽員,對答游客提問應(yīng)答如流……最近,谷小雨參與的“南宋人的一天” 對外文化交流云展覽,還陸續(xù)在新西蘭、德國、荷蘭、巴基斯坦等國的中國文化中心上線。

與谷小雨類似,越來越多的數(shù)字人在文旅、金融、政務(wù)等服務(wù)領(lǐng)域“上崗”,走進人們?nèi)粘I睢@?,以敦煌飛天為藍本打造的國風(fēng)虛擬數(shù)字人天妤,在全網(wǎng)已擁有500余萬粉絲;在2022世界人工智能大會上亮相的中信金控新員工——數(shù)字人小信,可以擔(dān)任客戶的專屬財富規(guī)劃師;打開湖北省仙桃市人民政府門戶網(wǎng)站,紅衣白裙的數(shù)字人“桃桃”笑盈盈地對視頻新聞、政策解讀進行播報……《數(shù)字人產(chǎn)業(yè)發(fā)展趨勢報告(2023)》指出,隨著交互智能技術(shù)的加速發(fā)展,數(shù)字人正在從技術(shù)創(chuàng)新走向產(chǎn)業(yè)應(yīng)用。

有趣的內(nèi)涵不能少

如此逼真的數(shù)字人是如何打造出來的呢?以谷小雨為例,數(shù)字人首先要做到“形似人”。按照人物概念設(shè)計,谷小雨來自南宋臨安,生于谷雨時節(jié),有“雨生百谷,欣欣向榮”的美好寓意。浙江衛(wèi)視特地與宋韻文化研究傳承中心合作,邀請相關(guān)宋韻專家組成顧問團,為谷小雨的人物造型、形象設(shè)計、內(nèi)容呈現(xiàn)等提供全程專業(yè)級指導(dǎo)把關(guān)。亮相一檔歌唱節(jié)目時,谷小雨的舞臺造型是一套現(xiàn)代改良的宋制漢服,上身是改良褙子、宋抹疊穿,袖口造型以西湖荷葉為靈感,下身是水墨印花長裙,妝容參考的是南宋仕女珍珠妝。

作為技術(shù)支持方,騰訊團隊打造出一個超200萬面數(shù)的高精度寫實虛擬人,滿足大型舞臺節(jié)目錄制以及智能多模態(tài)交互的多樣化需求。騰訊相關(guān)負責(zé)人劉明亮告訴記者,谷小雨的麻花辮由30萬根發(fā)絲組成,不同材質(zhì)的衣物有5層,為了達到形神兼?zhèn)涞男Ч瑘F隊基于游戲引擎進行實時交互模擬,使得人物在不同燈光、不同動作下的表現(xiàn)都非常真實。

除了“好看的皮囊”,數(shù)字人還要具備“有趣的內(nèi)涵”。例如,在出任導(dǎo)覽員之前,谷小雨進行了400G開放數(shù)據(jù)和30億參數(shù)量的超大規(guī)模語言模型訓(xùn)練,再加上海量宋韻文獻和百科搜索引擎的助力,谷小雨成功掌握了宋韻百科知識。為了使谷小雨能夠與游客實時語音對話,技術(shù)團隊運用語音識別、自然語言理解、語音合成等技術(shù),讓這位數(shù)字導(dǎo)覽員聽得懂、答得出、懂得多。

谷小雨還采用了語音驅(qū)動口型技術(shù),通過適配各種音色、歌唱、語氣詞等不同類型的音頻輸入,學(xué)習(xí)種類繁多的情感語音數(shù)據(jù),生成韻律自然、情感風(fēng)格豐富和個性化的高表現(xiàn)力語音,再配合靈動準(zhǔn)確的面部表情和口型,讓數(shù)字人的語音達到可媲美真人的效果。

產(chǎn)業(yè)增長勢頭強勁

目前,數(shù)字人已在企業(yè)服務(wù)、影視動畫、文化傳媒等領(lǐng)域得到廣泛應(yīng)用。艾媒咨詢《2022-2023年中國虛擬人行業(yè)深度研究及投資價值分析報告》稱,在娛樂需求增加、人工智能等技術(shù)不斷迭代的背景下,中國虛擬人產(chǎn)業(yè)高速發(fā)展,元宇宙的熱潮加速推動虛擬數(shù)字人產(chǎn)業(yè)升級。數(shù)據(jù)顯示,2021年中國虛擬人帶動產(chǎn)業(yè)市場規(guī)模和核心市場規(guī)模分別為1074.9億元和62.2億元,預(yù)計2025年分別達到6402.7億元和480.6億元,呈現(xiàn)強勁的增長勢頭。

記者了解到,虛擬數(shù)字人的制作流程一般包括模型綁定、動作捕捉、動畫解算、實時渲染等步驟,其中要運用到大量的現(xiàn)實增強、深度學(xué)習(xí)、虛擬制片等高科技前沿技術(shù)。比較簡單的動漫形象數(shù)字人,一般1個月就能完成;而制作一個更寫實的3D數(shù)字人,從角色設(shè)計到完成渲染需要3至6個月甚至更久。數(shù)字人越是“精致”“逼真”,越花費時間、人力成本。

劉明亮表示,算力提升、引擎升級等技術(shù)迭代,正推動數(shù)字人制作效能和智能水平持續(xù)提升。一方面,制作數(shù)字人的成本更低、效率更高;另一方面,數(shù)字人的交互性越來越強,提供的服務(wù)和陪伴等“人”的屬性更強。

業(yè)內(nèi)人士認為,從關(guān)注動畫、渲染的身份型數(shù)字人到融合語言理解能力、表達能力、學(xué)習(xí)能力、交互能力的服務(wù)型數(shù)智人,從在線服務(wù)到在場體驗,隨著元宇宙相關(guān)技術(shù)的進一步發(fā)展,數(shù)字人將進入大規(guī)模應(yīng)用期,加速轉(zhuǎn)化為現(xiàn)實生產(chǎn)力。(人民日報海外版 記者:葉 子)

文章來源:人民日報海外版
責(zé)任編輯:姚思寒
熱門評論
互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120170072
京公網(wǎng)安備 11010502045281號
違法和不良信息舉報電話:010-65669841
舉報郵箱:xxjb@huaxia.com

網(wǎng)站簡介 / 廣告服務(wù) / 聯(lián)系我們

主辦:華夏經(jīng)緯信息科技有限公司   版權(quán)所有 華夏經(jīng)緯網(wǎng)

Copyright 2001-2024 By 612g.cn