繁體簡體

游戲科技登上頂級學(xué)術(shù)會(huì)議,騰訊游戲GVoice NKF亮相ICASSP 2023

(原標(biāo)題:游戲科技登上頂級學(xué)術(shù)會(huì)議,騰訊游戲GVoice NKF亮相ICASSP 2023)

6月4日-10日,國際聲學(xué)、語音與信號處理會(huì)議ICASSP 2023(全稱:International Conference on Acoustics, Speech and Signal Processing)在希臘羅德島舉辦。在本次會(huì)議上,騰訊游戲公共研發(fā)運(yùn)營體系(CROS)的GVoice攜全球首次提出的混合架構(gòu)的子帶(subband)Neural Kalman濾波算法(GVoice NKF)亮相,目前該技術(shù)已成為Github 社區(qū)今年最受歡迎的回聲消除算法之一。

游戲科技登上頂級學(xué)術(shù)會(huì)議,騰訊游戲GVoice NKF亮相ICASSP 2023

ICASSP是全世界規(guī)模最大、最全面的聲學(xué)、語音和信號處理方面的國際會(huì)議,也是語音技術(shù)領(lǐng)域最具影響力的頂級國際會(huì)議之一。本次會(huì)議上,來自全球各地的學(xué)者、應(yīng)用廠商代表共聚一堂,分享語音技術(shù)領(lǐng)域的最新研究成果,交流技術(shù)創(chuàng)新和落地場景應(yīng)用,探討全球語音技術(shù)發(fā)展趨勢。

在這一最前沿技術(shù)的國際舞臺上,騰訊游戲GVoice內(nèi)核算法負(fù)責(zé)人楊棟介紹了GVoice NKF算法的研究背景、研究過程及最新應(yīng)用成果,吸引了眾多與會(huì)者圍繞算法展開討論。其中,聲學(xué)領(lǐng)域泰斗級專家Gerald Enzner教授對這一算法技術(shù)突破給予了高度評價(jià),并與楊棟深入交流。楊棟表示,在工業(yè)界,好的回聲消除算法需要滿足非線性失真對線性模型的影響盡量小,雙講過程中盡量保持ERLE和SDR等指標(biāo),模型復(fù)雜度越低越好,現(xiàn)實(shí)環(huán)境下面具備較好的回聲路徑的跟蹤能力,模型的泛化能力要好、做到無超參等要求。

游戲科技登上頂級學(xué)術(shù)會(huì)議,騰訊游戲GVoice NKF亮相ICASSP 2023

而GVoice NKF從學(xué)術(shù)角度首次提出并驗(yàn)證了Kalman濾波可以用數(shù)字信號處理(MB)和數(shù)據(jù)驅(qū)動(dòng)(DD)混合架構(gòu)完成回聲消除任務(wù),驗(yàn)證了數(shù)字信號處理框架指導(dǎo)數(shù)據(jù)驅(qū)動(dòng)模型可以有效降低神經(jīng)網(wǎng)絡(luò)模型復(fù)雜度。這一算法用較少的數(shù)據(jù)就可以得到泛化能力超強(qiáng)的模型,并且系統(tǒng)性解決了貝葉斯類型自適應(yīng)濾波器算法的重收斂的問題。

目前,圍繞GVoice NKF算法的論文《基于神經(jīng)網(wǎng)絡(luò)的低復(fù)雜度卡爾曼濾波器自適應(yīng)回聲消除算法》(Low-Complexity Acoustic Echo Cancellation with Neural Kalman Filtering)已被會(huì)議收錄。同時(shí)在Github 社區(qū)中,GVoice NKF算法也受到極大關(guān)注與認(rèn)可,短時(shí)間內(nèi)已經(jīng)獲得116枚star,收藏?cái)?shù)量名列第三,在原創(chuàng)算法中排名第二,且呈現(xiàn)出持續(xù)快速增長的狀態(tài),已成為Github 社區(qū)2023年最受歡迎的回聲消除算法之一。多名行業(yè)人士表示,GVoice NKF未來將成為學(xué)術(shù)界工業(yè)研究的熱點(diǎn)。

GVoice NKF具有極強(qiáng)應(yīng)用空間助力制定及落地行業(yè)語音標(biāo)準(zhǔn)

在實(shí)際應(yīng)用中,GVoice NKF算法框架的擴(kuò)展性和性能都優(yōu)于其他傳統(tǒng)類算法,能夠解決更復(fù)雜的問題。例如,遠(yuǎn)端信號自相關(guān)矩陣病態(tài)導(dǎo)致non-uniqueness問題會(huì)讓收斂速度變慢;基于MMSE傳統(tǒng)算法的鏈路復(fù)雜且效果一般,面對干擾和突變信號的魯棒性不強(qiáng)等。在這些問題中,GVoice NKF僅需改變兩個(gè)向量維度,就可以沿用單通道NKF框架擴(kuò)展成統(tǒng)一解決方案,僅需少量數(shù)據(jù)即可訓(xùn)練一個(gè)魯棒性強(qiáng)的線性模型,因此多通道回聲消除可以十分容易納入到本框架下。

近年來,移動(dòng)游戲內(nèi)的語音交流是玩家社交的剛需,從實(shí)時(shí)語音、語音消息到語音識別等功能,都已成為游戲廠商的關(guān)注重點(diǎn)。GVoice NKF算法可以提供小隊(duì)語音、語音消息、語音轉(zhuǎn)文字、語音同傳、文明語音等功能,能夠支持1萬名玩家在同一個(gè)語音房間內(nèi)互相交流,在UE4、Unity、Cocos、Native等平臺均有不錯(cuò)的表現(xiàn)與反饋,目前已接入騰訊旗下的《王者榮耀》、《和平精英》、《天涯明月刀手游》、《英雄聯(lián)盟手游》等多款游戲。

除游戲領(lǐng)域外,GVoice NKF算法還被寫入高通、聯(lián)發(fā)科、Intel等多款CPU芯片,助力制定及落地行業(yè)的游戲語音標(biāo)準(zhǔn)。

游戲科技亮相頂級學(xué)術(shù)會(huì)議,持續(xù)釋放外溢價(jià)值

此次,騰訊游戲GVoice NKF登上ICASSP 2023這一頂級學(xué)術(shù)會(huì)議,代表著其背后的游戲技術(shù)在學(xué)術(shù)領(lǐng)域進(jìn)一步得到廣泛認(rèn)可。如今,游戲技術(shù)所擁有的可交互、高仿真、強(qiáng)沉浸、實(shí)時(shí)渲染等特性,已經(jīng)成長為一個(gè)獨(dú)立的技術(shù)新種群,并在更多領(lǐng)域中得以運(yùn)用。這也使得游戲的技術(shù)創(chuàng)新和社會(huì)價(jià)值在全球范圍內(nèi)愈發(fā)被重視。

而早在去年,中科院研究團(tuán)隊(duì)就發(fā)表了《游戲技術(shù)--數(shù)實(shí)融合進(jìn)程中的技術(shù)新集群》報(bào)告。報(bào)告指出,電子游戲突出的趣味性掩蓋了它的科學(xué)屬性,游戲與前沿科技一直互相促進(jìn),在彼此共生中形成新的社會(huì)生產(chǎn)力。

未來,伴隨著游戲技術(shù)的不斷進(jìn)步,以及對游戲更多可能性的探索,游戲一定會(huì)融入更多經(jīng)濟(jì)發(fā)展與社會(huì)生活之中,成為“超級數(shù)字場景”,釋放更大的科技力量和更為豐富的價(jià)值。

來源:網(wǎng)易新聞


責(zé)任編輯:侯哲
熱門評論
互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120170072
京公網(wǎng)安備 11010502045281號
違法和不良信息舉報(bào)電話:010-65669841
舉報(bào)郵箱:xxjb@huaxia.com

網(wǎng)站簡介 / 廣告服務(wù) / 聯(lián)系我們

主辦:華夏經(jīng)緯信息科技有限公司   版權(quán)所有 華夏經(jīng)緯網(wǎng)

Copyright 2001-2024 By 612g.cn