Meta公布全新AI語(yǔ)音壓縮技術(shù)EnCodec 訓(xùn)練模型涵蓋編碼器等部分

2022-11-06 19:54:13       來(lái)源:3DMGame

Meta近日公布全新AI語(yǔ)音壓縮技術(shù)“EnCodec”,該技術(shù)號(hào)稱可以64kbps的速度壓縮比MP3格式小10倍的音頻,同時(shí)還能保證不會(huì)損失質(zhì)量。

Meta指出,壓縮技術(shù)對(duì)目前互聯(lián)網(wǎng)十分重要,借助于此用戶可以十分容易的發(fā)送高畫(huà)質(zhì)圖片、語(yǔ)音信息等。不過(guò),發(fā)送這些多媒體信息需要充足的帶寬和存儲(chǔ)空間,尤其是在未來(lái)的時(shí)代,因此需要效果更好的壓縮技術(shù)。

據(jù)介紹,“EnCodec”AI訓(xùn)練模型涵蓋三個(gè)部分,分別為編碼器、量化器和解碼器。

編碼器可將原始數(shù)據(jù)轉(zhuǎn)換為較低影幀速率的格式,再由量化器將數(shù)據(jù)壓縮到目標(biāo)大小,最后,解碼器通過(guò)神經(jīng)網(wǎng)絡(luò)對(duì)這些數(shù)據(jù)進(jìn)行解碼。

值得一提的是,雖然此前也有人嘗試用神經(jīng)網(wǎng)絡(luò)壓縮音頻,但Meta是首個(gè)將此技術(shù)用于48kHz立體聲的團(tuán)隊(duì)。

x 廣告
x 廣告

Copyright @  2015-2022 海外生活網(wǎng)版權(quán)所有  備案號(hào): 滬ICP備2020036824號(hào)-21   聯(lián)系郵箱:562 66 29@qq.com