首頁 > 公司 > 內(nèi)容
科大訊飛推出超擬人語音合成技術(shù) 非常接近人類真實聲音
2024-04-15 15:29:23來源:中國證券網(wǎng)
分享到:

上證報中國證券網(wǎng)訊(記者 孫小程)緊跟大模型發(fā)展,超擬人合成技術(shù)作為重要的表達方式,近來成為國內(nèi)外AI巨頭爭相布局的重點,一場超擬人合成技術(shù)PK賽正在上演。目前,微軟上新的AI語音可以在Azure AI服務(wù)頁面里進行試聽和調(diào)用,科大訊飛超擬人語音合成在訊飛星火App和訊飛開放平臺上均可體驗和使用。

近日,有第三方機構(gòu)以相同的文本對兩者的超擬人合成技術(shù)進行體驗評測,發(fā)現(xiàn)微軟和科大訊飛在超擬人合成的擬人度上相較傳統(tǒng)語音合成效果都有顯著進步,克服了合成聲音“板正”“一絲不茍”的“播音腔”問題,同時在停頓、語速變化等副語言上的表現(xiàn)也相當自然。

結(jié)果顯示,科大訊飛超擬人合成在情感表達上表現(xiàn)更為突出。在輸入表達不同程度開心的相關(guān)文字后,訊飛超擬人合成的效果能夠根據(jù)程度不同展現(xiàn)出可感知的差別。綜合來看,科大訊飛的超擬人技術(shù)在擬人度與情感表達上更優(yōu)。

科大訊飛表示,公司在此前的訊飛星火V3.5發(fā)布會上,率先推出超擬人語音合成技術(shù),并搭載在訊飛星火App中開放給全民體驗。評測顯示,其擬人度超過83%,MOS分達到4.5分(滿分5分,分數(shù)越高表示語音質(zhì)量越好),體驗下來它的聲音流暢自然,表達已非常接近人類的真實聲音。

在創(chuàng)立之初,科大訊飛就在1998年的國家“863”計劃語音合成比賽中奪得冠軍。此后,科大訊飛更是在國際語音合成界的“奧斯卡”Blizzard Challenge評測賽事中拿下十四連冠,還實現(xiàn)了中英文語音合成業(yè)界首次超過普通人說話水平等一系列成就。

近年來,訊飛在多語種語音合成應(yīng)用、方言合成、合成語音情感上持續(xù)創(chuàng)新,并且推出全新語音合成系統(tǒng)SMART-TTS,實現(xiàn)多風(fēng)格、多情感合成,能夠根據(jù)需求對聲音進行調(diào)節(jié)和創(chuàng)作。超擬人合成技術(shù)的率先上線和驚艷效果,背后是科大訊飛多年如一日的積累與突破。據(jù)介紹,訊飛超擬人合成升級版本也會在近期推出,將進一步增強喜怒哀樂等各種類型的情感反饋能力。


中方信富公眾號
更多資訊關(guān)注
中方信富公眾號