(相關(guān)資料圖)
4月21日,由中央網(wǎng)信辦網(wǎng)絡(luò)傳播局、中央網(wǎng)信辦網(wǎng)絡(luò)管理技術(shù)局、江蘇省委網(wǎng)信辦、人民網(wǎng)共同發(fā)起的“2023中國網(wǎng)絡(luò)媒體論壇‘八點(diǎn)見’項(xiàng)目發(fā)布會(huì)”成功舉辦,“訊飛智作--AIGC內(nèi)容創(chuàng)作平臺(tái)”在發(fā)布會(huì)上亮相,這一平臺(tái)是科大訊飛在AIGC領(lǐng)域的一項(xiàng)創(chuàng)新實(shí)踐成果。
訊飛智作,用AI賦能音視頻創(chuàng)作。其基于科大訊飛的語音合成、人臉建模、唇形預(yù)測(cè)、圖形處理等多項(xiàng)人工智能技術(shù),為用戶提供音視頻生產(chǎn)平臺(tái)。提供的服務(wù)包括AI配音、AI虛擬主播視頻制作等內(nèi)容創(chuàng)作,可以解決用戶制作時(shí)找主播難、成本高、生產(chǎn)效率低等痛點(diǎn)問題,讓內(nèi)容創(chuàng)作更加靈活、高效、便捷。
早在2021年,科大訊飛就發(fā)布了AI虛擬人交互平臺(tái),其具有多模感知、多維表達(dá)、自主定義、情感貫穿四大特性。郜靜文還介紹了訊飛智作運(yùn)用“自主定義”和“情感貫穿”兩項(xiàng)特性的最新進(jìn)展。
在“自主定義”方面,虛擬發(fā)言人“智造”過程更輕便、自動(dòng)化。目前訊飛智作已支持從聲音到形象的自動(dòng)化構(gòu)建能力,可生成差異化的虛擬資產(chǎn)
在“情感貫穿”方面,多情感功能上線。訊飛智作現(xiàn)有音庫包含了大氣渾厚、年輕時(shí)尚、可愛甜美、成熟知性、穩(wěn)重磁性等多種風(fēng)格,覆蓋新聞播報(bào)、專題宣傳、有聲閱讀、情感文章、廣告促銷、教育培訓(xùn)等場(chǎng)景,語言支持普通話、方言和英語,合成效果可自主調(diào)節(jié),其語音效果媲美真人。
關(guān)于公司在AIGC領(lǐng)域的整體布局,科大訊飛AI研究院常務(wù)副院長高建清曾在今年3月29日的中國AIGC產(chǎn)業(yè)峰會(huì)上進(jìn)行了分享。他表示,“底座+能力+應(yīng)用”是科大訊飛AIGC整體布局的三層架構(gòu):以文本預(yù)訓(xùn)練、多模態(tài)預(yù)訓(xùn)練、多元異構(gòu)基礎(chǔ)資源構(gòu)建、異構(gòu)集群構(gòu)建及大模型訓(xùn)練套件為技術(shù)底座,形成音頻創(chuàng)作、視覺創(chuàng)作、文本創(chuàng)作三大AIGC能力,進(jìn)而衍生出在教育、醫(yī)療、人機(jī)交互等領(lǐng)域的豐富應(yīng)用。
未來,訊飛智作將致力于用AI更好地拓展內(nèi)容創(chuàng)作方式,持續(xù)讓AIGC助力各行各業(yè)的內(nèi)容生產(chǎn)。