微軟新研究項(xiàng)目公開(kāi):提升AI理解能力


【資料圖】

微軟研究院近日公開(kāi)了其最新研究項(xiàng)目——Project Rumi。該項(xiàng)目旨在通過(guò)結(jié)合文本、音頻和視頻數(shù)據(jù),運(yùn)用多模態(tài)方法,提升人工智能系統(tǒng)的理解能力,使其更能理解人類(lèi)的意圖。 近年來(lái),人工智能系統(tǒng)在自然語(yǔ)言處理(NLP)領(lǐng)域取得了顯著的進(jìn)步。然而,現(xiàn)有的NLP AI主要依賴(lài)于文本輸入輸出,忽略了人類(lèi)在自然交流中的語(yǔ)調(diào)、面部表情、手勢(shì)和肢體語(yǔ)言等線索,這在一定程度上導(dǎo)致了其在理解方面的偏差。在AI專(zhuān)業(yè)術(shù)語(yǔ)中,這些線索被統(tǒng)稱(chēng)為副語(yǔ)言。 為了解決這個(gè)問(wèn)題,微軟研究院開(kāi)發(fā)了Project Rumi。這是一個(gè)新穎的框架,旨在通過(guò)多模態(tài)副語(yǔ)言提示來(lái)增強(qiáng)人工智能的理解。該項(xiàng)目包括兩個(gè)主要部分:多模式副語(yǔ)言編碼器和多模式副語(yǔ)言解碼器。

推薦DIY文章
海藝AI:迎合“AI時(shí)代”發(fā)展潮流,刷新繪圖市場(chǎng)傳統(tǒng)認(rèn)知
布局產(chǎn)業(yè)新高地!海星醫(yī)藥健康創(chuàng)新園B區(qū)奠基儀式隆重舉行
未來(lái)五年500億投入打底,北汽藍(lán)谷錨定細(xì)分市場(chǎng)增量
【展會(huì)直擊】華秋慕尼黑上海電子展精彩ing,助力電子產(chǎn)業(yè)高質(zhì)量發(fā)展!
桂花網(wǎng)藍(lán)牙網(wǎng)關(guān)助力司乘人員職業(yè)健康監(jiān)測(cè)
DNF新推出封號(hào)申訴:每個(gè)玩家180天內(nèi)只能享受一次減少處罰時(shí)間機(jī)會(huì) 每日視訊
精彩新聞

超前放送