(相關(guān)資料圖)
阿里巴巴旗下的達(dá)摩院近日與大連理工大學(xué)聯(lián)合推出了一款名為HQTrack的人工智能框架。該框架主要由視頻多目標(biāo)分割器(VMOS)和掩模優(yōu)化器(MR)組成,其主要目標(biāo)是“實(shí)現(xiàn)對(duì)視頻中任何目標(biāo)的高質(zhì)量跟蹤”。 據(jù)研究團(tuán)隊(duì)介紹,HQTrack基于開源框架DeAOT、HQ-SAM,并在此基礎(chǔ)上進(jìn)行了一定的改進(jìn),實(shí)現(xiàn)了“在視頻中分割各目標(biāo)”的可能性。同時(shí),研究團(tuán)隊(duì)使用Intern-T作為特征提取器,提高了框架對(duì)不同類型物體的區(qū)分能力,并加入了一個(gè)門控傳播模塊(GPM),以便于框架在復(fù)雜環(huán)境中感知更多微小物體,生成高質(zhì)量的即時(shí)目標(biāo)遮罩。 據(jù)了解,HQTrack在VOTS2023競(jìng)賽中以0.615的質(zhì)量得分獲得第二名。研究團(tuán)隊(duì)表示,該人工智能框架可以應(yīng)用于人臉識(shí)別、智能駕駛、監(jiān)控追蹤等領(lǐng)域,并有望在未來商業(yè)應(yīng)用中落地。 目前,該項(xiàng)目已經(jīng)在GitHub中開放。HQTrack的核心功能包括:多目標(biāo)追蹤,可以同時(shí)追蹤多個(gè)目標(biāo)對(duì)象,適用于復(fù)雜場(chǎng)景下的目標(biāo)追蹤任務(wù);目標(biāo)分割,能夠準(zhǔn)確地分割視頻中的目標(biāo)對(duì)象,并生成高質(zhì)量的目標(biāo)遮罩,可用于目標(biāo)識(shí)別和分析;高質(zhì)量輸出,其追蹤結(jié)果具有高質(zhì)量和高準(zhǔn)確性,能夠滿足各種應(yīng)用場(chǎng)景的需求;簡(jiǎn)單易用,提供了簡(jiǎn)潔的接口和使用指南,用戶可以輕松地使用和集成該工具。