皇冠网上投注-皇冠网全讯网

菁菁校園   NAVIGATION

計(jì)算機(jī)與信息工程學(xué)院1項(xiàng)成果被CCF A類(lèi)國(guó)際學(xué)術(shù)會(huì)議ACM Multimedia 2024錄用

時(shí)間:2024-11-08 來(lái)源:計(jì)算機(jī)與信息工程學(xué)院(人工智能學(xué)院) 作者:朱艾春 攝影: 編輯:趙蕾 上傳:

近日,國(guó)際頂級(jí)會(huì)議ACM Multimedia 2024在澳大利亞墨爾本舉辦,由朱艾春和董冠男老師指導(dǎo)的、計(jì)算機(jī)與信息工程學(xué)院2022級(jí)研究生張旭同學(xué)(第一作者)的長(zhǎng)文“TVPR: Text-to-Video Person Retrieval and a New Benchmark”被大會(huì)錄用。ACM Multimedia是計(jì)算機(jī)學(xué)科多媒體領(lǐng)域的頂級(jí)國(guó)際會(huì)議,也是中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)推薦的該領(lǐng)域唯一的A類(lèi)國(guó)際學(xué)術(shù)會(huì)議。ACM Multimedia 2024共有4385篇投稿進(jìn)入審稿階段,經(jīng)過(guò)Rebuttal后,最終有1149篇論文(26.20%)被錄用。

該論文提出了一個(gè)文本-視頻行人檢索(TVPR)新任務(wù)以及一個(gè)新數(shù)據(jù)集,并在此基礎(chǔ)上提出了一種多元特征引導(dǎo)的片段化學(xué)習(xí)策略(Multielement Feature Guided Fragments Learning strategy,MFGF)。

該策略利用跨模態(tài)文本-視頻表征來(lái)提供強(qiáng)大的文本-視覺(jué)和文本-運(yùn)動(dòng)匹配信息,以應(yīng)對(duì)不確定的遮擋沖突和可變運(yùn)動(dòng)細(xì)節(jié)。該模型利用ViT和S3D聯(lián)合提取行人視頻的特征,增強(qiáng)視頻特征中的動(dòng)作信息,同時(shí)利用BERT編碼文本描述,提取文本特征。

此外,MFGF為文本和視頻特征協(xié)作學(xué)習(xí)建立了兩個(gè)潛在的跨模態(tài)空間,進(jìn)一步縮小文本和視頻之間的跨模態(tài)語(yǔ)義鴻溝,提升模型對(duì)文本-視頻跨模態(tài)信息中語(yǔ)義共性的理解,進(jìn)而提高了檢索精度。

作者:朱艾春(計(jì)算機(jī)與信息工程學(xué)院(人工智能學(xué)院));審核:高輝慶、萬(wàn)夕里

菁菁校園
百家乐赌场论坛在线| 威尼斯人娱乐网注册| 博彩百家乐官网组选六六组| 大发888主页| 太阳百家乐官网网址| 台山市| 百家乐机器图片| 海城市| 菲律宾太阳城娱乐| 免费百家乐官网缩水| 河东区| 飞天百家乐的玩法技巧和规则| 金木棉百家乐官网的玩法技巧和规则| 大发888娱乐场下载| 百家乐图淑何看| 蓝盾百家乐官网庄家利润分| 澳门百家乐论坛| 威尼斯人娱乐场66| 真人百家乐试玩游戏| 豪华百家乐官网桌子| 足球下注| 大发8888迅雷下载免费| 南华县| 大发888无数| 百家乐发脾机| 百家乐下注几多| 百家乐官网棋牌游| 百家乐官网庄闲| 娱乐城注册送礼金| 百家乐微笑打| 真人百家乐新开户送彩金| 网上百家乐官网是真是假天涯论坛| 闵行区| 章丘市| 2013现金棋牌游戏| 大发888游戏平台hg dafa 888 gw 大发888游戏平台dafa 888 gw | 威尼斯人娱乐场官网网站是多少| 百家乐高档筹码| 高楼24层风水好吗| 百家乐官网真人斗地主| 百家乐官网是不是有假|