2024年12月26日,我院邀請(qǐng)了兩位來(lái)自意大利FBK 研究院的國(guó)際學(xué)者王逸鳴和Fabio Poiesi 博士,在翡翠科教樓A座1104會(huì)議室成功舉辦了一場(chǎng)題為“Addressing vision tasks with large foundation models: how far can we go without training”和“Understanding point clouds through geometric decriptors and natural language”的學(xué)術(shù)報(bào)告會(huì)。此次報(bào)告由鐘準(zhǔn)老師主持,學(xué)院相關(guān)老師和學(xué)生參加了此次報(bào)告會(huì)。
王逸鳴博士在報(bào)告中探討了視覺與語(yǔ)言模型(VLMs)的最新進(jìn)展,強(qiáng)調(diào)其通過(guò)大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)預(yù)訓(xùn)練展現(xiàn)的泛化能力,并介紹如何利用VLMs進(jìn)行圖像分類和視頻理解,為資源有限的公共研究機(jī)構(gòu)提供新思路。

Poiesi博士則介紹了整合幾何描述符和自然語(yǔ)言處理理解點(diǎn)云的新方法,重點(diǎn)討論了該方法在機(jī)器人導(dǎo)航和操作中的應(yīng)用,特別是在點(diǎn)云配準(zhǔn)、物體姿態(tài)估計(jì)、功能分割和密集描述等任務(wù)中的表現(xiàn)。

王逸鳴是FBK深度視覺學(xué)習(xí)研究員,擅長(zhǎng)視覺場(chǎng)景理解,涵蓋靜態(tài)建模、語(yǔ)義理解和視頻分析。2018年獲QMUL博士學(xué)位,曾在IIT從事主動(dòng)3D視覺研究。她擔(dān)任多會(huì)議審稿人及多領(lǐng)域主席,是SoRo副編輯,負(fù)責(zé)低碳學(xué)習(xí)算法項(xiàng)目,是ELLIS網(wǎng)絡(luò)成員。Poiesi是FBK研究院視覺技術(shù)實(shí)驗(yàn)室負(fù)責(zé)人,倫敦瑪麗女王大學(xué)博士,2016年加入FBK,2023年獲終身研究員。他致力于計(jì)算機(jī)視覺和深度學(xué)習(xí),研究多目標(biāo)跟蹤,開發(fā)世界領(lǐng)先的六維物體姿態(tài)估計(jì)算法,多次BOP挑戰(zhàn)賽獲勝,是ELLIS網(wǎng)絡(luò)成員。
此次報(bào)告會(huì)拓寬了我院師生學(xué)術(shù)視野,激發(fā)了大家對(duì)深度視覺學(xué)習(xí)和視覺技術(shù)研究的興趣,提供了與國(guó)際學(xué)者交流的平臺(tái)。我們期待更多學(xué)術(shù)交流,推動(dòng)我院在該領(lǐng)域科研水平不斷邁上新臺(tái)階。
太陽(yáng)集團(tuán)tyc5997(人工智能學(xué)院)
2024年12月26日