報(bào)告題目:Learning to Perceive and Generate 3D World
報(bào) 告 人:徐英豪 博士、研究科學(xué)家
工作單位:螞蟻金服研究部
報(bào)告時(shí)間:2025年6月25日(星期三)10:00
報(bào)告地點(diǎn):翡翠湖校區(qū)科教樓A1104會(huì)議室
報(bào)告簡(jiǎn)介:
從視覺輸入中感知并生成三維世界是人類理解和互動(dòng)物理環(huán)境的基礎(chǔ)。盡管計(jì)算機(jī)視覺在二維場(chǎng)景理解方面取得了顯著進(jìn)展,但仍難以捕捉三維世界的完整空間與動(dòng)態(tài)特性。在本講座中,我將介紹一種類人三維感知系統(tǒng),它能從多視角圖像中學(xué)習(xí)理解三維結(jié)構(gòu),通常無需大量監(jiān)督。這類系統(tǒng)不僅實(shí)現(xiàn)了通用的三維重建與感知,也為生成與操控三維場(chǎng)景提供了基礎(chǔ)。進(jìn)一步地,我將展示如何結(jié)合三維建模與生成模型,實(shí)現(xiàn)對(duì)虛擬場(chǎng)景和智能體的結(jié)構(gòu)化控制,從而推進(jìn)人工智能在空間推理、交互和環(huán)境創(chuàng)作方面的發(fā)展,邁向更具人類水平的三維智能。
報(bào)告人簡(jiǎn)介:
徐英豪,現(xiàn)任螞蟻金服研究部研究科學(xué)家,并于2026年春季即將入職香港科技大學(xué)(HKUST)計(jì)算機(jī)科學(xué)與工程系助理教授。此前,他是斯坦福大學(xué)計(jì)算成像實(shí)驗(yàn)室的博士后研究員,師從Gordon Wetzstein教授。他在香港中文大學(xué)獲得博士學(xué)位,師從周博磊教授和林達(dá)華教授,并在浙江大學(xué)信息工程系獲得學(xué)士學(xué)位。本科期間,曾在加州大學(xué)圣地亞哥分校擔(dān)任訪問學(xué)生,導(dǎo)師為蘇昊教授。研究重點(diǎn)為三維計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)和生成式人工智能交叉領(lǐng)域。已在CVPR、ICCV、ECCV、SIGGRAPH、SIGGRAPH Asia、ICLR、NeurIPS和ICML等頂級(jí)會(huì)議發(fā)表多篇論文,多次入選Oral或Spotlight presentations,其中一篇論文被提名為2022年CVPR Best Paper Candidate。2024年被評(píng)為WAIC Rising Star,2022年獲得Snap Fellowship提名。