報告題目:面向語義理解的視覺表示學習
報告人:李澤超
單位:南京理工大學
報告時間:2016年12月26日(周一)上午10:00-11:30
報告地點:逸夫樓508會議室
報告人簡介:李澤超,南京理工大學計算機科學與工程學院副教授。分別于2008年和2013年畢業(yè)于中國科學技術大學和中國科學院自動化研究所。研究興趣主要是多媒體內(nèi)容分析與理解,數(shù)據(jù)挖掘以及機器學習等。相關研究成果在國際期刊和會議發(fā)表論文50余篇,如國際知名期刊IEEE TPAMI、TIP、TMM、TKDE等,以及CCF-A類國際會議ACM Multimedia、AAAI、CVPR等。獲得2015年中國科學院優(yōu)秀博士論文獎、2015年中國計算機學會優(yōu)秀博士論文獎、2013年中國科學院院長獎、IEEE MMSP 2015 Top 10%論文獎等多項榮譽稱號。
報告摘要:隨著大數(shù)據(jù)時代的來臨,我們生活在一個高維度數(shù)據(jù)的海洋之中,尤其是圖像視頻數(shù)據(jù)。為了提高數(shù)據(jù)處理的效率和性能,有效的數(shù)據(jù)表示以及度量變得尤為重要。為此,我們重點研究了面向語義理解的視覺表示。研究了如何從原始視覺特征中選擇出最能反映數(shù)據(jù)本質(zhì)的特征表示,提出了多種特征選擇方法,挖掘數(shù)據(jù)潛在結構以及特征之間的信息冗余,去除噪聲特征以及抑制冗余特征。另一方面,視覺數(shù)據(jù)一般采用底層特征描述,與高層語義之間存在所謂的“語義鴻溝”。充分挖掘視覺數(shù)據(jù)的潛在結構,為其學習一個緊致的數(shù)據(jù)表示,建立底層特征與高層語義之間的語義映射,將能縮小“語義鴻溝”,有效地改進視覺內(nèi)容分析與理解。
太陽集團tyc5997