報告題目:Vision and Language: Bridging Vision and Language with Deep Learning
報告人:梅濤 研究員
單位:微軟亞洲研究院
時間: 2016年12月13日 (星期二) 上午9:30
地點:學(xué)術(shù)活動中心二樓小報告廳
Abstract: Visual recognition has been a fundamental challenge in computer vision for decades. Thanks to the recent development of deep learning techniques, researchers are striving to bridge vision (image and video) and natural language, which has become an emerging research area. We will present a few recent advances bridging vision and language with deep learning techniques, including image and video captioning, image and video chatting, storytelling, vision and language grounding, datasets, grand challenges, and open issues. In particular, we will introduce our recently developed approaches which investigate semantic attributes for image and video captioning.
報告人簡介:
梅濤博士,微軟亞洲研究院資深研究員,國際模式識別學(xué)會會士,國際計算機(jī)協(xié)會杰出科學(xué)家,中國科技大學(xué)和中山大學(xué)兼職教授博導(dǎo)。他分別于2001年和2006年在中國科技大學(xué)獲學(xué)士和博士學(xué)位。主要研究興趣為多媒體分析和計算機(jī)視覺,在國際頂級學(xué)術(shù)期刊和會議上發(fā)表論文100余篇,先后10次榮獲最佳論文獎,擁有17項美國專利,其研究成果多次被轉(zhuǎn)化到微軟的產(chǎn)品和服務(wù)中。在微軟亞洲研究院期間,先后指導(dǎo)了來自全球的80多名實習(xí)生,并培養(yǎng)了四位微軟學(xué)者。他目前同時擔(dān)任IEEE和ACM多媒體匯刊的編委(IEEE TMM和ACM TOMM),并且是多個國際多媒體會議的大會主席和程序委員會主席。
太陽集團(tuán)tyc5997