2018年8月29日,應(yīng)太陽集團tyc5997邀請,微軟雷蒙德研究院高級研究院Hongzhi Li博士在我院做了題為《Pattern Mining and Concept Discovery for Multimodal Content Analysis》的學(xué)術(shù)報告。來自學(xué)院各個系所的教師、研究生和本科生參加了此次報告會。
Li博士首先回顧了基于視覺模式挖掘的研究發(fā)展及代表性工作,指出將多模態(tài)進行協(xié)同可以有效地提升各種挖掘任務(wù)的性能。在此基礎(chǔ)上,Li博士介紹了他所在團隊開展的兩項研究:通過協(xié)同圖像與文字來發(fā)掘大規(guī)模視覺信息中的事件、通過構(gòu)建端到端(end-to-end)深度神經(jīng)網(wǎng)絡(luò)來更加高效地協(xié)同和融合文字和視覺模態(tài)信息。最后,Li博士對未來擬開展的工作進行了介紹,并探討了其中若干開放問題的解決思路。報告結(jié)束后,在座師生就感興趣的話題和Li博士進行了深入交流。
Li博士是微軟雷蒙德研究院高級研究員。他于2012年和2016年獲得哥倫比亞大學(xué)碩士和博士學(xué)位,師從多媒體領(lǐng)域著名學(xué)者、ACM/IEEE/AAAS會士Shih-fu Chang教授。Li博士研究領(lǐng)域包括機器學(xué)習(xí)、多媒體內(nèi)容分析和云計算。Li博士在ACM Multimedia、IEEE多媒體匯刊等多媒體領(lǐng)域知名學(xué)術(shù)會議和期刊上發(fā)表論文數(shù)十篇,并獲得ACM ICMR2018最佳海報獎、2012年ACM Multimedia挑戰(zhàn)賽第一名等學(xué)術(shù)獎勵。Li博士目前是ACM Multimedia、IJCAI等知名學(xué)術(shù)會議的領(lǐng)域委員會主席或程序委員會委員,也是多份IEEE匯刊審稿人。

