報(bào)告題目:Model Interpretation and Alignment
報(bào)告人:王希廷高級(jí)研究員
單位:微軟亞洲研究院
報(bào)告時(shí)間:2023年6月14日(周三)上午10:00
報(bào)告地點(diǎn):翡翠湖校區(qū)科教樓A座804會(huì)議室
報(bào)告摘要:
大模型時(shí)代,可解釋和模型對(duì)齊變得至關(guān)重要。大模型對(duì)人的工作生活影響越來越大,但卻更加難以理解和控制。OpenAI對(duì)外支持的七大研究方向中,可解釋和模型對(duì)齊就是其中兩個(gè)。我們應(yīng)該怎么讓深度學(xué)習(xí)模型變得更透明、可理解、更容易訓(xùn)練、調(diào)試和優(yōu)化,確保它和人類意圖對(duì)齊呢?這次報(bào)告將圍繞這些問題進(jìn)行探討,介紹我們近期發(fā)表在ICML、NeurIPS、KDD的可解釋人工智能(XAI)以及利用強(qiáng)化學(xué)習(xí)從人類反饋學(xué)習(xí)(RLHF)的方法。
報(bào)告人簡(jiǎn)介:
王希廷是MSRA社會(huì)計(jì)算組高級(jí)研究員,研究興趣為可解釋、負(fù)責(zé)任的人工智能。發(fā)表論文50多篇,其中CCF-A類論文40篇。兩篇論文被CCF-A類期刊IEEE TVCG評(píng)選為封面論文。H-Index為24,谷歌學(xué)術(shù)引用2300多。相關(guān)科研成果落地全球占有量第二的必應(yīng)搜索引擎。被邀請(qǐng)擔(dān)任IJCAI、AAAI領(lǐng)域主席,加入IEEE VIS組委會(huì)擔(dān)任檔案主席,被評(píng)為AAAI 2021 杰出高級(jí)程序委員。兩次受邀在SIGIR可解釋推薦研討會(huì)上發(fā)表主旨演講,是CCF和IEEE高級(jí)會(huì)員。