4月21日上午,清華大學(xué)計(jì)算機(jī)系副教授東昱曉應(yīng)學(xué)院邀請(qǐng),在翡翠科教樓A座706會(huì)議室?guī)?lái)題為《基礎(chǔ)大模型的智能體能力提升探索》的學(xué)術(shù)盛宴。本次報(bào)告由學(xué)院院長(zhǎng)洪日昌教授主持。
東昱曉副教授曾工作于臉書人工智能及微軟總部研究院,研究聚焦基礎(chǔ)大模型、數(shù)據(jù)挖掘、圖機(jī)器學(xué)習(xí)等方向,學(xué)術(shù)成果豐碩,相關(guān)成果廣泛應(yīng)用于多個(gè)大模型系列產(chǎn)品和系統(tǒng)。他榮獲2022 ACM SIGKDD 新星獎(jiǎng),并入選 2024 年清華大學(xué)“清韻燭光—我最喜愛(ài)的教師”(每?jī)赡暝u(píng)選 10 位),在科研與教學(xué)方面成績(jī)斐然。
報(bào)告中,東昱曉指出,基礎(chǔ)大模型在意圖感知、指令跟隨、目標(biāo)規(guī)劃等方面展現(xiàn)出強(qiáng)大泛化能力,為智能體研究和應(yīng)用奠定了通用模型基礎(chǔ)。然而,大模型GUI 智能體在跨模態(tài)信息融合與跨域泛化能力構(gòu)建上仍面臨挑戰(zhàn)。他詳細(xì)分享了團(tuán)隊(duì)的前沿探索成果:一是構(gòu)建了針對(duì)自主智能體的統(tǒng)一訓(xùn)練與評(píng)測(cè)框架 AndroidLab 和 AgentBench,通過(guò)建立標(biāo)準(zhǔn)化操作環(huán)境,支持文本輸入及基于屏幕截圖的多模態(tài)模式,實(shí)現(xiàn)點(diǎn)擊、滑動(dòng)等基礎(chǔ)動(dòng)作,為智能體研發(fā)提供標(biāo)準(zhǔn)參照;二是設(shè)計(jì)自進(jìn)化在線課程強(qiáng)化學(xué)習(xí)框架 WebRL,有效解決 GUI 智能體訓(xùn)練中任務(wù)稀缺、反饋稀疏和策略漂移等關(guān)鍵問(wèn)題,在多個(gè)智能體基準(zhǔn)任務(wù)上顯著提升效果;三是相關(guān)模型和技術(shù)成功應(yīng)用于智譜 AutoGLM 智能體產(chǎn)品,彰顯了產(chǎn)學(xué)研深度融合的潛力。
報(bào)告結(jié)束后,現(xiàn)場(chǎng)互動(dòng)熱烈,學(xué)院師生圍繞報(bào)告內(nèi)容踴躍提問(wèn),與東教授就技術(shù)細(xì)節(jié)、應(yīng)用前景等展開(kāi)深入探討。師生們紛紛表示,報(bào)告內(nèi)容前沿且貼合實(shí)際,為自身科研和學(xué)習(xí)帶來(lái)諸多新思路與啟發(fā)。未來(lái),學(xué)院將繼續(xù)秉持開(kāi)放辦學(xué)理念,舉辦更多高水平學(xué)術(shù)交流活動(dòng),助力師生拓寬學(xué)術(shù)視野,提升科研創(chuàng)新能力。


太陽(yáng)集團(tuán)tyc5997(人工智能學(xué)院)
2025年4月21日