AIR杰出演讲嘉宾孙晨,布朗大学助理教授,24/9/25
日期:24/9/25/星期三
地点:计算与数据科学中心,英联邦大道665号,701室
时间:美国东部时间下午1点至2点
演讲者: 孙晨,布朗大学助理教授
讨论题目: 法学硕士时代对感知与推理视频表示学习的再思考
摘要什么是视频理解的良好表征,比如推断人类演员的意图,回答基于(物理)常识的视频问题,或者解决需要组合泛化的推理任务? 在这次演讲中,我将从三个角度介绍我们最近的尝试来回答这个澳门威尼斯人注册网站研究问题:首先,我们澳门威尼斯人注册网站研究端到端训练的神经网络(如VLM)是否能够解决传统上由神经符号方法解决的复杂视觉推理任务; Second, we explore if structured representations (such as objects and attributes, abstract representation of the environments, or visual question decomposition) would emerge automatically with large-scale pre-training, without manual definitions of “concepts” or “symbols”; 最后,我们澳门威尼斯人注册网站研究了视频理解任务的良好表征,特别是在长格式视频理解的感知和推理之间的桥梁。
生物: 陈的太阳 布朗大学计算机科学助理教授,b谷歌DeepMind澳门威尼斯人注册网站研究员,澳门威尼斯人注册网站研究计算机视觉和机器学习。 His lab’s research has received a Richard B. Salomon 澳门威尼斯人注册网站 Research Award, Samsung’s Global Research Outreach Award, and appeared in the best paper finalist of CVPR 2019. 2016年获美国南加州大学博士学位,2011年获清华大学学士学位。