【红桐树·导学】上海财经大学周帆副教授为学院师生作学术报告
发布时间: 2024-06-24 浏览次数: 10

619日,应学院与科研处邀请,上海财经大学周帆副教授在线上为bat365官网登录入口师生作了题Recent Advances in Distributional Reinforcement Learning的学术报告,会议由bat365官网登录入口副院长崔连标教授主持,学院部分师生参加了会议。

在报告中,周帆副教授指出尽管过去几年分布式强化学习(DRL)已被广泛研究,但少有学者探讨在分布式设置中获得Q函数估计器的有效性。周老师的研究团队通过一系列创新工作,成功确保了获得的分位数估计的单调性和理论必要性。除了Q函数估计器的有效性外,研究团队还对Q函数内部的近似误差如何影响DRL中的整体训练过程进行了全面分析。他们发现,这些近似误差可能导致训练过程中的偏差和方差增加,从而影响最终的性能。为解决这一问题,研究团队从理论上证明了减少这些误差项中的偏差和方差技术,提高了DRL算法的性能。

周老师以其深刻的见解和丰富的研究经验,为我们展示强化学习最新发展和未来趋势与会师生纷纷表示受益匪浅。

撰稿胡玉审核崔连标