智能工程与技术学院举办研究生学术研讨活动
2022年4月11日下午14:30,重庆科技学院智能工程与技术学院成功组织学生进行学术研讨活动,活动以2020级研究生侯明阳分享“强化学习基础及其在图像中的应用”为主题开展。学术研讨活动采用线上、线下两种方式进行,学院田袁博士、韩琦教授共同主持。
首先,田袁博士向参与研讨会的师生们介绍,学院研究生学术系列研讨活动的开展情况,以及未来即将举办的学术活动。希望研究生们能积极参与学术研讨,扩宽自己的学术视野,进而在研究生学习期间取得丰富的科研成果。随后,韩琦教授介绍了自己团队的研究方向和侯明阳同学的基本情况,并邀请有兴趣的师生参与他们的课题组讨论会。
报告会开始,侯明阳同学以“强化学习基础及其在图像中的应用”为主题,从互联网巨头的最新研究成果引入报告主题内容。首先,介绍了强化学习背景及发展,随后以游戏案例引入,介绍了强化学习的运行机制和智能体更新迭代流程。接着,根据强化学习目前研究现状,将强化学习的大体类别进行一一介绍,包含按任务的分类情况,和安算法的分类情况。并介绍了强化学习的术语(状态、动作、策略),和强化学习中所用到的基础理论知识及定理,包括,马尔可夫链、蒙特卡罗方法、贝尔曼方程等,并举例详细介绍了TD算法,并针对基于策略学习的核心算法策略梯度算法进行了推导及阐述。之后,针对DQN,根据执行流程并对如何使用决策网络和目标网络生成损失函数进行了详细的讲解,并讲述了基于价值学习和基于策略学习的集中最新改进算法。并将目前最高应用的演员评判家算法的改进(多核处理)的A3C网络进行讲解。再接着描述了强化学习在计算机视觉里的具体应用,及该方面的论文分享。
报告后,侯明阳与同学们进行针对强化学习的边缘设备部署进行了探讨,并与老师针对强化学习与传统智能体学习的区别进行了重点的探讨,还针对强化学习中的奖励机制的自动优化进行了深入探究。此次学术研讨,同学们收获很多不同领域的相关知识,扩宽了研究领域视野。同学们纷纷表示收获颇丰。
侯明阳同学隶属于韩琦导师团队,研究方向:图像处理。科研项目包括基于卷积神经网络的机器人跟随人体姿态方法研究、基于无人机协同多角度的人脸识别研究、基于卷积神经网络的织物表面缺陷分类方法、基于HMM模型的人体运动行为检测研究、铁路智能编组站安全管理平台研究。获奖情况有铁路编组站智能安全管理平台系统,中国铁路上海局集团有限公司,科学技术进步奖、二等奖、中国软件杯三等奖。