工作分工

专家库

网站热门关键字

信息科学与工程学院
您现在的位置: » 首页 » 专家库 » 信息科学与工程学院 » 正文

计算机科学与技术-刘智斌

2018年03月09日 16:11 点击数:

曲阜师范大学服务地方专家库人员登记表  

姓名

刘智斌

性别

出生

年月

学历

学位

研究生,工学博士

职务/职称

副教授

邮箱

联系电话

研究领域/专长

Web信息管理系统研发、自主机器学习系统研究、虚拟现实

代表性项目、成果、获奖及社会影响

300字以内)

部分以第一作者发表的主要论文:

[1] 刘智斌,曾晓勤,徐彦,禹继国. 采用资格迹的神经网络学习控制算法. 控制理论与应用,2015327):887 ~ 894 EI

[2] 刘智斌,曾晓勤,刘惠义,储荣. 基于BP神经网络的双层启发式强化学习方法. 计算机研究与发展,2015523):579 ~587EI

[3] 刘智斌,曾晓勤. 基于路径引导知识启发的强化学习方法. 四川大学学报(工程科学版),2012445):136 ~ 142EI

[4] 刘智斌,李占利,曹宝香. 虚拟环境中织物的碰撞检测及响应. 系统仿真学报,2007197):1497~1499EI

专利、横向课题成果转化情况

300字以内)

[1] 刘智斌,刘晓峰.一种采用资格迹的神经网络学习控制方法.2015.06.08中国,专利号:ZL 2015 1 0304299.4

对接服务地方部门/行业/企业

对接行业:信息科技公司,从事互联网+,人工智能,3D虚拟现实行业











单位:信息科学与工程学院               填表时间:2018116

说明:1.此表内容将作为专家与地方或行业精准对接合作的重要依据,请认真仔细填写

     2.各项内容的填写务必清晰准确且具有代表性

3.如有具体的产学研成果,请填写下表《产学研成果信息登记表》

曲阜师范大学产学研成果信息登记表

成果名称

一种采用资格迹的神经网络学习控制方法

联系方式

完成单位

曲阜师范大学

通讯地址

曲阜师范大学信息科学与工程学院

刘智斌

 

0633-3981026

   

13792002776

E-mail

lzbxian

基本情况

成果水平

□国际领先   □国际先进   √国内领先   □国内先进   □其他

知识产权形式

√发明专利       □实用新型专利      □外观设计专利       □其他

成果体现形式

√新技术        □新工艺    □新产品       □新材料       □新装备  

□农业、生物新品种       □矿产新品种     □其他应用技术

所属领域

√电子信息  □能源环保   □装备制造   □生物、医药  □新材料        

□农业   □海洋技术          □其他            

技术成熟程度

□研制阶段        □试生产阶段        □批量生产阶段    

成果简介

1、成果简介

本发明公开了一种采用资格迹的神经网络学习控制方法,该采用资格迹的神经网络学习控制算法,将BP神经网络应用于强化学习,BP神经网络的模型拓扑结构包括输入层、隐层和输出层,运用资格迹,本方法把局部梯度从输出层传递到隐层,实现隐层权值的更新,能大大提高学习效率;在此基础上采用基于资格迹的残差梯度法,不仅对神经网络输出层进行权值更新,而且对隐层进行了优化权值更新,保证了BP神经网络在强化学习过程中良好的收敛性能。

2、主要技术指标

BP神经网络作为强化学习值函数拟合器,其输入端接收状态信息,依据BP神经网络输出层的输出值V和环境反馈的报酬信息r,利用TD算法训练BP神经网络,Agent依据输V值函数选取行为a,从而实现自适应控制。

3、应用和市场前景

传统的控制方法根据问题设计数学模型,而设计数学模型是一项非常复杂的工作,即便是设计准确难免随着环境或条件的变化,原来的数学模型将不再适合。我们的成果是经过强化学习方法,不建立数学模型,在系统与环境交互的过程中自动生成最优化的解决策略,更适合问题的解决过程。本项目可运用于自动控制、物联网、智能交通、电子游戏、电子商务物流管理、股票投资、机器人、自动化驾驶等领域。

注:每个项目填写1张表,如有相关图片须配简要的文字说明

附件下载: