曲阜师范大学服务地方专家库人员登记表
姓名 |
刘智斌 |
性别 |
男 |
出生 年月 |
|
学历 学位 |
研究生,工学博士 |
||
职务/职称 |
副教授 |
邮箱 |
|
联系电话 |
|
||||
研究领域/专长 |
Web信息管理系统研发、自主机器学习系统研究、虚拟现实 |
||||||||
代表性项目、成果、获奖及社会影响 (300字以内) |
部分以第一作者发表的主要论文: [1] 刘智斌,曾晓勤,徐彦,禹继国. 采用资格迹的神经网络学习控制算法. 控制理论与应用,2015,32(7):887 ~ 894 (EI) [2] 刘智斌,曾晓勤,刘惠义,储荣. 基于BP神经网络的双层启发式强化学习方法. 计算机研究与发展,2015,52(3):579 ~587(EI) [3] 刘智斌,曾晓勤. 基于路径引导知识启发的强化学习方法. 四川大学学报(工程科学版),2012,44(5):136 ~ 142(EI) [4] 刘智斌,李占利,曹宝香. 虚拟环境中织物的碰撞检测及响应. 系统仿真学报,2007,19(7):1497~1499(EI) |
||||||||
专利、横向课题成果转化情况 (300字以内)
|
[1] 刘智斌,刘晓峰.一种采用资格迹的神经网络学习控制方法.2015.06.08,中国,专利号:ZL 2015 1 0304299.4
|
||||||||
对接服务地方部门/行业/企业 |
对接行业:信息科技公司,从事互联网+,人工智能,3D虚拟现实行业 |
||||||||
单位:信息科学与工程学院 填表时间:2018年1月16日
说明:1.此表内容将作为专家与地方或行业精准对接合作的重要依据,请认真仔细填写
2.各项内容的填写务必清晰准确且具有代表性
3.如有具体的产学研成果,请填写下表《产学研成果信息登记表》
曲阜师范大学产学研成果信息登记表
成果名称 |
一种采用资格迹的神经网络学习控制方法 |
|||
联系方式 |
完成单位 |
曲阜师范大学 |
通讯地址 |
曲阜师范大学信息科学与工程学院 |
联 系 人 |
刘智斌 |
电 话 |
0633-3981026 |
|
手 机 |
13792002776 |
lzbxian |
||
基本情况 |
成果水平 |
□国际领先 □国际先进 √国内领先 □国内先进 □其他 |
||
知识产权形式 |
√发明专利 □实用新型专利 □外观设计专利 □其他 |
|||
成果体现形式 |
√新技术 □新工艺 □新产品 □新材料 □新装备 □农业、生物新品种 □矿产新品种 □其他应用技术 |
|||
所属领域 |
√电子信息 □能源环保 □装备制造 □生物、医药 □新材料 □农业 □海洋技术 □其他 |
|||
技术成熟程度 |
□研制阶段 □试生产阶段 □批量生产阶段 |
|||
成果简介 |
1、成果简介 本发明公开了一种采用资格迹的神经网络学习控制方法,该采用资格迹的神经网络学习控制算法,将BP神经网络应用于强化学习,BP神经网络的模型拓扑结构包括输入层、隐层和输出层,运用资格迹,本方法把局部梯度从输出层传递到隐层,实现隐层权值的更新,能大大提高学习效率;在此基础上采用基于资格迹的残差梯度法,不仅对神经网络输出层进行权值更新,而且对隐层进行了优化权值更新,保证了BP神经网络在强化学习过程中良好的收敛性能。 2、主要技术指标 BP神经网络作为强化学习值函数拟合器,其输入端接收状态信息,依据BP神经网络输出层的输出值V和环境反馈的报酬信息r,利用TD算法训练BP神经网络,Agent依据输V值函数选取行为a,从而实现自适应控制。 3、应用和市场前景 传统的控制方法根据问题设计数学模型,而设计数学模型是一项非常复杂的工作,即便是设计准确难免随着环境或条件的变化,原来的数学模型将不再适合。我们的成果是经过强化学习方法,不建立数学模型,在系统与环境交互的过程中自动生成最优化的解决策略,更适合问题的解决过程。本项目可运用于自动控制、物联网、智能交通、电子游戏、电子商务物流管理、股票投资、机器人、自动化驾驶等领域。
|
注:每个项目填写1张表,如有相关图片须配简要的文字说明