Close

董道毅副教授学术报告会


发表日期:2019-01-10 作者:

专家报告会

报告题目:Quantum Reinforcement Learning

人:澳大利亚新南威尔士大学工程与信息技术学院

董道毅副教授(终身教职)

报告时间:2019112日(周六)上午1000

报告地点:安徽大学理工D318会议室

报告摘要:The key approaches for machine learning, particularly learning in unknown probabilistic environments, are new representations and computation mechanisms. In this talk, a quantum reinforcement learning (QRL) method is proposed by combining quantum theory and reinforcement learning (RL). Inspired by the state superposition principle and quantum parallelism, a framework of a value-updating algorithm is introduced. To evaluate the performance and practicability of QRL, several simulated experiments are given, and the results demonstrate the effectiveness and superiority of the QRL algorithm for some complex problems. This work is also an effective exploration on the application of quantum computation to artificial intelligence.

主办单位:安徽大学计算机科学与技术学院

欢迎各位老师,同学届时前往!

科学技术处

2019110

报告人简介:董道毅博士现为澳大利亚新南威尔士大学工程与信息技术学院副教授(终身教职)。于1997年进入中国科学技术大学读本科,2006年获博士学位。2006年到中国科学院数学与系统科学研究院从事博士后研究,曾在浙江大学智能系统与控制研究所担任副教授,美国普林斯顿大学、日本理化研究所和香港大学访问学者。主要研究方向为机器学习算法、量子系统控制。他是德国洪堡学者、Scientia研究员、亚洲控制协会第一届(2016-2017)淡马锡青年教育家奖(Temasek Young Educator Award)唯一获奖者,曾获澳大利亚研究理事会(ARC)国家博士后奖励基金、ARC国际合作奖,他与合作者一起获得2014年全球智能控制与自动化世界大会(WCICA)控制理论最佳论文奖,2015年中国控制会议关肇直奖,2016年入选澳大利亚新南威尔士大学将改变世界的学术新星,他指导的学生获得澳大利亚-新西兰控制会议学生最佳论文奖。他已在相关领域顶级期刊如IEEE Transactions on Automatic ControlAutomaticaJournal of Physical Chemistry Lettersnpj Quantum Information等发表期刊论文六十余篇,其中IEEE TransactionsAutomatica长文二十篇(包括TACAutomatica长文8篇)。担任IEEE Transactions on Neural Networks and Learning Systems副主编(Associate Editor)。

报告题目-摘要-个人简介—董道毅副教授.docx