已收藏 收藏
18723
微信分享
视频介绍
课程资料
评价

嘉宾介绍

主题介绍

强化学习在人工智能领域取得了瞩目的成果,特别是Deepmind在AlphaGo和游戏中的突破。在文本领域,如对话,文本生成,强化学习也展示出了比传统方法更优的训练效果。本次报告将针对神经机器翻译中强化学习的应用,主要涉及以下三个方面:1)在强化学习中利用无监督(单语)语料训练翻译模型。针对无监督语料缺少目标语言而无法得到奖励信号的问题,我们设计了奖励函数来帮助无监督语料的训练;2)另一方面,我们利用对抗生成网络来帮助机器翻译模型的训练,将判别器作为奖励函数对训练过程提供奖励信号;3)在大数据和深层网络的环境下,强化学习面临更多的挑战,而以往的经验是否适用以及有效是一个值得探索的问题。我们探索了在这样的背景下强化学习如何能够有效的训练,以及如何利用无监督语料参与训练,并得到了一些有意义的结论。
未上传任何附件
说点什么

—— 点击加载更多 ——

收起

为你推荐
啊哦,暂无相关推荐