【AI技术生态论】清华博士肖智清：强化学习可实现强人工智能是“矮个里挑高个”的说法-精品文档资料整理.docx-淘文阁

资源描述

《【AI技术生态论】清华博士肖智清：强化学习可实现强人工智能是“矮个里挑高个”的说法-精品文档资料整理.docx》由会员分享，可在线阅读，更多相关《【AI技术生态论】清华博士肖智清：强化学习可实现强人工智能是“矮个里挑高个”的说法-精品文档资料整理.docx（10页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、【AI技术生态论】清华博士肖智清：强化学习可实现强人工智能是“矮个里挑高个”的说法 CSDN首页业界订阅业界RSS 【AI技术生态论】清华博士肖智清：强化学习可实现强人工智能是“矮个里挑高个的讲法发表于 2020-03-26 16:37:18 受访者 | 肖智清记者 | 伍杏玲出品 | CSDN ID:CSDNnews 是CSDN提议的“建议下的重要组成局部与、一起打造一个覆盖百万开发者的AI生态联盟。 2020年度 AI技术生态论栏目将对1000 AI生态大咖进展系列访谈勾勒出AI生态最具影响力人物图谱以及AI产业全景图百万人学AI你也有份介入文章评论评论区留言入选可

2、获得价值299元的2020 AI开发者万人大会在线直播门票一张。受访者 | 肖智清【导读】强化学习是机器学习的一个重要分支主要用来解决连续决策的问题。2016年度3月人工智能界发生一件里程碑事件AlphaGo 战胜李世石其核心技术的深度强化学习引起开发者的关注以及研究。强化学习是如何的一项技术又该怎样学习呢有一位清华博士肖智清为了帮助开发者更好地学习AI 紧跟技术潮流撰写配套TensorFlow 2代码的强化学习教程书?强化学习原理与Python实现?。下面一起来看看这背后的故事。清华学霸炼成记肖智清的履历看起来便是那位“别人家的孩子肖智清在北京邮电大学本科阶段

3、专业成绩排名年度级第一并成为当时唯一同时获得北京市大学生高等数学竞赛当时还没有全国高数竞赛、全国局部地区大学物理竞赛、全国大学生英语竞赛、北京市电子设计竞赛四大竞赛的一等奖的学生。后来以学分绩专业排名第一的成绩推研清华大学信息学院攻读博士学位。在博士期间发表SCI/EI检索论文十余篇其中包括在IEEE Transactions on Information Theory(T-IT)发表第一作者论文成为清华大学近年度来首个在T-IT上以第一作者发表论文并在毕业前见刊的博士研究生。同时肖智清还是IEEE T-IT、IEEE T-Computers、IEEE T-Communicat

4、ions等期刊以及会议的审稿人。强化学习应用到真实环境有哪些优势谈到强化学习应用的问题肖智清表示强化学习能用同一套代码并搭配同一套参数完成不同的任务具有一定的普适性。比方 AlphaGo的最新改良版算法AlphaZero 它可以用同一套代码搭配同一套参数学会怎样下围棋、怎样下国际象棋、怎样下日本将棋并且做的比其他AI都更好。再例如深度强化学习算法DQN可以用同一套代码搭配同一套参数玩各种不同的游戏比方吃豆人、打飞机等等。这两个案例在他写的书里都有详细的介绍以及配套代码可以解析一下它们是怎样用同一套代码搭配一样的参数来求解各种各样不同的问题的。强化学习是实现强人工智能的

5、祈望有人认为强化学习是实现强人工智能的祈望对此肖智清表示强化学习可以用同一套算法搭配同一套参数解决多种不同的问题具有普适性。同时我们也要意识到还有其他算法也有普适性比方自动机器学习以及元学习。它们都是强人工智能的祈望。讲它们是强人工智能的祈望是相对于其他算法而言的这是一种矮个里挑高个的讲法而不是讲用这样的技术就最终一定能实现强人工智能。强化学习的将来谈及强化学习的将来研究前沿以及演进方向肖智清表示在研究方面强化学习可以以及元学习结合也就是目前常讲的强化元学习使得强化学习可以用较少的资源学得各种各样复杂问题的解决方法。肖智清戏称做一个不负责任的预计强化元学

6、习至少还有100篇顶会文章可以发。另外多智能体强化学习、随机决策时间的强化学习仍然是可以研究的内容。在工程方面将自动机器学习以及强化学习结合开发类似于Auto-sklearn的强化学习系统有可能根本性改变强化学习的生态。在落地应用方面强化学习可以以及终身学习结合使得人工智能系统可以在一个比拟长的时间跨度内适应不断变化的环境长期效劳于真实世界的场景。人人编程时代 AI开发者何去何从如今人工智能课程已纳入中小学的课程中很多人相信将来编程将会以及英语一样成为学生必修课全民编程时代很快降临一些AI专业的学生难免对职业将来担忧。对此肖智清表示程序员以及其他劳动者并没有

7、本质区别简单的编程技术并不比砖瓦工人的砌砖技术或者是月嫂的育儿技术更困难本来就不应该比它们更值钱。当一个技术不断普及、门槛越来越低的时候劳动报酬自然就会回归到以及无差异劳动时间吻合的程度。随着自动机器学习技术的开展以及应用需要的调包侠、调参侠越来越少想把自己的调包效劳、调参效劳卖出去自然就会越来越困难。他强调一个技术或者产业越来越重要或者是不可或者缺并不代表对应的岗位会增加、薪资会进步。就比方英语的例子英语对当今社会越来越重要并不代表英语专业同学的就业前景越来越好。同样的人工智能越来越重要并不代表着人工智能的岗位会越来越多、薪水越来越高。但与上述相反的是近年度来

8、有一些企业高新聘用AI工程师肖智清表示稀缺资源需要花大代价才能获得。校招生拿年度薪百万Offer早已不是新颖事。当肖智清在校时常听讲有研究生甚至本科生拿到了百万Offer 近年度也常听讲有200多万的校招Offer。他认为薪水是表达公司对人才重视程度的最直接度量。一个公司给的薪水越高那么它就越重视人才。无论对于学生还是对于职场人士假如想争取高薪都要努力成为稀缺的人才。他以强化学习为例假如只是解析几个常见强化学习算法那花几天时间看看博客文章就可以。假如能对整个强化学习研究的理论有全面扎实的解析那就有一定的稀缺性。假如技术者能始终走在研究前沿并稳定输出顶会论文那就是真正

9、稀缺的业界大咖。假如你想拿高薪那就要让自己成为大咖。建议IT专业学生用好搜索引擎谈及对于刚步入大学的学生有哪些编程习惯以及编程思维越早掌握越好肖智清表示最重要的一点是用好搜索引擎。遇到问题请先上网搜索下无论是编程遇到Bug 还是不理解某个概念还是想得到资料或者经历都请先试图上网搜索下。有人会直接把问题贴到各种微信群、QQ群或者是其他社群里结果往往是各种吹水浪费时间还没有收获最后还是得自己重新用搜索引擎搜索才解决。假如确实有编程问题无法通过搜索解决这时候就要用到另外一个大杀器“最小可复现样例英文叫做Minimal Working Example 缩写是MWE。详

10、细而言遇到程序报错或者是行为异常时可以试图简化程序不断删除次要逻辑最终用最少的代码复现出错误或者异常行为。在绝大多数的情况下最终形成的MWE不会超过20行。在制作MWE的经过中你很可能会自行发现程序中的错误。假如真的制作出MWE并且还没有找到解决方案那么你带着MWE去提问获得满意答复的概率也会大大增加。建议开发者保持激情不断学习在肖智清的职场经历中他认为作为一名开发者最关键的一点是要保持激情不断学习。技术更新换代非常快只有激情才能让我们不断学习、保持在最前沿。还是以强化学习为例深度强化学习仅仅是最近几年度才有的事情强化学习在短短几年度之间已经发生了翻天覆地

11、的变化编程工具也在快速演进中。在2019年度强化元学习已经成为研究新热点 TensorFlow 2已经成为风头正劲的工具。这些东西在他刚入职场的时候都是不存在的。开发者假如没有不断学习就会被淘汰。写一本全面介绍古典算法以及当代算法的强化学习书 2016年度肖智清从清华大学获得博士学位随后进入一家国际投行从事研发工作。开场撰写AI教程书目前已出版有PyTorch 1纸质教程书?神经网络与PyTorch实战?以及配套TensorFlow 2代码的强化学习教程书?强化学习原理与Python实现?。为何开场撰写 ?强化学习原理与Python实现? Google的AlphaGo激发

12、了很多人学习强化学习的兴趣。但是目前在全球范围内可以完好地将古典的非深度强化学习以及前沿的深度强化学习算法全面阐述的强化学习教程可以讲是几乎没有。有的教程可能侧重于非深度强化学习算法然后只是简单地增加了两三个根底的深度强化学习算法无法使学习者深化解析深度强化学习算法另外有一些教程那么侧重深度强化学习算法但是由于没有系统地介绍古典知识就没有方法全面剖析那些深度强化学习算法的设计思路以及收敛性。实际上古典算法以及深度强化学习算法有非常直接的关系前沿算法的很多改良思想在古典算法中已经有非常类似的研究。所以肖智清就想写一本可以全面介绍古典算法以及当代算法的强化学习书籍使得学习者可以将它们融会贯穿。这本书的亮点之一是它逐章配套代码十分是深度强化学习局部的配套代码是用TensorFlow 2写成的。这本书的电子版首次于2018年度末至2019年度初上线各大浏览平台随书代码也同时在GitHub上公开大众只需要访问本书的GitHub页面就能在线查看所有代码以及运行结果假如有需要还可以下载到本地运行。每个算法的实现相对独立行数大多都在数十行内大多数代码用普通笔记本电脑就可以运行出结果。【End】

展开阅读全文