2022年2022年谷歌的深度学习与人工智 .pdf

上传人:C****o 文档编号:33379303 上传时间:2022-08-10 格式:PDF 页数:3 大小:38.16KB
返回 下载 相关 举报
2022年2022年谷歌的深度学习与人工智 .pdf_第1页
第1页 / 共3页
2022年2022年谷歌的深度学习与人工智 .pdf_第2页
第2页 / 共3页
点击查看更多>>
资源描述

《2022年2022年谷歌的深度学习与人工智 .pdf》由会员分享,可在线阅读,更多相关《2022年2022年谷歌的深度学习与人工智 .pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、谷歌的深度学习与人工智能2013-08-15 22:17:40谷歌目前已经成为一块极富吸引力的磁铁,吸引着全球研究深度学习和相关的人工智能领域专家纷至沓来。2013年 3 月,谷歌收购了由加拿大多伦多大学计算机科学教授杰弗里 希顿创立的深度学习企业DNNresearch,希顿也曾获得过默克大奖。希顿目前将自己的时间一分为二:一半给大学;一半给谷歌。辛顿表示,他计划“ 将这一领域的理念提取出来,用来解决实际问题 诸如图像识别、搜索、自然语言理解等方面的问题” 。上述研究进展时刻在提醒人工智能研究领域的专家们:科幻小说和电影中出现的机器终将出现在现实生活中。的确,机器智能已渗透到各行各业并在逐步改

2、变这些行业的面貌,从通讯、计算到医疗、制造以及运输等,不一而足。IBM 研究的超级计算机Watson 在美国著名的智力比赛中获胜让这一切得以彰显。Watson 也使用了一些深度学习技术,而且,科学家们现在也在训练它帮助医生做决定。微软也在手机操作系统Windows Phone和 Bing 语音搜索中用到了深度学习技术。然而,要想将深度学习技术从语音和图像识别领域扩展到其他应用领域则需要科学家们在概念和软件上做出更大突破,而且还需要计算能力的进一步增强。或许,在几年内,我们不会看到计算机能自己思考,但几十年内或许可以。微软美国研究院的院长皮特 李说,深度学习已经引发了人工智能领域很多新的大挑战。

3、建造大脑当然,有挑战就会有人想解决办法,一直有一些富有竞争力的方法来应对这些挑战。现在,人们已经可以将现实世界的信息和规则“ 喂给 ” 计算机,为了做到这一点,需要程序员们不辞辛劳地编写这方面的软件。这会耗费大量人力物力,但是,系统仍然无法处理模糊数据,这些程序的使用范围仅限于一些受控的应用领域,诸如手机的菜单系统等,该系统要求你通过说出特定的词语来提要求。人工智能领域出现后不久,神经网络也于上世纪50 年代开始兴起。神经网络似乎很有前景,因为它们试图模拟大脑的工作方式,尽管采用的是一种非常简化的形式。程序能标示出一套虚拟的神经元然后随机给它们分配数值或者“ 权值 ” ,以让它们之间相互关联。

4、这些 “ 权值 ” 决定了每个模拟的神经元的反应 用数值输出0 和 1 来表示,通过这种方式可以对图像中的边框或者蓝色阴影、话语中的一个音素的某个能级等特征进行数字化表达。程序员需要训练神经网络通过用含有这些物体的图像或含有这些因素的声波的数字化后的版本来探测一个物体或者音素。如果该网络无法精确地识别某个特定的模式,将会有一个算法来调整这些权值。这种训练的最终目的是让网络能够持续一致地识别出语音或者图像中的这种模式,也就是说,识别出每句语音中的音素“d”或者每幅图像中的狗,这同小孩子通过观察人们称作狗的动物的头型、行为以及毛皮、吠声等等来认识狗如出一辙。但是,早期的神经网络一次能模拟的神经元的

5、数量有限,因此,它们无法识别出复杂程度很高的模式,这种情况一直持续到上世纪70 年代。在上世纪80 年代中期, 辛顿和其他人使用所谓的“ 深度 ” 模型, 引发了神经网络研究的新一轮复兴,深度模型能更好地利用软件模拟多层神经网络。但是,这一技术仍然需要大量的人力投入:程序员们不得不在将数据填入神经元网络前给每个数据贴上标签。而且,复杂的语音或者图像识别所要求的计算能力彼时也让人望尘莫及。在过去十年里,辛顿和其他研究人员才终于做出了一些根本性的概念上突破。2006年,辛顿研发出了一种更有效地训练单层神经元的方法。即第一层网络学习一些基本的特征,诸如图像的边缘或者声音的最小单元等。它通过发现那些出

6、现频率反常高的数字化后的像素或者声波组合来做到这一点。一旦第一层精确地识别出这些特征,那么,它将被“ 喂给 ” 第二层,以便第二层训练自己识别更复杂的特征,诸如边角或者声音单位的组合等等。这一过程在多层之间不断重复,直到该系统能够可靠地识别出音素或者对象为止。就像上面提到的图像中的猫。去年6 月,谷歌演示了迄今最大的神经网络,其拥有超过10 亿个节点。美国斯坦福大学的计算机科学教授安德鲁 恩格和谷歌的科学家杰夫 迪恩让系统从1000 万个随机选择的YouTube视频上挑出了猫的图像。在该软件模型中,一个模拟的神经元主要注意猫的图像。其他神经元则专注于人脸、黄色的花朵以及其他物体的图像。因为深层

7、学习拥有的强大功能,尽管此前并没有人给这些图像贴上标签,该系统还是识别出了这些互不相干的对象。然而,让某些人工智能专家深感震惊的是深度学习在图像识别领域所取得的惊人成就。该系统可以给YouTube视频中的对象分类,并添加主题,准确率达16% ,尽管听起来并不是很高,但与以前的方法相比,准确率提高了70% 。迪恩强调称,要知道,YouTube视频中的对象总共有2.2万个类别,大部分人都无法做到这一点。当该系统被要求将图像分成1000 多个常见类别时,准确率一下子飙升到50% 。大数据在实验中训练多层虚拟神经元占用了谷歌公司的1.6 万台计算机处理器,谷歌公司研发这些计算基础设施的目的是用于搜索引

8、擎和其他服务。机器学习新兴公司Vicarious的联合创始人迪利普 乔治称,人工智能领域最近取得的进步80% 要归功于计算能力的增强。然而,谷歌庞大的数据中心深度学习飞速发展只是这枚硬币的一面,谷歌的操作策略则是这枚硬币的另一面,这些操作策略就是,将计算任务分开,让不同的计算机执行不同的操作以便很快完成这些任务。这是迪恩早期的研究成果,迪恩已在谷歌工作了14 年。这一策略让深度学习神经名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 3 页 - - - - - - - -

9、- 网络的训练速度大大提高,使谷歌能够运行更大的网络并朝这些网络填入更多数据。而且,深度学习也提高了智能手机上声音搜索软件的性能。直到去年,谷歌的安卓(Android )手机软件使用的方法还会弄错很多单词的意思。但是,在准备于去年7 月发布新安卓系统的过程中,迪恩领导的研究团队用基于深度学习的系统取代了部分语音系统。因为多层神经元能对一个声音的多种变形进行更精确的训练,所以,该系统能更可靠地对各种支离破碎的声音进行识别,尤其是在地铁等嘈杂环境中的声音。因为新系统能够更好地理解话语所表达的真实意义,因此,返回的结果可能也会更加精确。几乎一夜之间,错误率下降到了25% ,结果好得出乎人意料之外,有

10、些评论家现在甚至认为安卓的语音搜索功能比苹果手机最著名的Siri 语音助手还要更智能。尽管上述诸多进展令人欢欣鼓舞,但是,并非每个人都认为深度学习会助推人工智能超越人脑。有些批评家表示,深度学习和人工智能从根本上忽略了大脑生物学的很多方面,太过于注重计算能力。其中一个批评来自手提微型电脑Treo 的发明者、 PalmComputing公司的创办人杰夫 霍金斯, 2004 年,霍金斯就出版了人工智能的未来一书,主要讨论大脑如何工作以及如何为建造智能机器提供引导。霍金斯上一个风险投资是Numenta公司,这是一个令人兴奋的新公司,它试图建立像人脑一样的计算机,该公司正在研发一种机器学习系统,其在生

11、物学上受到了深度学习理论的启发,但并不使用深度学习。Numenta的系统能够帮助预测能源消耗模式以及诸如风车等机器失败的可能性。霍金斯表示,深度学习无法解释时间的概念。他说,大脑会处理传感数据流,而且,人类的学习依靠回忆模式序列:当你观察到一只猫在做某些有意思事情的视频,有意义的是运动本身,而非谷歌在实验中使用到的一系列静止图像。霍金斯说:“ 谷歌的态度是,数据弥补了一切。”不过, 即使数据不能弥补一切,诸如谷歌等公司用来解决这些问题的计算资源也不会被弃置。深度学习的支持者们强调说,这些数据非常关键,因为大脑本身比今天的任何一个神经网络都要复杂得多。他们表示:“ 人类需要很多计算资源来使思想更

12、好地工作。”敢问未来之路在何方?尽管谷歌对深度学习的未来应用并不那么确定,但是,其前景确实慢慢在发酵。显然,更好的图像搜索能够帮助YouTube 。而且,迪恩表示,深度学习模型能使用语音数据来更快地训练系统识别其他语音数据。更复杂的图像识别技术有望使谷歌的自行驾驶汽车表现更好。而且,深度学习和人工智能软件也将帮助谷歌和其广告客户更好地了解人们的想法与需求,从而对广告营销产生重大影响。上述美好畅想正是吸引库兹韦尔的魅力所在,65 岁的库兹韦尔多年来一直潜心研究智能机器。在高中阶段, 他就编写软件使计算机能够制造出不同形式的音乐,并于1965 年在电视秀节目我有一个秘密中进行了演示。从那时起,他的

13、发明囊括了多个第一:第一台盲人阅读器;第一个可以对要打印的任何字体的文本进行扫描并数字化的软件;第一个能再造交响乐器的声音的音乐合成器;第一个具备大型词典的对话识别系统。他现在的设想是,未来,人们的手机通讯录中会有一个“ 网络朋友 ” ,可以在用户允许的情况下阅读电子邮件、追踪用户的一举一动,因此,当你有任何问题时,他都会告诉你答案。这并非他在谷歌的直接目的,但是, 这一目的与谷歌联合创始人谢尔盖 布林的目标相吻合。在公司成立之初,布林就表示, 他想建造 2001 太空漫游 中人工智能电脑HAL9000 ( HAL9000作为太空船的总控制电脑,既具有电脑对任务的绝对服从及精确性,又具有人类思

14、维甚至感情,它在太空旅行中设计害死了除戴维之外的所有宇航员,最后戴维让其停止运行)那样的智能机器,唯一不同的是,他制造出来的机器不会杀人。库兹韦尔目前的目标是帮助计算机理解甚至表达自然语言。他说: “ 我的使命是让计算机对自然语言有足够的理解力,然后来做有用的事情更好地进行搜索、更好地回答问题。” 最终, 他希望制造出比IBM 公司的 Watson 更好的机器 尽管他很欣赏Watson表现出的理解能力和快速反应能力。库兹韦尔并不仅仅专注于深度学习,尽管他承认他的语音识别方法也同样基于大脑如何工作的理论。他想给单词、词组以及句子的本来意义建模,包括容易让计算机犯错的模糊意义。他说:“ 我想寻找一

15、种图画式的方式来表达语言的语义。”这就需要一种更综合的方式来用图表表示句子的句法。谷歌也在使用这种分析方法改进翻译中的语法。更好地理解自然语言将需要计算机能够掌握我们人类认为是常识的意思。为此,库兹韦尔将会用到谷歌的知识图谱 谷歌对大约7 亿个主题、方位、人等进行的分类以及它们之间的几十亿个关系。知识图谱去年投入使用,会给搜索者提供问题的答案而非只有链接。最终,库兹韦尔计划用深度学习算法来帮助计算机处理“ 语言中的软边界和模糊内容” 。这听起来令人有点望而却步,实际情况也的确如此。他说: “ 理解自然语言并非像搜索那样,是一个在某个时刻就可以完成的任务,它是一个永远也无法完成的计划。”尽管库兹

16、韦尔的设想可能需要多年才能变成现实,在可见的未来,深度学习可以在语音和图像识别之外的其他领域找到用武之地。首先,在药物发现方面 辛顿的团队在默克大赛中取得大奖就证明了这一点。情况还不止于此,微软公司的皮特 李说,深度学习可以应用于机器视觉方面,机器视觉就是用机器代替人眼来做测量和判断,这一技术可以将成像应用于工业检测和机器人视觉引导等方面。他也预想私人传感器的出现 深度神经网络能够用来预测可能会出现的医疗问题。而且,贯穿整名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 3 页 - - - - - - - - - 个城市的传感器提供的数据可能会让深度学习系统预测什么地方可能会出现交通拥堵。在一个企图为人脑建模这样富有深远影响力的领域,一项技术并不能解决所有问题,这一点难以避免。但现在,深度学习正在引领人工智能的发展方向,迪恩说:“ 对于我们理解世界来说,深度学习真的是一个非常强大的工具名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 3 页 - - - - - - - - -

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁