人工智能会创造自己的语言吗?.docx

上传人:太** 文档编号:35068904 上传时间:2022-08-20 格式:DOCX 页数:3 大小:296.03KB
返回 下载 相关 举报
人工智能会创造自己的语言吗?.docx_第1页
第1页 / 共3页
人工智能会创造自己的语言吗?.docx_第2页
第2页 / 共3页
点击查看更多>>
资源描述

《人工智能会创造自己的语言吗?.docx》由会员分享,可在线阅读,更多相关《人工智能会创造自己的语言吗?.docx(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、本文转自:参考消息 据澳大利亚“对话”网站6月7日刊登了一篇题为人工智能真的发明了自身“秘 密语言”吗?的文章,主要内容编译如下:新一代人工智能模型可以在文本提示的基础上,按照需求制作出“创造性”图像。诸如Imagen、MidJourney和DALL-E 2等图像生成系统正在开始改变创作内容 对版权和知识产权的影响方式。虽然这些模型的输出往往令人震惊,但是现在还难以确定它们究竟是如何产生结 果的。上周,美国研究人员令人饶有兴趣地宣称:DALL-E2模型或许发明了自 身的秘密语言。通过提示DALL-E 2系统创作包含文本字幕的图像,然后再将由此产生的字幕 gibberish (令人费解的胡话)输

2、回系统,研究人员发现:DALL-E 2认为“Vicootes” 的意思是“蔬菜,而Wa ch zod rea”则是指“鲸可能会吃的海洋动物”。人工智能(视觉中国)这些说法令人着迷,如果属实,可能对这种大型人工智能模型产生重要的安全与 解读能力影响。那么,真相到底如何呢?拥有秘密语言?DALL-E2可能并无“秘密语言”。或许比较准确的说法是,它拥有自己的词汇, 但是即便如此,我们也没把握。首先,这个阶段,很难证明有关DALL-E 2及其他大型人工智能模型的任何说法, 因为只有少数研究人员和创意从业者接触它们。公开分享的任何图像都应打个折扣,因为它们是由人从人工智能创作的很多图像 中“筛选出来的”

3、。即使是那些接触这些系统的人,也只能有限使用这些模型。比如,DALL-E2用 户可以制作或修改图像,但是(迄今)不能更深入地与人工智能系统互动,比如 修改幕后代码。这意味着不能用“可解释的人工智能”的方法理解这些系统的工作原理,而系统性 地研究其行为也非常困难。一种可能是,“令人费解的胡话”短语与来自非英语的词语有关。比如“Apoploe”, 类似于拉丁语Apodidae”(雨燕科)一词,似乎以Apoploe作提示创作出来的图 像都是鸟类。这似乎是一种合理的解释。比如,DALL-E2接受大量基于互联网搜索而来的数 据的训练,包括很多非英语词语。类似情况以前也发生过:由于机缘巧合,大型自然语言人

4、工智能模型在没有接受 刻意培训的前提下学会了编写计算机代码。真相扑朔迷离支持这种理论的一个论点就是如下事实:人工智能语言模型与你我解读文本方式 并不相同。相反,它们将输入文本打碎成“令牌”,然后再进行处理。不同的“令牌化”方法会产生不同的结果。把每个词当作一个令牌,似乎是一种直 觉的方法,但是当相同的令牌有不同的意思时(比如“match”一词,当打网球时 以及点火时,就有不同的意思),就会引起麻烦。另一方面,把每一个字母当作一个令牌,所产生的可能的令牌数量较少,但是每 个令牌传递的信息含义都要小得多。DALL-E 2 (及其他模型)使用一种中间方法,称做字节对编码(BPE)。检查 某些令人费解

5、的胡话的字节对编码表征可以发现,这可能是理解这种“秘密语言” 的重要因素。这种“秘密语言”也可能只是“垃圾进,垃圾出”原则的一个例子。DALL-E2不会说 “我不知道你在说什么,因此它总是通过给定的输入文本,产生某种图像。不管怎样,这些选项都不是完整的解释。比如,从令人费解的胡话中去掉个别字 母,似乎会以非常具体的方式破坏已产生的图像。而且,将单个胡话词语组合起 来,并不一定产生合乎逻辑的复合图像(如果确实存在秘密“语言”,那是可以的)。正视现有担忧除了求知欲,你或许在思考这是否真的重要。答案是,是的。DALL-E的“秘密语言是机器学习系统“对抗攻击”的一个例子:一 种通过故意选择人工智能无法

6、正确处理的数据输入,打破系统的故意行为。对抗攻击担心的一个原因是:它们挑战我们对这个模型的信心。如果人工智能以 意外方式解读胡言乱语,那么它或许也会以意外方式解读有意义的词。对抗攻击也提出了安全关切。DALL-E2对输入文本进行过滤,防止用户产生有 害或侵权内容,但是令人费解的胡话“秘密语言”可能会让用户规避这些过滤。近期研究发现:某些语言人工智能模型的对抗“触发短语”简短的废话,可能 触发模型涌出种族主义、有害或带有偏见的内容。这项研究也是目前正在开展的 调研活动,以便理解和控制复杂的深度学习系统如何通过数据进行学习。最后,DALL-E 2“秘密语言”这种现象引起了解读能力担忧。我们希望这些模型按 照人类的预期那样表现,但是看到胡言乱语的结构化输出令我们的预期受挫。你或许还记得2017年关于脸书网站一些“发明了自身语言的”聊天机器人的喧嚣 争论。现在局面有点类似:结果令人担忧,但不是那种“天网即将取代世界”式 的担忧。相反,DALL-E 2的“秘密语言”突出了目前对于深度学习系统的稳健性、安全以 及解读能力的担忧。在这些系统较广泛地应用之前,特别是,在来自非英语文化背景的广泛用户能够 应用它们之前,我们确实无法真正了解到底在发生什么。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁