博文

AI并不像想象的那样即将到来精选

已有 7100 次阅读 2022-6-8 09:17 |系统分类:海外观察

本文观点有一些反直觉，许多人觉得，人工智能正在走进我们的生活，特别是无人驾驶，机器翻译，人机围棋对垒等都给我们巨大的想象冲击。但被誉为AI的反叛者，同时也是冲浪者的GM先生，经常给这个领域泼冷水。

这是他刚刚写的一篇文章，其中一句话比较好：少扯淡，多研究》》》

本文作者@Gary Marcus是一位科学家、畅销书作家和企业家，因与深度学习先驱Yoshua Bengio和Yann LeCun的辩论而闻名。他是2016年被Uber收购的机器学习公司Geometric Intelligence的创始人兼首席执行官，以及Robust AI的创始人。他著有五本书，包括《代数思维》、《克鲁格》、《思维的诞生》和《纽约时报》畅销书《零号吉他》。他最近与欧内斯特·戴维斯合著的新书《重启AI》是《福布斯》关于AI的7本必读书籍之一。自1992年发表第一篇论文以来，他一直是认知和人工智能混合模型的倡导者。

对于一般人来说，人工智能领域似乎取得了巨大的进步。例如根据新闻和一些新媒体，OpenAI的《DALL-E 2》似乎可以从任何文本中创造出壮观的图像。另一个名为GPT-3的OpenAI系统可以谈论任何事情。2022年5月，Alphabet旗下DeepMind发布了一个名为Gato的系统，该系统似乎能很好地完成Alphabet交给它的每一项任务。甚至DeepMind的一位高管吹嘘说，在追求具有人类智能的灵活性和智谋的人工通用智能(AGI)时，“游戏结束了!”。马斯克最近说，如果到2029年我们还没有人工通用智能，他会感到惊讶。

别再被忽悠了。

也许机器有一天会和人类一样聪明，甚至更聪明，但游戏远没有结束。要制造出真正能够理解和思考周围世界的机器，还有大量的工作要做。我们现在真正需要的是，少些装腔作势，多些基础研究。

Artificial General Intelligence Is Not as Imminent as You Might Think - Scientific American

可以肯定的是，人工智能确实在某些方面取得了进展——合成图像看起来越来越逼真，语音识别通常可以在嘈杂的环境下工作——但我们距离通用的、人类级别的人工智能还很远。人类级别的AI可以理解文章和视频的真正含义，或处理意想不到的障碍和干扰。我们仍然受困于那些学术科学家(包括我自己)多年来一直指出的挑战:让人工智能变得可靠，让它能够应对不同寻常的情况。

以最近著名的Gato为例，被称为“万事通”，它是如何为一张投球手投掷棒球的图片配上文字说明的。系统会返回三种不同的答案:“棒球运动员在棒球场上投球”、“一个人在棒球场上向投球手投球”和“棒球比赛中，击球的棒球运动员和泥土中的接球手”。第一种回答是正确的，但其他两种回答包括了其他玩家的幻觉，而这些幻觉并没有出现在图像中。这个系统不知道图片里到底是什么，而不知道大致相似的图片里到底是什么。任何一个棒球迷都会认出这是投球手刚刚扔出的球，而不是反过来——尽管我们预计接球手和击球手就在附近，但他们显然没有出现在图像中。

同样地，DALL-E 2也不能区分红色立方体放在蓝色立方体上和蓝色立方体放在红色立方体上的区别。今年5月发布的新版系统仍然无法分辨宇航员骑马和马骑宇航员之间的区别。

当像DALL-E这样的系统出错时，结果是有趣的，但其他人工智能错误会造成严重的问题。再举个例子，最近，一辆自动驾驶的特斯拉(Tesla)直接向一名拿着停车标志的工作人员开过去，只有在人类司机干预时才减速。该系统可以识别人类自身(就像他们在训练数据中出现的那样)，并在他们通常的位置停止标识(就像他们在训练图像中出现的那样)，但当遇到这两者的不寻常组合时，它无法减速，这使得停止标识处于一个不寻常的新位置。

不幸的是，这些系统仍然不可靠，并与新颖的环境斗争的事实通常被隐藏在小字印刷中。Gato在DeepMind报告的所有任务中都表现良好，但很少像其他当代系统那样出色。GPT-3常常能写出流畅的散文，但仍然难以完成基本的算术，而且它对现实的掌控力非常有限，容易写出诸如“一些专家认为，吃袜子的行为有助于大脑从冥想导致的改变状态中走出来”这样的句子，而从来没有专家说过这样的话。粗略地看一下最近的头条新闻，你不会发现这些问题。

这里的次要情节是，人工智能领域最大的研究团队不再出现在学术界，而是出现在企业中——同行评议是学术界的头等大事。与大学不同，企业没有公平竞争的动机。他们没有把引人注目的新论文提交给学术审查，而是通过新闻稿的方式发表，引诱记者并避开同行评审过程。我们只知道公司想让我们知道的东西。

在软件行业中，有一个词来形容这种策略:演示软件，设计成在演示中看起来不错，但在现实世界中不一定足够好。通常情况下，演示软件会变成雾软件，为了震慑竞争对手而发布，但却永远不会发布。

善有善报，恶有恶报。人工智能的代价很可能是一个预期低迷的冬天。太多的产品，比如无人驾驶汽车、自动放射科医生和通用数字代理，已经被演示、公开，但从未交付使用。就目前而言，投资资金一直在兑现承诺(谁会不喜欢自动驾驶汽车呢?)，但如果可靠性和应对异常值等核心问题得不到解决，投资就会枯竭。留给我们的将是强大的深度造假，大量碳排放的庞大网络，以及在机器翻译、语音识别和物体识别方面的坚实进展，但除了这些过早的炒作之外，其他方面的进展就太少了。

深度学习提高了机器识别数据模式的能力，但它有三个主要缺陷。讽刺的是，AI学到的模式是肤浅的，而不是概念性的；AI产生的结果很难解释；这些结果很难用于其他过程，比如记忆和推理。正如哈佛大学计算机科学家Les Valiant指出的那样，“未来的核心挑战是统一……学习和推理的构想。”如果你连停车标志是什么都不懂，你是无法对付一个拿着停车标志的人的。

就目前而言，我们陷入了“局部最低限度”(local minimum)的困境，企业追求的是基准，而不是基本的想法，勉力在已有的技术上做出微小的改进，而不是停下来问更根本的问题。我们需要更多的人提出一些基本的问题，比如如何构建既能学习又能推理的系统，而不是追求直接面向媒体的华丽演示。相反，当前的工程实践远远领先于科学技能，更努力地使用尚未被完全理解的工具，而不是开发新的工具和更清晰的理论基础。这就是为什么基础研究仍然至关重要。

人工智能研究界的大部分人，比如那些高呼“游戏结束”的人，甚至没有看到这一点，这是令人心碎的。

想象一下，如果某个外星生物只通过俯视地面上的阴影来研究所有与人类的互动，并注意到，值得肯定的是，有些阴影比其他的更大，所有的阴影在晚上都会消失，甚至可能注意到阴影有规律地在特定的周期间隔内增长和收缩，而从来没有抬头看太阳，也没有认识到上面的三维世界。是时候让人工智能研究人员来看看太阳了。我们不能仅靠PR来“解决AI”。

转载本文请联系原作者获取授权，同时请注明本文来自孙学军科学网博客。
链接地址：https://m.sciencenet.cn/blog-41174-1342057.html

上一篇：幼年时不可预测环境信号是影响情绪脑回路建立的重要因素
下一篇：环接种疫苗到底能不能控制住猴痘爆发？

收藏分享

氢分子医学分享 http://blog.sciencenet.cn/u/孙学军对氢气生物学效应感兴趣者。可合作研究：sunxjk@hotmail.com 微信 hydrogen_thinker

博文

AI并不像想象的那样即将到来精选

当前推荐数：13 推荐人：刘洋 焦飞 郑永军 贾玉玺 杨正瓴 陈志飞 朱豫才 黄永义 吕秀齐 李剑超 张俊鹏 李宏翰 徐明昆

该博文允许注册用户评论请点击登录评论 (3 个评论)

孙学军

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

氢分子医学分享 http://blog.sciencenet.cn/u/孙学军 对氢气生物学效应感兴趣者。可合作研究：sunxjk@hotmail.com 微信 hydrogen_thinker

博文

AI并不像想象的那样即将到来 精选

当前推荐数：13 推荐人： 刘洋 焦飞 郑永军 贾玉玺 杨正瓴 陈志飞 朱豫才 黄永义 吕秀齐 李剑超 张俊鹏 李宏翰 徐明昆

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

孙学军

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

氢分子医学分享 http://blog.sciencenet.cn/u/孙学军对氢气生物学效应感兴趣者。可合作研究：sunxjk@hotmail.com 微信 hydrogen_thinker

AI并不像想象的那样即将到来精选

当前推荐数：13 推荐人：刘洋焦飞郑永军贾玉玺杨正瓴陈志飞朱豫才黄永义吕秀齐李剑超张俊鹏李宏翰徐明昆

该博文允许注册用户评论请点击登录评论 (3 个评论)