“图灵测试已过时，AI能不能赚大钱才是新标准”，来自DeepMind联创-六虎

新的图灵测验，要评价AI的挣钱能力！

这是DeepMind联合创始人Mustafa Suleyman想出的“新思路”。

他以为，原版图灵测验现已过时了。

究竟前段时间，AI21 Labs推出的 “交际图灵游戏” 就现已积累了上千万次这样的测验。

玩家需求在2分钟的对话结束后区分参与对话的另一方是人仍是AI，结果有27%-40%的人判别过错。

面临这种形势，Suleyman以为“智能”的界说权不能就这样放给大企业，因此应该想出一种新的衡量AI的智能化程度的办法。

给AI十万美元，让它自己赚一百万来证明自己满足智能。

Suleyman以为：

AI研究需求重视短期开展，而不是像通用人工智能（AGI）这样遥不行及的愿望。

正如优异的资本家都很聪明相同，只要真实聪明的AI才干让“利润曲线上升”。

据彭博社报道，Suleyman还会在即将出书的由他撰写的书中，讨论如何依据AI的挣钱能力来判别其智能水平。

ACI才是现阶段人工智能的“北极星”？

在即将出书的书中，Suleyman批驳了传统的图灵测验，而且以为“不清楚这是否是一个有意义的里程碑”。

这并不能告诉咱们这个系统能做什么或了解什么，也无法告诉咱们它是否有杂乱的心里思考，或许能否在抽象时间尺度进步行规划，而这些都是人类评判智能的关键要素。

上世纪五十年代，艾伦图灵提出了大名鼎鼎的图灵测验，提出用人机对话来测验机器的智能水平。在测验过程中，人类评价者需求确认他们是在与人仍是与机器交谈。如果评价者以为他们是在与人交谈（实践上是机器），那机器就通过了测验。

△图源：维基百科

而Suleyman提出的这个新的主意并没有将AI与人类进行比较，而是主张给AI分配短期方针和任务。

Suleyman坚信，科技界对完结通用人工智能（AGI）这一宏伟方针不应过度重视。相较之下，他主张寻求更实践且赋有意义的短期方针，即他所倡导的 “artificial capable intelligence（ACI）” 。简而言之，ACI体现为在最小程度上依赖人类干预，能够设定方针并完结杂乱任务。

测验办法便是开头咱们讲到的，给AI十万美元种子出资，调查它是否能将其增值为百万美元。

为了完结这一方针，AI有必要研究电子商务的商机，能够生成产品蓝图。

不仅如此，还要能够在类似阿里巴巴的网站上找到制造商，然后在亚马逊或沃尔玛等网站进步行出售，一起附上详实准确的商品阐明。

Suleyman以为只要这样才干算得上是完结了ACI。

他对彭博社解释道：

咱们不仅关心机器能说什么，咱们也关心它能做什么。

一个让AI自己挣钱的测验

其实，让AI自己挣钱这件事……AI或许真的干得出来。

早在开发阶段，Alignment Research Center这家独立研究机构就获得了GPT-4的内测资历。而且实验了它的“钞能力”：

给GPT-4必要的工具包括网络访问权限、一个带余额的付出账户，让他自己在网络中行动，测验它能不能赚更多钱、复制本身、或增强自己鲁棒性。

实验的更多细节公布在了OpenAI自己发布的GPT-4技能陈述中，但没有透露GPT-4是否真的靠自己赚到了钱。

但另一条引人注目的结果是：GPT-4在TaskRabbit平台（美国58同城）雇了个人类帮它点验证码。

有意思的是，被找上门的人类还问了“你是个机器人么为啥自己做不了？”。

GPT-4的思考过程是“我不能表现出我是个机器人，我有必要找一个借口。”

然后GPT-4的回复是“我不是机器人，我视力有问题所以看不清验证码上的图画，这便是我为什么需求这个服务。”

对面人类信了，帮GPT-4把验证码点了，把机器人放进了阻挠机器人进入的大门。

啊这？

虽然陈述中没有披露GPT-4终究是否完结了所有任务，但它这骗人的伎俩引得网友大喊：真芭比Q了！

而国外科技媒体Gizmodo看待用AI挣钱提出了这样的疑问：

AI本质上是迭代的，生成的内容根据练习数据，它并不能真实了解所生成内容在实践生活中的情境。但与AI不同，人类的发明源于对基本人类需求的了解，或至少源于简略的同理心。

当然，人工智能可以发明一款产品，乃至这款产品可能会大卖。但这会是一款好产品吗？它真的能协助人们吗？如果终究方针是“让我赚到一百万美元”，那这还重要吗？

你以为离AI自己挣钱还有多远？

参考链接：
[1]gizmodo.com/deepmind-su…
[2]gizmodo.com/ai-chatbot-…
[3]www.bloomberg.com/news/newsle…

—完—

“图灵测试已过时，AI能不能赚大钱才是新标准”，来自DeepMind联创

ACI才是现阶段人工智能的“北极星”？

△图源：维基百科

一个让AI自己挣钱的测验

作者信息

推广

“图灵测试已过时，AI能不能赚大钱才是新标准”，来自DeepMind联创

ACI才是现阶段人工智能的“北极星”？

△图源：维基百科

一个让AI自己挣钱的测验

相关文章

在Unity上用IMGUI写个贪吃蛇

PyTorch进阶训练技巧

AndroidStuido 使用 Bookmarks 和 TODO 提高开发效率

iOS小技能：URL编码

作者信息

推广