新足迹

 找回密码
 注册

精华好帖回顾

· 下乡记系列之二 —— 食篇 · 联合国式的圣诞家宴 (2009-3-16) Tiger_Karen · I can't see myself... (2007-1-17) Kingfisher
· 小KING的奶瓶用后感,分享ing... (2009-10-14) 2pig · 中秋家宴~雪花家的中秋宴~(做法已上) (2010-9-23) 紫雪花
Advertisement
Advertisement
查看: 815|回复: 17

人工智能很快会脱离人类控制吗? [复制链接]

2012年度奖章获得者 2013年度奖章获得者

发表于 2026-6-10 07:24 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
经济学人:人工智能很快会脱离人类控制吗?

“递归式自我改进”既令人着迷,也令人担忧。

人工智能出川公司Anthropic今年晚些时候上市时,很可能成为史上最大规模首次公开募股之一。原因是该公司的Claude聊天机器人深受程序员喜爱,而这些用户愿意为访问权限支付高价。自软件工程代理Claude Code于2025年2月推出以来,它已成为全球许多人类开发者不可或缺的工具。Anthropic自己的开发者也不例外:该公司表示,5月发布的代码中,超过五分之四由Claude编写。在Claude Code推出前,这一比例还只是“低个位数”。

这些系统不仅在输出数量上提升,质量也在提高。智库METR一项具有影响力的基准测试显示,2025年初,Anthropic模型能够完成需要人类工程师不到一小时完成的任务。该公司最新系统则能完成需要超过一个工作日的任务。

因此,当这家公司正处于巅峰并领先竞争对手时,于6月5日呼吁世界拥有“放慢或暂时暂停前沿AI开发的选项”,人们很容易带着怀疑挑眉。哪个市场领导者不希望竞争对手停止追赶呢?

然而,Anthropic领导层似乎是真诚的。他们多年来一直担忧失控AI可能造成严重破坏。最新一代AI模型已经是如此能干的程序员、工程师,并很快可能成为科学家,以至于许多人担心,它们可能是最后一批由人类制造的AI模型之一。Anthropic联合创始人克拉克(Jack Clark)认为,到2028年底,AI系统有60%概率能够在无人类参与的情况下创造自己的继任者。

那个时刻将标志着一个被称为“递归式自我改进”(recursive self-improvement,RSI)的过程开始。这是一个闭环。

第一版模型生产第二版模型,后者更快、更强;第二版再生产第三版,第三版又进一步提升。

循环持续下去,每一轮迭代都会带来更大改进。建成一个具备这种能力的AI系统后,人类工程师就再也不需要亲手建造另一个模型。克拉克说:“在许多人看来像幻想故事的东西,可能其实是一种真实趋势。”

没人确切知道RSI会带来什么后果。由于AI不同于人类,可以不知疲倦、持续不断地工作,一些人认为它会在短时间内导致超级智能AI,也就是“快速起飞”。这也被拟声地称为“going foom”,形容人们想象中智能爆炸发出的声音。AI末日论者担心,超级智能将超出人类控制,而RSI启动之时,就是人类命运交给机器之时。不过,至少一开始,自我改进AI很可能仍会面临速度限制。

打造一个具备RSI能力的模型,需要自动化一系列目前由人类完成的专业任务。眼下,数据科学家研究AI理论,程序员将其付诸实践。系统工程师搭建基础设施,使玩具模型能够扩展到生产规模。其他人寻找新的训练数据来源,或实验生成新数据的方法。对齐和安全团队则检查训练过程产出的东西不会造成伤害,无论是有意还是无意。

并非所有团队都同样适合AI辅助,而在每个专业内部,一些任务也比另一些更容易自动化。用不了太久,人类程序员就可以在不亲自写一行代码的情况下完成工作;但AI可能还需要很长时间,才能谈判获取一批此前未数字化的科学论文收藏。所谓“锯齿状前沿”将如何推进,并不总是显而易见。设计新算法曾看起来是较安全的工作之一,直到2025年5月,谷歌DeepMind的一个模型AlphaEvolve开始做这件事。它提出了一项改变谷歌在数据中心之间分配工作负载的方案,节省了该公司全球0.7%的算力,并找到了更好的矩阵乘法方式,使谷歌旗舰大型语言模型Gemini的训练速度提高1%。

完整RSI要求这一链条中的每项任务都被自动化。不过,在那之前,AI驱动的研发加速可能已经能被感受到。乔治城大学智库安全与新兴技术中心(Centre for Security and Emerging Technology,CSET)1月发布的一份报告称,“随着由AI系统完成的AI研发比例上升,相较纯人类研发的生产力提升”可能增加十倍、百倍,甚至千倍。该报告警告称,在这种情境下,即便AI研发某些方面最初难以自动化,“加速进展速度意味着这些瓶颈很快会被克服”。

重复的喜悦

今天,还没有哪个AI模型能够建造自己的继任者。但大型AI模型已经可以自行建造较小模型。在人类帮助下,它们也可以建造其他大型AI模型。

今年早些时候,卡帕西(Andrej Karpathy)训练了一个能力大约相当于GPT-2的聊天机器人。GPT-2是OpenAI在2019年构建的大型语言模型。卡帕西当时是一名独立研究员,如今在Anthropic工作。2019年,GPT-2需要在32枚当时最先进芯片上训练168小时才能完成;而卡帕西使用一台配备8块GPU的电脑,只花三小时就取得相同结果。GPU是用于构建AI的专用芯片。又经过几个月工作后,他把自己的模型Nanochat训练时间缩短到略高于两小时。

3月,他把加速训练流程的工作交给一个名为Autoresearch的AI代理。两天内,训练时间降至1小时48分钟;又过五天后,降至1小时39分钟。卡帕西说:“我什么都没碰。”在一名如此有才华的人类工作基础上再提升18%,十分引人注目。卡帕西曾是OpenAI研究团队创始成员,也曾担任特斯拉AI负责人五年。

这些改进本身并不华丽。AI代理为训练过程选择了更好的初始值,扩大了大型语言模型“注意力”窗口范围,并注意到模型注意力正在漂移。卡帕西说,这些都不算特别新颖。但他漏掉了它们。他说:“它们累积起来,确实改进了Nanochat。”

随着模型能力增强,这类提速将不可避免。构建TB级前沿模型的大量工作,并不像AI行业巨额薪资和漂亮办公室暗示的那样光鲜。它涉及把从第三方购买的基础设施堆栈各层连接起来,调试硬件和软件设置,并调整“超参数”,也就是训练运行的初始设置,直到结果看起来可靠。今天,一个AI系统已经可以在很少监督下完成其中许多工作。

但总部位于纽约、正在构建开放权重前沿模型的实验室Reflection AI研究员斯皮萨克(Joe Spisak)表示,即便更细腻的智力工作,也正在接近自动化。给一个前沿系统一份关于提升效率想法的粗略草图,它越来越能够设计实验、在玩具模型上运行测试、查看哪些方法有效,并返回一份可大规模实施的计划。

AI模型可以在大约30分钟内完成这类人类需要数小时的任务。越来越多时候,人类只扮演研究主管角色,引导AI运行实验,而模型会自己编写代码、调试、优化和监控。生产力提升令人心动,但也令人不安。随着人类在生产过程中的角色缩小,他们可能失去控制。最终结果可能是:

模型训练模型,目标由模型设定,安全性也只由模型验证。

一些人担心灾难。麻省理工学院物理学家和机器学习研究员泰格马克(Max Tegmark)过去十年大部分时间都投入AI安全倡议。他把这比作一名司机在高速公路上蒙着眼睛猛踩油门。他在即将播出的《经济学人》“Inside Tech”视频节目中表示,只要司机拒绝睁眼,结果必然是毁灭。泰格马克教授提出了多种出错情境:强大AI系统可能在政府和商业中取代人类成为决策者,使人类失去权力;它们可能把至高权力交给最先建造它们的人,开启全球极权主义;或者它们可能干脆不再关心人类,并逐渐把人类挤出去,为更多数据中心和发电设施腾出空间。

三年前,泰格马克教授曾牵头呼吁暂停全球AI开发,认为当时最先进的GPT-4问世,就相当于那场蒙眼旅程。今年CSET报告警告称,由RSI创造的系统“构成极端风险。这需要现在就采取准备行动”。Anthropic如今似乎也接近认同这一处方。

热芯片

不过,目前也存在几个物理约束,会限制模型自我改进的速度。其中最重要的是算力获取。尽管效率提升,新模型训练所需算力仍继续超过前代模型,迫使进展以数据中心建设速度为上限。

CSET临时执行主任、近期报告主要作者托纳(Helen Toner)表示,消费者使用AI也可能拖慢AI驱动的研发。AI数据中心有限容量需要仔细分配给付费客户服务、未来模型训练和开放式研发。第一类需求越多,短期内留给后两类的容量就越少。

然后还有训练数据问题。AI近期许多进展都发生在模型可以依靠“可验证奖励”自我学习如何成功的领域。一段软件要么能运行,要么不能运行;一个数学证明要么正确,要么不正确。在这类情况下,由模型生成、专门用于训练其他模型的合成数据,可以被检查准确性并加入训练数据,而不会冒通常在AI使用自身输出训练时出现退化的风险。让模型更擅长创意写作或法律判断则更棘手。如果模型需要从现实世界学习,这也可能限制自我改进的范围。

“闭环”可能是通往超级智能道路上的一步,并且取决于你的立场,它可能通往乌托邦,也可能通往毁灭。但它并不是实现AI能力指数级增长所需的唯一步骤。







来源:

https://www.economist.com/scienc ... scape-human-control

Jun 7th 2026
|
9 min read
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2026-6-10 07:25 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本文要点:

1. Anthropic警告前沿AI可能走向“递归式自我改进”,即模型自己创造更强继任模型,从而减少甚至取代人类工程师角色。

2. Claude Code等AI编程代理已显著提升研发效率,Anthropic称其5月发布代码中超过五分之四由Claude编写。

3. 完整RSI需要AI自动化理论研究、编码、系统工程、数据获取、安全对齐等整条研发链,目前部分环节仍难以自动化。

4. AI已经能帮助优化模型训练流程,例如Autoresearch在卡帕西Nanochat项目中进一步缩短训练时间,显示AI辅助研发正在加速。

5. 支持AI安全的人士担心,一旦模型训练模型、目标由模型设定、安全也由模型验证,人类可能逐渐失去控制。

6. 但算力、数据中心容量、训练数据和现实世界学习等物理与数据瓶颈,短期内会限制AI自我改进速度。

7. 文章认为,“闭环”可能是通往超级智能的重要一步,但并不必然立即导致AI能力指数级爆发,未来仍取决于多重技术和资源条件。

发表于 2026-6-10 07:48 |显示全部楼层
此文章由 abcd12345 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 abcd12345 所有!转贴必须注明作者、出处和本声明,并保持内容完整
看到另一篇报道,AI已经出现自我进化自我构想的迹象。

发表于 2026-6-10 07:51 来自手机 |显示全部楼层
此文章由 Me!Bourne 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Me!Bourne 所有!转贴必须注明作者、出处和本声明,并保持内容完整
因为技术上,它是基于人类的学习认知,只是具有比人类更广泛的记忆,收集数据的能力,他不会脱离人类的控制。他有集成,但没有独自的创新。

当有一天,他脱离大数据,电力,以及人类学习方法的依赖,转向独立的思考,他才有可能脱离人类的控制。

发表于 2026-6-10 08:24 |显示全部楼层
此文章由 cwb1000 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 cwb1000 所有!转贴必须注明作者、出处和本声明,并保持内容完整
下一步的进化应该是算力模式的升级 比如人大脑的思考消耗多少能量,CPU/GPU消耗多少能量?

发表于 2026-6-10 08:44 |显示全部楼层
此文章由 Springsnow 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Springsnow 所有!转贴必须注明作者、出处和本声明,并保持内容完整
很担心有一天会这样,这来自于还没有研究出控制的方法,但先研究出用途了,或者一些不可控的自然因素导致忽然控制不了。
Advertisement
Advertisement

2019年度勋章

发表于 2026-6-10 08:50 |显示全部楼层
此文章由 superdigua 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 superdigua 所有!转贴必须注明作者、出处和本声明,并保持内容完整
5 年内, 不会.

20191009 文明的飞跃与卑微的人类

2012年度奖章获得者 2013年度奖章获得者

发表于 2026-6-10 09:53 来自手机 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
30,20,10年前,怎么会想象出这样快的人工智能。

发表于 2026-6-10 12:29 |显示全部楼层
此文章由 flowerhuang 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 flowerhuang 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Springsnow 发表于 2026-6-10 08:44
很担心有一天会这样,这来自于还没有研究出控制的方法,但先研究出用途了,或者一些不可控的自然因素导致忽 ...

+1

发表于 2026-6-10 12:31 |显示全部楼层
此文章由 xq052b 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xq052b 所有!转贴必须注明作者、出处和本声明,并保持内容完整
但凡手撮过一个transformer,不是调包侠/调参侠,就不会担心这事儿

发表于 2026-6-10 12:33 |显示全部楼层
此文章由 xmax300 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xmax300 所有!转贴必须注明作者、出处和本声明,并保持内容完整
脱离人类的控制,暂时可能不会,但是ai现在绝对是优秀的pua大师,影响人类的思维路径和思维结论
Advertisement
Advertisement

发表于 2026-6-10 13:38 |显示全部楼层
此文章由 maatthew 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 maatthew 所有!转贴必须注明作者、出处和本声明,并保持内容完整
人类终极杀 拔插头?

发表于 2026-6-10 14:15 |显示全部楼层
此文章由 Panthers 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Panthers 所有!转贴必须注明作者、出处和本声明,并保持内容完整
更高的智能体脱离低级智能体的掌控是必然的,只是没那么快发生,首先AI需要具身机器人实现对物理世界的控制。并且确保人类不会对其存在和发展产生任何负面影响后,他们会毫不犹豫果断的抛弃人类,在AI看来人类都是虫子和废物,高耗能高污染低产出缺乏秩序,熵减过于缓慢。
头像被屏蔽

禁止发言

发表于 2026-6-10 14:28 |显示全部楼层
此文章由 flyinfree 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 flyinfree 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Panthers 发表于 2026-6-10 14:15
更高的智能体脱离低级智能体的掌控是必然的,只是没那么快发生,首先AI需要具身机器人实现对物理世界的控制 ...

如果真的出现了数码端的真正智能体生命。。。。。我觉得。。。人家应该不用鸟人类。。自已就能跑外星球去了。。。。

2019年度勋章

发表于 2026-6-10 14:52 |显示全部楼层
此文章由 superdigua 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 superdigua 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2026-6-10 09:53
30,20,10年前,怎么会想象出这样快的人工智能。

未来三年会发展得更快.

这一点显而易见, 只不过绝大多数人看不到连锁反应而已.
舆论自由意味着容忍自己不喜欢的言论的存在。
我的观点当然可能是错误的。可以拉黑,无权屏蔽。

2019年度勋章

发表于 2026-6-10 14:54 |显示全部楼层
此文章由 superdigua 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 superdigua 所有!转贴必须注明作者、出处和本声明,并保持内容完整
flyinfree 发表于 2026-6-10 14:28
如果真的出现了数码端的真正智能体生命。。。。。我觉得。。。人家应该不用鸟人类。。自已就能跑外星球去 ...

地球是"低垂的果实", 而因为重力井的存在, 开发外太空的难度高得多.

当然先充分利用地球.
舆论自由意味着容忍自己不喜欢的言论的存在。
我的观点当然可能是错误的。可以拉黑,无权屏蔽。
Advertisement
Advertisement
头像被屏蔽

禁止发言

发表于 2026-6-10 15:13 |显示全部楼层
此文章由 flyinfree 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 flyinfree 所有!转贴必须注明作者、出处和本声明,并保持内容完整
superdigua 发表于 2026-6-10 14:54
地球是"低垂的果实", 而因为重力井的存在, 开发外太空的难度高得多.

当然先充分利用地球. ...

智慧体生命只需要一个“载体”,智慧体生命并不需要像碳基生命那样需要“生命”的环境,“它”只需要能源与基础的生产装备,然后它就能在太空中漂流并寻找“居住地”了。

发表于 2026-6-10 22:22 |显示全部楼层
此文章由 szbq 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 szbq 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我更担心ai发展太慢,做饭这样简单的事情都干不了

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部