中国人体粉嫩胞高清视频 突发!Anthropic号召全员住手AI研讨

Jay 发自 凹非寺量子位 | 公众号 QbitAI中国人体粉嫩胞高清视频
迫切发现:AI的自进化,运转了。
这是Anthropic刚刚在长文博客中,发表的暴论。
咱们的里面数据炫夸,Claude正在加快AI发展,这可能是一条递归自我擢升(RSI)的旅途。

并非「稠浊视听」,看了下著述,Anthropic是果真实打实地用数据在话语——
截止本年5月,80%以上的Anthropic代码,都是Claude写的。
而在Claude Code发布之前,这个数字还仅是个位数。
与此同期,Anthropic工程师平均每季度托付的代码量,是2021-2025年的8倍。

更迫切的是质料——
在最绽放、最无极、连谜底长什么样都不细则的编程任务上,Claude的奏效力现在是76%,六个月前才26%。
50个百分点的跳升。半年。

Anthropic里面仍是有不少工程师以为,Claude写的代码质料和东谈主类打平了。
瞻望年内会逾越。
Anthropic还强调,淌若这个趋势连接下去,AI我方狡计和构建下一代AI,是满盈可能的。
这可能透彻改变社会,在医疗、科技、经济畛域带来浩大的刚正。但也可能让对都问题重迭恶化,最终导致失控。
因此,Anthropic带头号召:
淌若存在一个可考证的机制,能保证AI现实室如实都没悄悄卷,咱们风景减慢、甚而暂停。
除此以外,Anthropic的这篇博客里,还放出了蛮多成心思意思的不雅点和事实。
以下是经过整理,更便捷公共阅读的版块。
Enjoy。
Anthropic长文定调
AI圈的摩尔定律来了
Anthropic创建了个全新的揣测维度,叫「AI能恬逸完成的任务时长」。
2024年3月,Claude Opus 3能惩办东谈主类或者需要4分钟的软件任务。
一年后中国人体粉嫩胞高清视频,Claude Sonnet 3.7,1.5小时。
又一年,Claude Opus 4.6,12小时。
而最新的Mythos,在内测中的显露是:
能一语气职责「至少」16小时,仍是到了METR测试框架能揣测的上限了。
这个翻倍速率,从本来的每7个月翻一倍,加快到了每4个月翻一倍。
淌若趋势不变,2027年,可能是好几周。

Claude编写了大部分Anthropic代码
按捺2026年5月,我Anthropic代码库的代码,逾越80%由Claude编写。在Claude Code发布前,这个数字一直只好个位数。
这种变化,也体现在工程师的职责容颜上。
在 Anthropic 的率先四年,工程师每天Merge的代码行数基本保持不变。
2025年, Claude运转我方写代码,merge数瞬息运转飙升。
如今,2026年第二季度,工程师每天merge的代码量是2024年的8倍。

不外,代码量上去了,代码质料是不是注水了?
Anthropic说,这一年来,工程师矫正Claude的次数,越来越少了。
这少量,在benchmark中可见一斑,如下图所示。
总共难度类型的任务中,Claude的奏效力,无一例外的沿途暴增。

是以,Anthropic现在干脆用Claude来review代码。
是的,总共提交到代码库的改换,都会先过一遍Claude自动审查,查抄bug、安全间隙和其他劣势。
他们回溯分析发现,淌若之前每次改换都有这谈自动审查,大要三分之一导致claude.ai线上事故的bug,上线之前就会被拦下来。
要知谈,写那些代码的工程师,仍是是全寰宇造AI系统最顶尖的一批东谈主了。
Claude在握他们的特殊。
创造力的放大镜
接下来是Claude在研讨层面的参与进程。
Anthropic有个旧例,每次发新模子,av网站不卡免费婷婷都会给Claude一段西宾微型AI模子的代码,让它在保证正确性的前提下,把运行速率优化到最快。
2025年5月中国人体粉嫩胞高清视频,Claude Opus 4交出的谜底是:加快3倍。
2026年4月,Claude Mythos Preview作念到了52倍。
当作参考,一个老到的东谈主类研讨员,需要4到8个小时智力强迫达到4倍。
不到一年的时辰,Claude逾越了东谈主类。
2026年4月,Anthropic丢给Claude一个AI安全研讨,轻视是「一个弱模子能弗成可靠地监督一个强模子」,然后让Claude我方提假定、跑现实……
这次先说东谈主类的显露吧,两个东谈主类研讨员花了大要一周时辰,把gap削弱了23%。
而Claude,在大要800小时、花了大要18000好意思元的算力之后——
削弱了97%。

咱们何去何从?
到这里为止,论断仍是很了了了。
东谈主类在AI成立经由里的扮装,每一个门径都在收窄。
代码,Claude写了。代码review,Claude作念了。现实实施,Claude快了东谈主类一个数目级。现实狡计,Claude运转我方来了……
东谈主类现在临了的比拟上风,是研讨回味和判断力。
但这个上风能守多久?
Anthropic在博客里说,他们也不细则。
一种可能是,「研讨回味」就像之前AI不会的其他东西一样,先是作念不到,然后瞬息就作念到了。
就像AI默契幽默、展示心智表面、解语言谜题,都履历了不异的弧线。
另一种可能是,即便Claude恒久学不会委果的研讨回味,仅靠现在的加快趋势,每个东谈主类研讨员能同期结合的职责量仍是大了好几倍。
你不需要AI满盈替代你想考,它只须把总共「实施」的活全干了,你就只需要作念那5%的目的采用。

RSI的三种明天
博客结果,Anthropic形貌了对于这次「自进化」趋势三个可能演化目的。
1、停滞。
那些指数弧线其实是S弧线。
也许研讨判断力这个东西就是没法靠scale解决,需要一种全新的架构打破。
或者,瓶颈在动力、在芯片、在算力的物理供应链上。
不外,即便AI的智力就停滞在今天的水平,也会发生对寰宇带来紧要变化。
前段时辰的Project Glasswing,Mythos Preview在上线头几周就发现了逾越一万个高危和严重级别的软件间隙,遍布全球最环节的系统。
2、AI连接加快,但东谈主类仍然把着目的盘。
组织成果会指数级擢升,100东谈主的公司作念1万甚而10万东谈主的活。知
Anthropic以为咱们或者率正在走进这个场景。
但他们也发现了一个成心思意思的表象,就是阿姆达尔定律在组织里的体现_
Claude把代码写得赶紧了,结果代码review酿成了新瓶颈。多样新意见、新器具、新现实爆炸式裸露,远超组织的消化智力。
瓶颈不会消亡,仅仅转机到下一个门径。
3、AI完了满盈的递归自我擢升,运转我方造下一代我方。
这个场景下,AI的发展速率满盈取决于算力了。东谈主类退到监督、考证、审核的位置。
淌若果真发生,这种智力或者率会迁徙到其他科学畛域,医学、材料、动力,全线升空。
固然,另一种明天,是对都失败。
这种情况下,偏差会在AI自我迭代的过程中逐步蕴蓄,最终——满盈失控。
OMT
以上,就是Anthropic这次对于自进化,最环节的几个不雅点。
说真话,最运转我其实没太当回事,毕竟Anthropic未必就要IPO了,这一波不是典型的「Anthropic式」公关?
你别说,这次,可能果真有点不一样。
因为就在几天前,OpenAI也发布了雷同的博客:
咱们也在现在系统中看到自进化的早期迹象: AI的发展本人也被AI加快。咱们瞻望这将加重成立商和国度之间的竞争压力,并带来现存机构无法应付的经管挑战。跟着RSI的出现,社会需要行动塑造AI的发展轨迹 ,确保其业绩于东谈主类利益。

奇点,似乎来得比总共东谈主预见的都要快。
博客:https://www.anthropic.com/institute/recursive-self-improvement
参考聚积:[1]https://x.com/kimmonismus/status/2062517474277675102[2]https://x.com/anthropicai/status/2062568873321513443

