| 

本文来自微信公众号:青萍见,作家:舒书,头图来自:AI 生成 以前两天,AI 圈最奇幻的一幕出现了:以安全洁癖著称的 Anthropic,因为一个连实习生都不该犯的 CMS 配置诞妄,让 3000 份里面文献在互联网上裸奔。 集聚安全股应声暴跌,安全筹商员们一边吃瓜一边炸锅——谁能思到,这家天天喊着" AI 安全高于一切"的公司,我方的安全防地竟比纸糊的还脆? 但比这场初级显露更调侃的是,就在事发前一个月,Anthropic 刚刚暗暗撕掉了我方最引认为傲的安全答允。 新版《负牵累彭胀计谋》(RSP 3.0)里,阿谁曾让 OpenAI 都显得不说念德的"若风险不可控,就暂停锻练"的硬条目,被悄无声气地删除了。 这不是时期疗养,这是一场经心包装的东说念主设坍塌。 一、从硬刹车到软着陆:安全答允的弹性变形记 2023 年,当 Anthropic 推出 RSP 时,统共这个词行业都在饱读掌。 这是第一次,有 AI 公司敢公开说:"如若模子太危机,咱们就不作念了。" 其时的逻辑简便阴恶:设定危机阈值(比如能扶植研发生物刀兵),一朝波及,坐窝暂停锻练,直到安全法子到位。 这是一条死线,意味着安全优先级高于买卖进程、融资节拍,致使 IPO 窗口。 2026 年 2 月,RSP 3.0 来了。 那条死线没了。 拔帜易帜的是"前沿安全道路图、风险讲明、外部审查"——每 3 到 6 个月发布一次讲明,由里面内行草拟,寥寂评审,提交董事会。 官方说法很漂亮:"时期界限暧昧,无法预设红线,是以转向透明线路。" 翻译过来便是:从作念不到就不许动酿成了边作念边说。 更直白点:从硬刹车酿成了软着陆。 首席科学家 Jared Kaplan 在接受采访时,平直说念出了真相: "如若竞争敌手赶紧前进,咱们片面答允暂停锻练没专诚旨。" 说白了便是:别东说念主都在跑,我弗成站着。 这不是时期判断,是生计判断。 在成本眼中,暂停锻练等于暂停估值增长。关于一家估值 3800 亿好意思元、正被 OpenAI(8500 亿 +)、Google、xAI 会剿的公司,持续自我设限等于买卖自裁。 从硬刹车到透明监控,中间差的不是时期知道,是囚徒逆境下的生计本能。 
二、军事结合的底线游戏:当国度相识撞上安全红线 如若说 RSP 3.0 的疗养是主动和谐,那么军事结合的博弈,便是一场真是的底线战争。 Anthropic 曾信誓旦旦:"终止参与全自主刀兵和国内大范围监控。" 这条红线划得比刀锋还利。 2026 年 2 月 24 日,一把更敏感的刀架在了它的脖子上。 那一天,开云app官方最新版下载好意思国国防部长皮特 · 赫格塞斯迎面向 Anthropic CEO 达里奥 · 阿莫迪下达了终末通牒:淹没 Claude 模子的统共军事用途限度(包括热切性集聚手脚),不然成果恬逸。 截止时候是 2 月 27 日 17:01。 成果是什么?要么五角大楼动用《国防分娩法》强制接收模子,要么将 Anthropic 列为供应链风险企业——这个标签不时用于脑怒国度的公司,一朝贴上,Anthropic 将失去统共国防承包商的买卖考虑。 这是一说念遴荐题:毁灭安全原则,八成毁灭生计。 2 月 27 日,终末期限到来。阿莫迪未能实时与五角大楼官员敲定最终条目。截止时候刚过 14 分钟,赫格塞斯晓谕谈判突破,将 Anthropic 雅致列为供应链风险。 特朗普随后下令联邦机构住手使用 Anthropic 时期。 但故事莫得在这里终了。 3 月 9 日,Anthropic 雅致向加州联邦法院拿告状讼,指控好意思国政府的系列手脚"前所未有且不对法"。 3 月 26 日,法院作出裁定。加州北区联邦地区法院法官 Rita Lin 批准了 Anthropic 的初步禁制令苦求,叫停了国防部的封杀令。 法庭文献炫耀,Anthropic 提供了要害时期凭据:其模子在部署于军方阻滞环境后,公司本人无法良友掌握——这一凭据戳穿了五角大楼的安全风险指控。 Anthropic 赢了。 至少这一趟合。 终止全自主刀兵,宁可被制裁也不当协。这条线,是它的底线。但问题是:底线能守多久?法院的裁定仅仅初步禁制令,不是末端。五角大楼不错换一种形势再来。而 Anthropic 的客户名单里,也曾有国防部的名字——那些作战经营和谍报分析的结合,也曾在持续。 终止全自主刀兵,milansports但接受作战经营。这条线划得了了吗?照旧说,它仅仅在更大的博弈里,选了一个我方能承受的战场? 这不是 Anthropic 的遴荐,是它莫得遴荐——但它遴荐了对抗。 三、里面顾问的灯下黑:最强安全 AI,犯率先级纰缪 一个 CMS 配置诞妄,3000 份文献裸奔。 这不是黑客袭击,不是系统轻视,是最基础的权限确立问题——和 AWS S3 存储桶健忘关权限相通初级。 剑桥大学筹商员考证了显露材料的真实性:职工育儿假记载、CEO 闭门峰会细节、致使里面安全评估讲明,全部炫耀在互联网上。 最调侃的是,显露文献中有一句荒废的话: " Mythos 预示着行将到来的一波模子波澜,届时模子将以远超谛视者发愤的速率来应用轻视。" 措辞之重,不像商场部写的,更像造物主的懦弱清单。 一家正在打造史上最强集聚安全 AI 的公司,被最基础的权限配置诞妄扒了个精光。 这种灯下黑的情景在科技史上盈篇满籍:苹果与 FBI 之争、微软补丁轻视、Google 里面数据显露 …… 每一家科技巨头都犯过雷同的纰缪。 但 Anthropic 的不同在于:它的中枢价值便是安全。 当一家以安全第一立身的公司,连我方的里面文献都保护不好,它凭什么保护用户? 
四、AI 安全的囚徒逆境:当好东说念主活不下去 显露文献里那句"模子将以远超谛视者发愤的速率来应用轻视",像一把刀悬在 AI 从业者头顶。 而 Dario Amodei 在看到这份评估时,是什么心态?是欢快、懦弱,照旧两者皆有? 他终止全自主刀兵,但接受作战经营。这条线划得了了吗?照旧说,它仅仅在更大的博弈里,选了一个我方能承受的战场? Anthropic 不是独一濒临"安全 vs 买卖"悖论的公司。 OpenAI 的"宫斗"炫耀了惩办结构的脆弱:当非牟利职责和买卖利益冲突,方案权在谁手里? Google 的"慢"炫耀了官僚经由的疲塌:有最多的东说念主才和算力,却跑得最慢。 Anthropic 的"显露"炫耀了安全经由的轻视:当中枢价值是"安全",却连基础经由都作念不好。 当模子技艺越来越趋同——都用 Transformer 架构、都作念 RLHF 对皆、都卷推理技艺——决定谁能活下来的,不是谁算力最多,不是谁模子最强,而是谁的组织最扛造。 但更深的逆境在于:当安全答允在成本压力和国度相识眼前被反复修改,这个行业的安全到底还有若干的确度? RSP 3.0 的变化,国防部的终末通牒,CMS 的初级诞妄——这三件事拼在一说念,勾画出一个粗暴的图景: AI 行业正在履历一场安全叙事的歇业。 监管真空:政府莫得建立长入的红线,导致企业不敢片面踩刹车。 劣币终结良币:如若 OpenAI 和 Google 都在加快,Anthropic 的说念德洁癖反而成了竞争颓势。 公关化:安全正在从一种工程阻挡,酿成一种公关谈话。RSP 3.0 的透明线路,骨子上是在告诉成本商场:咱们还留意安全,但请不要让咱们真的停驻。 首席科学家 Jared Kaplan 的那句话,应该被刻在每一家 AI 公司的会议室墙上: "如若竞争敌手赶紧前进,咱们片面答允暂停锻练没专诚旨。" 翻译过来便是:除非统共东说念主一说念踩刹车,不然谁先停,谁先死。 这便是 AI 安全的最大悖论。在监管真空、竞争尖锐化的今天,莫得一家公司敢作念独一的好东说念主。 每个修改都有合理的证实注解。时期界限如实在暧昧,监管环境如实在变化,买卖竞争如实在加快。但问题是:当安全答允不错被修改,它照旧答允吗?当东说念主类在回路中成为免责声明,安全还专诚旨吗? 
结语:AI 期间的护城河,不是算力,是憨厚 Anthropic 的显露事件,最终会被诞生。 CMS 权限会被再行确立,显露的文献会从互联网上散失,集聚安全股会涨总结,RSP 3.0 会持续推论。 但阿谁问题会一直存在: 当一家以安全第一立身的公司,在成本压力和国度相识眼前,一次次被逼到墙角,它还能守住若干底线? Anthropic 用被制裁、被列为供应链风险、失去大量国防左券的代价,守住了终止全自主刀兵这条线。但这条线能守多久?五角大楼会换一种形势再来吗? 谜底从来不是模子更强、算力更大。 谜底是:把最基本的经由作念好,把最基础的答允守住。 这是 Anthropic 给统共这个词 AI 行业上的一课。 亦然最难的一课。因为在这一课里,Anthropic 我方,既是阿谁对抗的学生米兰体育,亦然阿谁不足格的学生。 澳洲幸运8官方网站
|