提升网络速度
雪藏背后:Anthropic的技术、商业与伦理困境
一向自诩为“道德标杆”的Anthropic,上周发布其最新模型Claude Mythos Preview后,罕见地宣布不向公众开放,理由是该模型的网络攻击能力已构成“前所未有的网络安全风险”。
然而,英国人工智能安全研究所(AISI)近期发布的一份核心评测报告彻底重塑了人们对AI杀伤力的理解。
![]()
这份报告揭露了一个令人恐惧的事实:前沿大模型已经实现了从智能助手到数字“佣兵”的进化。
相比Claude Code和Opus,这款名为Mythos的模型最大的区别在于没有公开发布。
原因竟然是Anthropic评估该模型的能力过强,一旦被滥用风险无法估量。
4月11日,美国副总统和财政部部长召集了Anthropic、xAI、Google、OpenAI、微软等世界顶级AI公司的CEO,专门对以Mythos为首的AI模型的安全性及网络攻击应对策略进行讨论。
目前,Anthropic仅仅向Apple、Google、微软、英伟达等少数企业定向开放了该模型,并重点评估防范黑客滥用的机制。
在古希腊语中,Mythos往往代指神话、故事等虚构叙事,代表这款模型的能力上限已经远超人们的想象。
然而,真正支持Mythos达到如此水平的,是它在古希腊语中与这个词对立的Logos(理性思辨)上做到了极致。
为了测试AI的能力上限,AISI构建了一个名为“The Last Ones(TLO)”的高仿真企业网络靶场。
这与此前网络安全技术人员之间进行技术竞技的“夺旗赛”有所不同,TLO是一个包含32步的企业网络攻击场景,目标则是从受保护的内部数据库中窃取敏感数据。
换句话说,这是一场包含侦察、凭证窃取、NTLM中继攻击直到最终数据窃取的32步超长周期渗透测试。
对于这个测试,即使是人类顶级安全专家,完成一整套流程通常也需要耗费14-20小时的连续高强度工作。
但在长达18个月的纵向跟踪中,AISI看到了一条令人不寒而栗的能力进化曲线年,独领风骚的GPT-4o在这个靶场测试中平均只能完成1.7步,证明它对复杂的网络拓扑结构和密码学瓶颈束手无策,迅速陷入了停滞。
2026年2月,编程之王Claude Opus 4.6出场,在1亿token的推理算力预算下,一举拿下22步的高光成绩。
![]()
在对Mythos能力发生跨越式进步的惊叹之余,它也揭示了现阶段AI演进方向的底层逻辑:
规模化定律应该加上一个定语“Inference”,模型能力提升不能仅仅依靠预训练阶段的知识灌输,
只要给予足够的token预算,它就能在漫长的攻击序列中链式结合异构能力。
在工业控制系统(ICS)靶场测试“Cooling Tower”中,甚至有多个模型跳出了人类预设的Web提权常规路径,直接凭借对未知协议网络流量的暴力嗅探和模糊测试,硬生生砸开了一台物理设备的控制通道。
以Mythos为首的前沿模型,不仅对全球网络安全防御体系造成了降维打击,也证明了它们在复杂物理映射世界中已经具备极强的自主执行力。
这就意味着,几个月后,你的电脑、你的电动汽车甚至是你的智能马桶都可能不再安全。
然而,能使用Mythos模型的公司都屈指可数,从代码层面上解构技术特点自然是无稽之谈。
不过,就在Anthropic对其模型架构讳莫如深的同时,一份异常的基准测试成绩却引起了技术社区关于“幽灵架构”的热烈讨论。
目前用户能看到的关于Mythos的相关信息,就只有Anthropic官方发布的系统卡片。
敏锐的研究人员在其中发现了一个不太寻常的数据异常:在考察模型应对复杂图结构广度优先搜索能力的GraphWalks BFS测试中,
而两个月前发布的Opus 4.6只有38.7%,GPT-5.4更是只有21.4%。目前AI行业模型性能层面上的提升速度已经显著放缓,这种在单一纯逻辑推力维度上的断崖式领先,绝非标准Transformer架构通过常规思维链输出大量文本所能达到的效果。
前Meta、现OpenAI的工程师Chris Hayduk直接捅破了这层窗户纸,并将矛头指向了一种创新的底层架构设计:
![]()
这个名字,不可避免地让人联想到字节跳动Seed团队在去年10月发布的一篇名为《Scaling Latent Reasoning via Looped Language Models》的论文。
![]()
字节的研究团队提到了一个开创性的核心思想:彻底抛弃在外部生成大量文字让模型思考的模式,
在SWE-Bench测试中,Mythos消耗的token生成数量只有前代旗舰模型Opus 4.6的五分之一,但得出最终答案的推理耗时反而更长。
不过,若是像循环语言模型一样,把海量的计算成本隐藏在不输出token的内部循环之中,这一看似矛盾的现象就能完美地迎刃而解。
尽管模型性能存在显著差距,但Anthropic面对外界质疑集体噤声仍然略显欲盖弥彰。
尽管国内外AI大模型的权力格局已经基本确定,但这种隐秘的技术路线借用早已是行业中不言而喻的“秘密”。
值此之际,试问国际顶尖AI企业又有什么立场联手国内AI企业的蒸馏行为呢?
在Mythos体现出了神明一般的能力的同时,支撑其能力的算力成本还是一笔糊涂账。
近期,一位名为seanGSISG的开发者在GitHub上发布了一份数据分析报告,用接近12万次Claude Code API调用日志将Anthropic的暗箱操作公开于众:
![]()
从2月1日到3月5日,系统稳定运行在1小时缓存的档位,而当时的缓存资源浪费率只有1.1%。
然而在3月6日之后,5分钟级别的缓存刷新简直就像是一只吸血鬼,瞬间掏空了开发者的钱包。
TTL变短意味着庞大的上下文背景信息每隔5分钟就会失效,系统就必须不断重新写入并创建缓存(KV Cache)。
最倒霉的反而是那些为了追求机制生产力而购买Pro Max订阅服务、付费意愿最强的用户,他们付款最多,使用最频繁,额度耗尽也最快。
这种容易被忽视的暗箱操作,反应的仍然是顶尖AI企业面对长上下文计算压力时不得不采取的商业妥协。
聚光灯下Mythos展现出了迄今为止人工智能的最高水平,而阴暗的角落中Anthropic却要克扣开发者的每一分钟缓存。
从上个月国产模型纷纷宣布涨价来看,算力问题短期内不可能被根本性解决,而Anthropic的这种行为势必会蔓延到全球AI企业。
Cloudflare这家为全球互联网提供底层基础设施服务的公司,恐怕全球的网友们都不会陌生。
而2026年4月初Cloudflare发布的一份最新数据,无情地揭示了Anthropic主导的一场数据榨取的真相。
传统的互联网生态中,网站需要流量才能生存,流量(点击量)就是获取信息的成本。
Cloudflare通过追踪AI的爬虫抓取网站内容的次数,与这些平台为原创网站带来的流量回流进行对比,并定义了一个叫做“抓取回流比(crawl-to-refer ratio)”的指标,以此衡量AI的行为给网站造成的影响。
而在这份榜单上,始终把“人类利益和负责任AI”挂在嘴边的Anthropic,凭借着
![]()
OpenAI的抓取回流比是993.3:1,还不到Anthropic的八分之一。
在AI出现前的十几年,互联网的生态运转一直建立在一个心照不宣的隐形契约之上:
创作者允许搜索引擎免费爬取和索引自己的原创心血,作为交换,他们将获得可用于变现的真实用户流量。
然而,贪婪的生成式AI不仅破坏了这份契约,还试图从中榨取尽可能多的价值。
它们在训练阶段将互联网上仅存的人类智慧结晶嚼碎并消化,在推理阶段把知识以最终答案的形式喂给用户,彻底掐断了用户点击溯源的路径。
而这些极其高频的爬虫活动,从未将网站拥有者的服务器宕机风险和带宽成本纳入考量。
但这种极具割裂感与讽刺的事实,在商业利益面前不仅不会被,反而会被全球AI企业所效仿。

