Anthropic“光与影”双重奏：高喊AI风险的同时推顶尖模型

持续“被神话”的Anthropic最新模型终于掀开面纱。

北京时间6月10日，Anthropic推出Claude Fable 5与仅限特定机构使用的Claude Mythos 5，这对“神话”级孪生模型共享同一底层架构（内部代号Capybara，水豚），标志着Anthropic正式跨越上一代Opus级天花板，实现官方所称的阶跃式提升。

这不是该系列模型的首次面世，此前，相关模型经历内部泄露、限量预览版发布，官方确认后通过定向授信的方式强调自身代码高阶与安全。

从轻量级Haiku（俳句）、均衡通用级Sonnet（十四行诗）、上一版旗舰模型Opus（艺术巨著），再到此次的Mythos（神话），Anthropic以文学神话命名模型，散发浪漫主义人文气息，同时在商业落地、组织执行力和安全权衡上展现务实锋芒。

成立五年，Anthropic从0做到超越OpenAI的470亿美元ARR（年化收入）与9650亿美元估值规模，核心因素是创始团队对Coding（编程）赛道的精准定位，对垂直赛道商业化变现的聚焦投入。

但同时，Anthropic在安全人设、夸大恐慌、地缘政治站位等方面也面临外界质疑。公司联创、CEO Dario Amodei（达里奥・阿莫迪）既相信AI将带来正面变革，也警告其潜在风险。他反复强调“光与影”两面并存，一面率领前OpenAI成员带着对AI风险的警惕创办公司，一面全力冲刺最强模型，并以“只有掌握最强能力才有安全话语权”为逻辑自洽。

在这场头部厂商模型交替领先、尚未有明确胜者的早期赛道中，Anthropic 依托安全理念与Coding领域的优势暂时领跑，却也身处全行业的紧盯与追赶中。

新模型从泄露到拆分

Mythos系列模型的面世充满戏剧性。

2026年3月26日，一场内部配置失误导致草案文件全网泄露，行业首次确认存在高于Opus的全新顶级梯队Capybara。Anthropic迅速确认并在4月7日推出Mythos Preview，但仅定向开放给网安机构。

6月10日，模型迭代至 Mythos 5，拆分为Fable 5与Mythos 5，两者定价分别为10美元/百万输入Token和50美元/百万输出Token，低于前代Mythos Preview版本。

争议随之而来。开发者群体发现，涉及网络安全等内容查询会自动回落至Opus 4.8，导致部分良性请求被拦截，研究者抱怨前沿任务受限，Mythos 5的“解锁”版本虽强大，却仅限信任伙伴，凸显 Anthropic “安全第一”的双刃剑——既是差异化护城河，也招致“过度谨慎”的批评。

但这种矛盾持续贯彻Anthropic的发展脉络，甚至成为其独树一帜的企业特点。

Anthropic创始团队诞生于2019-2021年OpenAI内部商业化与AI安全路线的对立。2020年末，Dario带领十余名OpenAI核心技术与安全团队成员集体离职。2021年2月，Anthropic成立，并以AI安全为使命。

彼时，公司初始融资规模仅1.24 亿美元，估值41亿美元；2023年Claude系列模型落地后，逐渐吸引谷歌、亚马逊等厂商注资。伴随模型产品从通用对话模型延伸至垂直专业工具，Anthropic逐渐在编程赛道形成优势，企业付费意愿、客单价大幅提升。

据官方披露，公司在今年2月完成G轮融资以来，全球企业客户的采用率持续增长，年化收入突破470亿美元，该数字在年初时仅为140亿美元。

如今，模型安全与性能边界成为Anthropic发展的双刃剑，公司既需证明持续更新的模型技术路线站在第一梯队，同时不能背离安全立足点。

Dario表示，Claude Mythos Preview是一个特别大的跳跃。团队没有专门训练它去聚焦网络安全，而是侧重代码。更强大的模型会从团队中来，也会从其他公司来，Anthropic需要一个应对方案。

信息安全研究员关傲男（Aonan Guan）对第一财经记者表示，Mythos官⽅报告与实际能⼒表现确实与Opus之间存在明显代差，⼀些Mythos能发现的问题，上⼀代公开⾼级模型如Opus，即便多次迭代也很难找到。如果说Opus可以达到⾼级安全研究员⽔平，那么Mythos可以超过绝⼤多数⼈类专家，且把漏洞挖掘⻔槛降下来了。⼀个不懂安全的⼈，可能只⽤⼀句很简单的话，就能让模型在⼀个机密核⼼系统⾥找到漏洞。Mythos 和GPT-5.5这⼀代模型已经形成了⽹络安全能⼒的分⽔岭。

但同时，关傲男称，Anthropic模型能⼒需要通过真实⽤户、真实任务和真实企业场景来验证，也需要商业化来⽀撑继续训练的成本。所以Anthropic选择开放经过切分与限制的版本，将Coding与⽣产能⼒释放，同时尽量压住⽹络安全、攻击⾃动化等⾼⻛险能⼒。⽬前Anthropic和OpenAI模型对于⽹络安全的访问上有着多层审核和控制除了特定的合作伙伴，即便是对于安全研究员也未开放全部能⼒。

出走团队从0到1

Anthropic的成绩源于多重因素交织。

在行业人士看来，Anthropic早期很像扁平化、无层级、决策链路极短的小作坊，员工多来自OpenAI早期团队，彼此深度信任，技术负责人兼管理者，确保决策统一。Dario强调使命感，即使在高速扩张中也投入大量精力维系。招聘偏好“好奇、承认不知道、跨领域”（物理、哲学等），形成高技术密度低ego的团队。这种文化支撑了公司的快速迭代与人才保留。

Anthropic并非第一天就聚焦Coding。创新奇智首席科学家、北京人工智能高级工程师张发恩认为，Anthropic真正的分水岭是在Claude 3.5到3.7阶段打下的基础，在Claude 4系列到如今的Mythos模型阶段，他们在长逻辑推理与系统级安全上形成了比较显著的局部优势。这种优势与其说是全面超越，不如说是战略聚焦带来的差异化领先。

而OpenAI过去一两年的精力分散在了多模态与消费级产品上，Anthropic克制地将资源集中砸向复杂逻辑推理。张发恩认为，双方在各自擅长领域做到了极致。在后端开发等重度工程领域，OpenAI的GPT-5.4/5.5配合新版Codex依然极其强大，底盘非常稳；Anthropic的Mythos则是在Agentic的自主执行力上让人眼前一亮。

关傲男观察到，2024年6⽉，AnthropicClaude 3.5 Sonnet 发布后，ClaudeCoding任务上的优势开始被开发者感知到，Cursor这类开发者⼯具⾥的很多⽤户也开始把Sonnet当成⾸选模型。2025年2⽉，Claude 3.7 Sonnet和Claude Code发布，Anthropic在Coding领域的优势正式被产品化、显性化。

但Coding是⼀个很特殊的场景，关傲男认为，Coding既有明确的输⼊输出，也有⾮常强的可验证性。模型写完代码之后，可以跑测试、看报错、改代码、再跑测试，这类模型反馈数据可以很快地应⽤到下⼀代模型开发和强化学习后训练中。

因此整体来看，关傲男认为，Anthropic 的优势不是单纯来⾃某⼀个模型参数更强，⽽是来⾃它更早地将Claude放进真实⼯程流程⾥，让模型通过真实⽤户、代码库和反馈不断迭代。谁能更早获得这些反馈，谁的模型在这个场景⾥就会越滚越快。

技术切入点的精准布局之外，组织文化也是Anthropic能够在Coding场景率先跑出来的重要原因。Catherine Wu是 Anthropic Claude Code的产品经理，她在访谈中提到，团队为移除所有阻碍因素，将很多产品功能周期从过去的6个⽉压缩到1个⽉甚⾄更短，整个公司围绕AI-native产品重新组织了研发、产品、市场和⽂档流程。

关傲男称，Anthropic内部将Claude模型当成组织效率、⽤户增⻓和产品商业化的共同⼊⼝：⼀开始是模型在代码⽚段、函数和⽅法级别表现很好，之后Claude Code让模型进⼊完整项⽬，可以读⽂件、改⽂件、跑命令、看测试结果，再之后，模型开始承担端到端任务，甚⾄在公司内部参与代码审查、修复bug和实验流程。这个过程中，Anthropic⾃身不断演进。这些特质中，模型架构、强化学习⽅法、后训练⽅法、产品界⾯都可以学，但真实⽤户反馈和⼯程⼯作流数据很难短时间补⻬，这也是为什么Gemini等厂商即使基础能⼒很强，在CodingAgent场景仍很难快速追上的原因。

张发恩也认为，Anthropic由一群极度关注“AI安全与可解释性”的研究员创立，这种严谨的极客基因，很契合代码生成这种容错率极低的领域。他们确实是在发展中逐渐证实了“代码是检验大模型逻辑推理最好的试金石”。

交替领先趋势未变

Anthropic的优势并不意味着他们在Coding领域不可战胜。

张发恩表示，实测中发现，OpenAI的GPT-5.5和对应的Codex在后端编程、复杂架构重构上的表现依然优秀，甚至在部分工程体验上优于Opus 4系列配合Claude Code。

他对记者表示，此次Mythos 5和Fable 5的发布确实在长线复杂任务和网络攻防上与其他竞品拉开了一定身位，但并未完全形成代际差。模型能力的较量目前更像是在不同维度上的交错。

如商业化层面，市场呈现了明显的分化：OpenAI依靠泛用API、庞大的开发者生态以及在常规代码上的强势体验占据着基本盘；Anthropic则切入了高客单价的硬核安全与特殊研发市场。Mythos系列定价偏高，但在特定攻防场景的ROI可观，所以大企业愿意买单。短期内，张发恩认为，这种错位竞争会持续，双方各自的数据飞轮和生态壁垒都不容易被轻易打破。

关傲男表示，顶级模型之间仍将是交替领先的竞争状态，并未出现真正不可追赶的代差。Anthropic在Coding、Agent和部分开放benchmark上确实领先OpenAI，但⼆者之间并未产生代际差距。整体来看Gemini、X.ai 以及国内模型，差距会更明显⼀些，尤其在CodingAgent与复杂⼯程任务上，Anthropic和OpenAI这类顶级⼚商已进⼊真实⽤户反馈驱动后训练阶段。

得益于Coding任务有明确反馈，能跑测试、看报错、验证结果，所以⾮常适合强化学习和后训练。⽽很多其他⼚商还停留在公开数据集追赶阶段。因此，关傲男判断，Anthropic的优势可以保持⼀段时间，但不是天然永久，能否保持优势取决于：Claude Code 真实使⽤数据能否继续转化成模型能⼒；Google等竞品公司能否在Agent⼯作流上建⽴同样强的数据反馈。

沂景资本董事总经理谢思远并不认为Anthropic是目前整个行业最领先的公司，但是目前最领先的大模型创业公司。他对记者解释称，谷歌、微软等大型科技公司的内部闭源模型同样很强，甚至在部分能力上可能已超过外界能够接触到的创业公司产品，只是这些能力未必会第一时间公开释放。

且长期来看，谢思远认为竞争最终会围绕云生态展开。每一家大型云厂商都会拥有自己的模型体系，同时扶持外部生态模型公司，如微软云绑定OpenAI、亚马逊深度支持Anthropic、谷歌发展自己的Gemini体系等。Anthropic未来能否持续领先，关键不在于单次模型发布是否第一，而在于它能否持续获得云生态、资本和人才的支持。从目前来看，它仍然处于非常有利的位置，但这种优势并不是不可挑战的。

2023年，Anthropic将营收从0做到1亿美元，Dario预估如果2026年保持增速，公司有可能实现盈利，在上述变量未发生的前提下。