In 2017, Anthropic released the Claude Opus 4.5. As of Monday, the company has launched three models, marking its third major product release in just two months. This new flagship model has excelled in benchmark tests and offers a significantly reduced price compared to its competitors.

此次发布标志着Anthropic Games快速迭代计划的圆满结束,该计划始于9月下旬的Claude Sonnet 4.5,并于10月推出了Claude Haiku 4.5。如今,随着Opus的加入,Anthropic Games为其兄弟产品提供了一套完整的工具包:Opus用于复杂的生产工作,Sonnet用于日常任务,而Haiku则用于处理逻辑简单、与速度和效率相关的任务。
Claude Opus 4.5 得分 80.9%SWE-bench 已验证这是一项测试真实世界软件工程任务的基准测试。Opus 的表现略胜 OpenAI 的 GPT-5.1-Codex-Max(77.9%)和 Google 的 Gemini 3 Pro(76.2%)。Anthropic 表示,Opus 在其内部性能工程测试中表现优于所有人类候选人——这项为期两小时的评估旨在考察应试者在压力下的判断力。
人工智能巨头们展开了一场争夺年终榜首的竞赛。谷歌于11月18日发布了Gemini 3 Pro,并将其定位为多模态推理领域的突破性成果。OpenAI第二天就推出了GPT-5.1-Codex-Max予以回应。
几天后,Anthropic 推出了 Opus 作为回应,但它却有一个诱饵:每百万个输入代币定价 5 美元,每百万个输出代币定价 25 美元,这比之前的 Opus 模型降低了 67%。
阿里巴巴的Qwen模型为这场竞争增添了新的维度。该公司于1月下旬发布了Qwen2.5-Max,拥有超过20万亿个训练样本,并声称其在关键基准测试中优于DeepSeek-V3。9月发布的Qwen3-Max拥有超过1万亿个参数,在LMArena全球排名第三,并在各种任务中表现出色。深入研究例如,多模态推理或东方语言的工作流。虽然Qwen模型在西方市场仍然相对冷门,但它们代表了在美国芯片出口限制下,中国推动人工智能自主发展的决心。
这个定价介于 OpenAI 最新的 GPT-5.1(1.25 美元/10 美元)和 Anthropic 较早的 Opus 4.1(15 美元/75 美元)之间,但仍然比 Gemini 3 Pro 的 2 美元/12 美元要贵。此次降价表明市场压力,领先的人工智能实验室不仅在能力上展开竞争,而且在如何使前沿智能在经济上可行,从而实现大规模部署方面也展开了竞争。
克劳德的最新产品虽然比许多亚洲竞争对手的价格更高,但功能也更强大一些。因此,用户现在可以在性价比和纯粹的技术能力之间进行选择。
十四行诗 4.5发布日期:9月30日Haiku 4.5 以适中的成本带来了最先进的编码和代理功能,并且在特定任务上已经优于 Opus 4.1。更简洁的 Haiku 4.5 于 10 月 15 日发布。Opus 4.5 目前处于领先地位,能够处理最复杂的推理和耗时最长的任务。
与 Sonnet 和 GPT-5 类似,Claude Opus 4.5 采用了 Anthropic 所称的“混合推理”架构——一个同时训练用于直接推理和链式推理的单一模型。它支持 20 万个词元的上下文窗口,最多可输出 6.4 万个词元。该模型的知识截止时间为 2025 年 3 月,略早于 Sonnet 的 1 月截止时间。
开发者西蒙·威利森测试了 Opus 4.5整个周末,他都大量使用这个模型重构了自己的一个项目。该模型处理了 39 个文件中的 20 次提交,新增了 2022 行代码,删除了 1173 行代码。“这显然是一个非常棒的新模型,”Willison 写道。不过他也提到,之后回退到 Sonnet 4.5 并没有显著降低他的工作效率。
“我并不是说新模型没有比 Sonnet 4.5 有所改进——但我不能自信地说,我提出的挑战能够识别出两者在功能上的实质性差异,”他写道。
开发者、YouTube博主兼人工智能平台T3 Chat的首席执行官西奥·布朗称Claude Opus 4.5“疯狂”,并补充道:视频评测它“绝对是有史以来最好的编码模型”。
竞争格局日趋拥挤。谷歌的Gemini 3 Pro上周成为新闻焦点,在LMArena上获得了1501分的高分,并赢得了Salesforce首席执行官马克·贝尼奥夫的赞扬。贝尼奥夫表示,他将放弃ChatGPT,转而采用谷歌的模式。这一消息推动Alphabet的股价上涨超过6%。据说OpenAI 首席执行官 Sam Altman 对此感到不安,他告诉同事,Gemini 项目将造成“暂时的经济逆风”。
微软和英伟达宣布上周,Anthropic 获得了数十亿美元的投资,使其估值飙升至约 3500 亿美元。这些交易包括扩大 Azure 集成以及采用英伟达技术的基础设施,用于训练和部署 Claude 模型。
Opus 4.5 现已可通过以下方式获取:人类行为学的APIAWS Bedrock、Google Vertex AI 以及 Claude 网络和桌面应用程序。

