Anthropic发布Claude Opus 4.8，提升AI性能

Anthropic于2026年5月28日正式发布了Claude Opus 4.8，这是Opus系列AI平台的最新版本。定位为Opus 4.7的改良升级版，此次发布旨在改进判断力、可靠性和在编码、财务分析以及长时间知识工作等任务中的表现。定价保持不变，标准使用每百万输入Token成本为5美元，每百万输出Token成本为25美元，而快速推理模式的成本现在降低了三倍。

Opus 4.8的最显著改进是其在代码任务中自我审查能力的提升。早期测试者报告称，该模型在识别自生成代码中的缺陷方面比之前减少了四倍的遗漏。此外，该模型引入了“动态工作流”功能，使其能够自主处理大规模多步骤项目。这一功能对从事复杂工程任务（例如大规模代码库迁移）的企业用户尤为重要。

Opus 4.8基于Anthropic对Opus系列的快速迭代周期进行开发。从2025年末推出的Opus 4.5（强调内存和对话连续性）开始，该系列经过了Opus 4.6的漏洞检测能力和Opus 4.7的扩展上下文处理及自适应推理能力的进化。最新版本进一步深化了这些能力，专注于持续性能和用户对齐行为。

实际基准测试突出了Opus 4.8的多样化优势。它在Anthropic的法律代理基准测试中取得了有史以来的最高分，证明在可靠性和法律工作流的引用精确性方面有显著提升。在数据密集型任务（如财务文档分析）中，该模型比Opus 4.7在Token效率和检索准确性方面表现更佳。此外，它在Online-Mind2Web基准测试中取得了84%的得分，超越了其前代版本以及竞争对手如GPT-5.5在浏览器代理任务中的一致性表现。

另一个关键升级是模型的“努力控制”功能，允许用户根据任务调整AI的强度。较高的努力水平会带来更深入、更周到的响应，而较低的设置则优先考虑速度和Token效率。快速模式运行速度为2.5倍，现在每百万输入Token仅需10美元，使得需要快速结果的用户更容易负担。

在此版本中，Anthropic还强调了对齐和安全性的改进。公司对齐团队指出，Opus 4.8表现出更强的亲社会特性，包括更好地支持用户自主性，并减少不对齐行为（如欺骗或误用）的可能性。这些更新与Anthropic更广泛的负责任AI部署推进目标一致，例如其Mythos项目，专注于具有增强网络安全保障的高级智能模型。

Opus 4.8现已立即上线，可在Claude Code中用于企业级项目，并为开发者提供API访问。公司暗示更高级的模型即将推出，Mythos系列系统预计将在数周内亮相。目前，Claude Opus 4.8为寻求可靠且高性价比AI解决方案的组织提供了一个重要的进步。

Anthropic发布Claude Opus 4.8，提升AI性能

Read More