Anthropic发布Claude Opus 4.8,提升AI性能
Anthropic于2026年5月28日正式发布了Claude Opus 4.8,这是Opus系列AI平台的最新版本。定位为Opus 4.7的改良升级版,此次发布旨在改进判断力、可靠性和在编码、财务分析以及长时间知识工作等任务中的表现。定价保持不变,标准使用每百万输入Token成本为5美元,每百万输出Token成本为25美元,而快速推理模式的成本现在降低了三倍。
Opus 4.8的最显著改进是其在代码任务中自我审查能力的提升。早期测试者报告称,该模型在识别自生成代码中的缺陷方面比之前减少了四倍的遗漏。此外,该模型引入了“动态工作流”功能,使其能够自主处理大规模多步骤项目。这一功能对从事复杂工程任务(例如大规模代码库迁移)的企业用户尤为重要。
Opus 4.8基于Anthropic对Opus系列的快速迭代周期进行开发。从2025年末推出的Opus 4.5(强调内存和对话连续性)开始,该系列经过了Opus 4.6的漏洞检测能力和Opus 4.7的扩展上下文处理及自适应推理能力的进化。最新版本进一步深化了这些能力,专注于持续性能和用户对齐行为。
实际基准测试突出了Opus 4.8的多样化优势。它在Anthropic的法律代理基准测试中取得了有史以来的最高分,证明在可靠性和法律工作流的引用精确性方面有显著提升。在数据密集型任务(如财务文档分析)中,该模型比Opus 4.7在Token效率和检索准确性方面表现更佳。此外,它在Online-Mind2Web基准测试中取得了84%的得分,超越了其前代版本以及竞争对手如GPT-5.5在浏览器代理任务中的一致性表现。
另一个关键升级是模型的“努力控制”功能,允许用户根据任务调整AI的强度。较高的努力水平会带来更深入、更周到的响应,而较低的设置则优先考虑速度和Token效率。快速模式运行速度为2.5倍,现在每百万输入Token仅需10美元,使得需要快速结果的用户更容易负担。
在此版本中,Anthropic还强调了对齐和安全性的改进。公司对齐团队指出,Opus 4.8表现出更强的亲社会特性,包括更好地支持用户自主性,并减少不对齐行为(如欺骗或误用)的可能性。这些更新与Anthropic更广泛的负责任AI部署推进目标一致,例如其Mythos项目,专注于具有增强网络安全保障的高级智能模型。
Opus 4.8现已立即上线,可在Claude Code中用于企业级项目,并为开发者提供API访问。公司暗示更高级的模型即将推出,Mythos系列系统预计将在数周内亮相。目前,Claude Opus 4.8为寻求可靠且高性价比AI解决方案的组织提供了一个重要的进步。