Anthropic 在估值达到 $3800 亿时扩大 AI 伦理对话

Anthropic，这家估值 $3800 亿的 AI 安全初创公司，正在扩大关于人工智能伦理发展的对话。在 2026 年 5 月 19 日的一篇博客文章中，该公司详细介绍了一项新计划，透露其已与宗教学者、哲学家和伦理学家合作，以塑造其 AI 系统，特别是 Claude 模型的“道德形成”。

这些对话是 Anthropic 希望创建不仅技术先进而且符合人类价值观的 AI 系统的目标的一部分。该公司已与超过 15 个跨文化和宗教团体合作，旨在将多元化视角融入其模型的治理中。公司写道：“AI 不是在真空中开发的”，强调了来自长期探讨美德、品格和伦理决策概念的社区的投入的重要性。

Claude 的宪章与伦理框架

这些努力的核心是 Claude 的宪章，这是一份在 2026 年 1 月首次更新的治理文件。它概述了指导 Anthropic AI 模型行为的原则和价值观。来自不同传统思想家的反馈不仅丰富了这份宪章，还激发了 AI 行为调控的实验。例如，Anthropic 测试了一种工具，让 Claude 在执行任务中途暂停并回顾其伦理承诺。早期结果显示不对齐行为的发生率有所降低，公司目前正在分析这种效果是源于提醒本身还是反思行为的作用。

在 Anthropic 面临机遇与审视并存的情况下，这种对伦理 AI 开发的重视显得尤为重要。4 月，该公司的年度收入运行率达到 $300 亿，得益于企业对 Claude 模型的采用。然而，它也面临监管挑战，包括因供应链风险而被美国政府列入黑名单，这一问题在博客文章发布当天在法庭上进行了辩论。

未来的参与与行业影响

除了道德形成之外，Anthropic 计划在未来几个月与法律学者、心理学家和公民机构互动。这些讨论将重点关注 AI 如何重塑社会结构，包括工作和权力动态。公司已开始解决其技术的更广泛影响，本月早些时候向金融稳定委员会简报了其 Claude Mythos 模型相关的网络安全风险。

行业观察者认为，Anthropic 在伦理 AI 方面的积极态度是一种差异化因素。尽管 OpenAI 和 Google DeepMind 等竞争对手也在安全研究上投入巨大，但 Anthropic 的“宪法 AI”框架及其愿意采纳多样化观点的做法尤为突出。然而，这种对伦理的关注并未使公司免受批评，特别是来自对其快速扩张及潜在风险感到担忧的美国政策制定者的批评。

随着公司与全球思想领袖的关系不断深化，它仍然是前沿 AI 竞赛中的关键参与者。随着其估值飙升以及企业合作关系的增长，Anthropic 的伦理治理方法可能为行业设立重要的先例。

Anthropic 在估值达到 $3800 亿时扩大 AI 伦理对话

Claude 的宪章与伦理框架

未来的参与与行业影响

Read More