Baseten 和 Harvey 通过后期训练突破推动开放法律代理

Harvey AI 与 Baseten Research 合作，通过后期优化，揭示了在法律应用中增强开放权重 AI 模型的有希望结果。研究团队以 Harvey 的法律代理基准（LAB）为基础，展示了如何通过定制化管道缩小开放权重和闭源 AI 模型在高风险法律工作中的性能差距。

LAB 是一个公共框架，用于评估 AI 在涵盖 24 个实践领域的 1200 项法律任务中的表现。结果显示，即使是顶级闭源模型也无法完成超过 10% 的端到端任务，而开放权重模型通常由于领域专业知识不足、高计算成本和治理限制而表现更差。Harvey 和 Baseten 的方法旨在通过将后期训练方法与基于 LAB 的反馈循环相结合，解决这些问题，从而提高开放权重模型的能力。

法律 AI 的关键挑战

法律 AI 应用面临独特的难题。首先，任务需要深厚的领域专业知识，包括在客户特定数据的“封闭宇宙”中检索、分析和起草复杂法律文件的能力。其次，计算成本高昂；在 LAB 上领先的模型每项任务成本约为 50 美元，延迟高达 20 分钟，这使得广泛部署变得不切实际。最后，治理至关重要，在法律领域，敏感数据需要安全且可审计的 AI 处理流程。通过在 LAB 数据集上对开放权重模型进行后期训练，Harvey 和 Baseten 试图降低成本、提高可解释性并增强任务表现。

突破性结果

研究团队使用 LAB 指标和为长时间跨度法律工作设计的定制工具，对一个拥有 270 亿参数的开放权重模型进行了后期训练。结果令人瞩目：该模型在任务完成率方面达到了某些闭源领导者的水平，显著提高了任务完成率。例如，对 Qwen3.5-9B 的强化学习训练使任务通过率提高了 20%。该模型还采用了顶级模型所表现出的高级行为策略，例如完整阅读文档，而不是依赖诸如关键词搜索这样的简单捷径。

另一项创新是引入了一种自然语言压缩工具，该工具允许模型在不丢失关键信息的情况下总结和压缩文档内容。这种方法使得 GPT-5.5 的“全通过”率（即任务每项标准均达成）提高了 3.7 倍，Claude Sonnet 4.6 提高了 2.6 倍。然而，这种压缩策略对较小的开放权重模型效果较差，这些模型需要额外的后期训练以优化其对工具的使用。

Baseten 的扩大角色

Baseten 是一家 AI 基础设施公司，在 2026 年 1 月完成 3 亿美元的 E 轮融资后估值达到 50 亿美元，在扩大 Harvey 的研究方面发挥了关键作用。作为 AI 推理基础设施领域的专家，Baseten 提供了优化 GPU 使用和管理训练与推理所需的大规模计算的工具。通过与 Benchling 合作支持生物技术研发工作流程，Baseten 在企业 AI 领域的影响力进一步凸显。

Baseten 的支持与其更广泛的战略一致，即帮助组织在不被基础设施锁定的情况下部署专有和开放模型。这是高增长 AI 推理市场中的一大差异化优势。截至 2026 年 3 月，由于企业对可扩展 AI 解决方案的需求，公司年收入据报道已达到 6 亿美元。

未来方向

Harvey 和 Baseten 的合作凸显了将开放权重模型与领域特定的后期训练和基础设施支持相结合的潜力。未来的研究将专注于减少数据压缩损失的技术，例如压缩模型的键值缓存，并改进强化学习方法以弥合长时间跨度任务中的推理差距。随着法律 AI 的发展，这些进步可能使开放权重模型成为昂贵专有系统的可行替代方案，从而普及先进的法律自动化工具的使用。

其影响超越了法律技术领域。通过在最复杂的知识领域之一中验证后期训练管道的可行性，Harvey 和 Baseten 正在为金融、医疗保健等更广泛的应用打开大门。

Baseten 和 Harvey 通过后期训练突破推动开放法律代理

法律 AI 的关键挑战

突破性结果

Baseten 的扩大角色

未来方向

Read More