Copied


Harvey AI 使用预签名URL优化Vault上传

realtime news   Jun 15, 2026 15:29 1 Min Read


Harvey AI已经全面改造了其Vault文件上传系统,采用预签名URL以优化大规模性能和可靠性。随着法律团队越来越依赖Vault进行AI驱动的文件管理,周上传量从2026年1月的220万激增至5月的1500万。这次升级正值Vault活跃文件数突破2亿,仅两个月内实现了数量翻倍。

关键变化是什么?放弃服务器代理上传的方式。此前,文件需要通过Harvey的后端传输到Azure Blob Storage,这在法律团队上传数千大批量文件时造成了瓶颈。通过采用预签名URL,文件数据现在直接从浏览器传输到Azure,而后端只负责元数据和协调。这一转变显著减少了系统负担,提高了性能,并增强了企业场景的可扩展性。

什么是预签名URL?

预签名URL是临时的、加密签名的链接,提供对对象存储系统如Azure Blob Storage或Amazon S3的限时访问,用于直接上传或下载文件。这种方法消除了应用服务器直接处理文件数据的需求,从而降低延迟并减少后端资源使用。

Harvey AI实现预签名URL的过程分为三步:

  • 初始化:后端验证用户权限,并为浏览器生成短期有效的上传URL。
  • 上传:文件通过URL直接上传到Azure Blob Storage,完全绕过后端。
  • 完成:后端验证上传完成情况并启动下游文档处理。

这一架构符合其他企业应用中的最佳实践,改善了性能和可靠性。

实际使用中的性能提升

采用预签名URL为Vault上传带来了可量化的改善。上传的平均延迟降低了13%(从6.7秒降至5.9秒),而高百分位延迟(P99)改善了27%(从1分25秒降至1分2秒)。对于大工作负载,例如1000个文件的批量上传,平均上传持续时间减少了57%,从2分35秒降至仅1分6秒。

即使是大文件上传也有所提升:平均持续时间减少了35%,从1分17秒改善到50秒。结果证明了该架构的可扩展性,特别是在像法律公司这样管理大量文档档案的高容量企业环境中。

面向企业的可靠性

除了速度之外,这些变化还解决了企业部署中的可靠性挑战。预签名URL最大限度地减少了对后端的依赖,降低了上传过程中因服务器重启或超时引发风险的可能性。然而,Harvey还实施了备用机制,以应对可能阻止直接到存储上传的限制性公司网络,如VPN或防火墙。在这种情况下,系统将无缝切换回传统的服务器代理路径。

在后端,架构现在使用批量操作处理诸如重复文件处理和数据库事务等任务,即使是成千上万的文件同时上传也能确保平稳协调。同时,失败的上传会被分类并智能重试,防止孤立错误影响大批量上传的整体进程。

为什么重要

对于法律团队来说,重新设计的系统意味着更快的上传速度、更少的错误以及在管理关键文档时更可预测的体验。随着Vault扩展以支持更大的工作负载,预签名URL方法确保了系统保持高效且具有弹性。

Harvey AI并非唯一采用该策略的组织。预签名URL是一种经过验证的大规模上传解决方案,广泛应用于如Amazon S3和Azure Blob Storage等系统。它们通过将数据传输从后端卸载到存储提供商,成为处理高数据量的企业应用中不可或缺的工具。

展望未来,Harvey AI的改进使Vault能够应对企业文件管理中的下一波增长,尤其是在法律和金融等行业对AI驱动工具的采用持续扩展的情况下。


Read More