Copied


人工智能数据处理转向GPU:关键趋势与影响

realtime news   Jun 16, 2026 16:53 1 Min Read


人工智能驱动的数据管道处理正在经历一场剧变,GPU如今成为高价值工作负载的核心。传统上由CPU和基于SQL的系统主导的传统数据处理依赖于结构化、表格化的数据集。但今天,像视频、音频和传感器流这样的非结构化数据已成为焦点,GPU推动的推理密集型任务从这些复杂格式中提取可操作的洞察。

为什么会发生这种转变?简单来说,传统工具无法满足现代AI的需求。例如,处理数TB的视频或大规模转录客户对话仅靠SQL是不可行的。相反,多模态模型和嵌入——运行在GPU上——正在对非结构化数据进行结构化处理,从而实现跨行业的更深入分析。这种以GPU为中心的方法正在改造管道,使其更加推理密集,关键是解锁新的价值来源。

推动GPU数据处理的三大关键趋势

根据Anyscale,有三大结构性转变在推动这一过渡:

  • 从表格化到多模态数据:像视频、音频和传感器这样的非结构化格式,过去无法被程序化处理,如今已成为洞察的主要来源。
  • 从SQL到推理:尽管SQL对于结构化数据仍然必不可少,但推理已成为从非结构化格式中提取意义的核心方法。
  • 从CPU到GPU:由于推理任务的计算需求,多模态数据处理越来越依赖GPU。

来自Netflix、Nvidia和字节跳动等主要参与者的案例研究突显了这种转变。例如,Netflix使用基于GPU的管道进行多模态数据整理,而Nvidia的NeMo Curator提供了一个用于预处理文本、音频和视频的开源框架。字节跳动处理大规模视频和音频管道以支持其AI驱动的内容平台。

为什么是现在?变化的加速器

有两个力量正在加速GPU在AI数据处理中的采用。首先,数据整理越来越依赖模型驱动。随着AI模型的改进,训练数据的质量必须同步提升,需要大量依赖GPU的推理来完成嵌入生成和数据集优化等任务。其次,扩展AI系统同样依赖计算能力和数据量。合成数据生成、强化学习和推理循环等技术将GPU驱动的推理转变为创建高质量数据集的工具,从而放大了对GPU基础设施的需求。

这不仅仅是将GPU添加到传统架构中。AI工作负载的异质性——从CPU密集型的预处理到内存密集型的GPU推理——需要重新思考基础设施。像Ray和Anyscale的平台正在解决硬件利用率不足、API瓶颈和推理工作负载极端变化等挑战。

更广阔的背景:Nvidia在GPU革命中的角色

Nvidia(NASDAQ: NVDA)在这一转变中仍然居于中心地位。公司在2027财年第一季度的收入达到了816亿美元,其中数据中心部门贡献了752亿美元——截至2026年4月,同比增长了92%。这突显了GPU在AI基础设施中的关键作用。Nvidia的最新创新,例如Rubin平台和具有2.9 PB容量的GPU加速存储服务器,都是为推理密集型工作负载量身定制的。然而,地缘政治紧张局势,例如对中国H200 GPU出口的冻结,也突显了全球扩展的复杂性。

对于投资者而言,Nvidia的主导地位,加上预计到2026年将达到6500亿美元的AI数据中心支出,进一步巩固了GPU作为AI未来基础的地位。截至2026年6月16日,Nvidia的交易价格为209.31美元,其市场地位反映了其在向GPU驱动处理结构性转变中的作用。

前方的道路

数据处理向GPU驱动的转型远未结束。随着企业吸收更多的多模态数据,对可扩展的异质硬件的需求将继续增长。对于投资GPU的公司来说,AI管道的创新机会是巨大的——无论是通过多模态整理、实时分析,还是大规模安全推理。Nvidia和其他参与者都已准备好从这一转变中获益,但下一波创新可能来自这些工具在各行业中的部署方式。


Read More