NVIDIA BioNeMo 推出支持 LoRA 微调的生物技术模型

NVIDIA 推出了其 BioNeMo Recipes，这是一套使用低秩适配（LoRA）微调亿参数生物基础模型的工具。通过利用 LoRA，研究人员可以用最少的计算资源将庞大的预训练模型（如 ESM2（蛋白质）和 Evo2（DNA））适应于特定任务。这一创新可能显著加速计算生物学的进展，使高性能 AI 模型在单个工作站 GPU 上也能使用。

生物基础模型相当于生命科学领域的瑞士军刀。这些模型经过 DNA、RNA 或蛋白质序列的大规模数据集预训练，能够捕捉生物学的统计“语言”。它们已被用于蛋白质结构预测、变异效应分析和功能注释等任务。然而，这些通常拥有数十亿参数的模型的微调，传统上需要昂贵的硬件和巨大的计算资源。LoRA 改变了这种局面。

LoRA 如何工作

LoRA 通过冻结原始模型的参数并引入小型、可训练的适配器矩阵，避免了传统微调所需的高资源消耗。这种方法将可训练的参数数量减少到完整模型的 1%，从而在单个 GPU 上实现高效微调，同时保持与完整微调相当的性能。NVIDIA 将 LoRA 集成到其 BioNeMo Recipes 中，通过基于 PyTorch 和 Hugging Face 等熟悉工具的现成工作流程，使这一过程更加易于使用。

例如，NVIDIA 使用 LoRA 对 ESM2-3B 蛋白质模型进行了次级结构预测任务的微调——为蛋白质序列中的氨基酸分配结构标签。通过 LoRA，该团队在不到一小时内使用 NVIDIA RTX 6000 GPU 实现了最先进的准确率（Q3 任务为 84.8%，Q8 任务为 74.3%）。

案例研究：使用 Evo2 进行 DNA 剪接位点分类

在另一个例子中，NVIDIA 将 LoRA 应用于 Evo2-1B 模型，以进行 DNA 剪接位点分类——这一任务对理解 RNA 剪接机制至关重要。通过 LoRA 微调，该模型的分类准确率提高到 96.6%，而仅训练分类头的基线准确率仅为 52.3%。同样，这一成果是在单个 GPU 上实现的，突出了这些工作流程的可及性。

对计算生物学的意义

在普通硬件上微调亿参数模型的能力，使得先进工具在计算生物学领域的使用更加民主化。除了蛋白质结构预测和 DNA 分析外，这些技术还可能加速药物发现、基因编辑和合成生物学等应用。例如，OpenFold Consortium 的最近扩展和 Zuckerberg Biohub 的 AI 驱动蛋白质模型，突显了生物技术领域对可适应、高性能 AI 系统的日益增长的需求。

然而，挑战仍然存在。正如最近的分析所指出的那样，将这些模型推广到分布外的生物场景（如预测病毒突变）需要在数据收集和验证方面进行进一步创新。NVIDIA 的 BioNeMo Recipes 是向前迈出的重要一步，但更广泛的生态系统必须继续解决可扩展性和准确性问题，以释放生物基础模型的全部潜力。

让生物学更加可编程

NVIDIA 的 BioNeMo Recipes 标志着生物学向更加可编程和可预测方向的转变，这与 OpenAI 的 GPT-Rosalind 和 IBM 的多模态生物医学模型等行业趋势一致。通过整合 LoRA、Transformer Engine 优化和序列打包技术，NVIDIA 实现了在单个 GPU 上微调大规模生物模型的实用性，同时不牺牲性能。对于计算生物学家来说，这是一场革命性的改变。

研究人员可以访问完整的 BioNeMo Recipes，并通过访问 NVIDIA 的官方 GitHub 仓库开始微调工作。

NVIDIA BioNeMo 推出支持 LoRA 微调的生物技术模型

LoRA 如何工作

案例研究：使用 Evo2 进行 DNA 剪接位点分类

对计算生物学的意义

让生物学更加可编程

Read More