开源破局:Protenix-v1如何终结AlphaFold 3的“技术垄断”
结构生物学正迎来一场静默却深刻的变革。当DeepMind的AlphaFold 3以闭源姿态重塑蛋白质结构预测的边界时,开源社区一度陷入“复刻困境”——模型要么依赖更晚的数据,要么堆砌参数量,始终难以在公平条件下证明自身能力。如今,这一僵局被彻底打破。
一场精心设计的“公平竞赛”
Protenix-v1的登场并非偶然,而是一次经过严密设计的科学验证。团队刻意将训练数据的截止时间锁定在2021年9月30日,与AlphaFold 3保持一致,同时在模型参数量和推理预算上严格对齐。这种近乎苛刻的对照实验,排除了数据优势或算力碾压带来的干扰,直指算法本身的技术含金量。
在团队构建的FoldBench-Corrected评估集上,Protenix-v1在蛋白质-蛋白质相互作用和抗体-抗原复合物预测两项关键任务中均实现领先。尤其在抗体-抗原这一公认高难度场景中,其DockQ成功率随采样数量增加持续上升,从单样本的36.01%跃升至80样本时的47.68%,展现出与AF3相似甚至更优的推理时扩展行为。
推理时扩展:从理论到开源实践的跨越
“推理时扩展”曾是AlphaFold 3的独门绝技,也是开源社区长期未能攻克的壁垒。传统开源模型往往在增加采样数量后性能趋于饱和,而Protenix-v1则呈现出近似对数线性的持续提升曲线。这意味着用户不再被动接受单一预测结果,而是拥有了一个可调节的精度-成本旋钮。对于药物发现等高风险场景,这种可控性远比绝对精度更具实际价值。
更深层的技术突破在于模板整合机制。Protenix-v1采用与AF3相似的策略,将已知结构模板信息融入预测流程,不仅提升了准确性,还显著增强了训练过程的稳定性。此外,RNA多序列比对(MSA)的集成,使得模型在蛋白质-RNA接口预测任务中表现大幅提升,消融实验证实移除该模块将直接导致性能下滑。
双轨并行:学术严谨与工业落地的平衡术
面对“复刻”与“应用”的矛盾,Protenix团队采取了极具策略性的双版本发布。标准版Protenix-v1严格对齐AF3的数据边界,服务于学术基准测试;而Protenix-v1-20250630则扩展至2025年6月的最新结构数据,在PXM-2025H2等新测试集上展现出更强的实战能力。这种设计既满足了科研社区对可复现性的需求,又为工业界提供了可直接部署的先进工具。
与此同时,PXMeter评估体系的推出填补了行业空白。针对现有基准数据覆盖不全、统计方差大等问题,团队构建了按年份划分的PXM-2024与PXM-2025测试集,并针对抗体与小分子任务设立跨年度评测集。在这些更全面的数据集上,Protenix-v1全面领先Chai-1与Boltz-1,验证了其泛化能力。
轻量化突围:为高通量场景定制“筛选器”
在追求极致精度的同时,团队并未忽视效率需求。Protenix-Mini系列通过精简架构与引入线性注意力机制,实现了推理速度的质变。其单序列推理模式绕开MSA搜索瓶颈,特别适合大规模候选序列筛选。实验显示,在蛋白质结合体设计中,Mini系列的AUC分数甚至优于部分大模型,展现出卓越的“初筛”能力。
这一设计逻辑极具前瞻性:研究人员可先用Mini版本快速过滤海量设计,再调用Protenix-v1进行精细验证,形成高效的工作流。这种“粗细结合”的策略,正是AI for Science从实验室走向产业化的关键路径。
开源生态的范式转移
Protenix-v1的意义远超单一模型的性能突破。它首次证明,在严格限制条件下,开源模型完全有能力复现甚至超越闭源系统的核心能力。更重要的是,它将“推理时扩展”这一曾被视为专有技术的能力带入公共领域,为整个社区提供了可研究、可改进、可部署的新基座。
从技术架构到发布策略,从评估标准到应用场景,Protenix-v1展现了一种全新的开源范式:不再简单模仿,而是通过系统性创新实现超越。当结构预测的“黑箱”逐渐被打开,科学发现的民主化进程才真正加速。