从几何对齐到一维压缩:SEINT如何重塑高维结构数据的距离度量

· 0 次浏览 ·来源: AI导航站
在3D点云、分子构型等复杂结构数据的距离度量中,如何同时满足旋转平移不变性、严格的数学度量性质与高效计算,一直是困扰研究者的核心难题。传统方法要么依赖高代价的几何对齐,要么牺牲理论保证换取速度。中国人民大学团队提出的SEINT方法,通过创新性地将高维结构信息压缩为无需训练的一维表征,巧妙结合最优传输与距离卷积,实现了SE(p)不变性、度量性与计算效率的三重突破。实验证明,SEINT在保持100%分类鲁棒性的同时,速度提升达两个数量级,并在3D分子生成任务中推动模型达到SOTA水平,为跨空间、高维稳定的结构数据分析提供了全新范式。

在人工智能与计算科学的前沿交叉地带,衡量复杂结构之间的距离始终是一项基础性挑战。无论是3D点云识别、高分子构型分析,还是分子生成模型的几何约束,研究者都面临一个共同难题:如何定义一种既对旋转和平移保持不变、又具备严格数学度量性质、还能高效计算的分布距离?

传统方法的困境:理论完备性与计算效率难以兼得

当前主流的最优传输(OT)方法在处理结构性数据时,往往陷入两难境地。内蕴式方法如GW(Gromov-Wasserstein)虽然能保持几何关系并满足度量性质,但需要显式求解复杂的几何对齐问题,计算复杂度高达多项式级别,难以应用于大规模场景。而外蕴式或表征式方法虽计算更快,却常因依赖特定坐标系或缺乏理论保障,无法严格满足SE(p)不变性,导致在旋转扰动下性能急剧下降。更棘手的是,多数方法局限于同维度空间内的比较,难以实现跨空间(如2D投影与3D模型)的分布对齐,极大限制了其在真实世界中的应用广度。

SEINT的突破:一维压缩与最优传输的巧妙融合

针对上述痛点,研究团队提出了一种名为SEINT的全新度量框架。其核心思想极具启发性:将高维空间中的复杂结构信息,通过无需训练的数学构造,压缩为一条一维“半径轴”上的标量表征。这一过程并非简单的统计降维,而是通过两种创新表征——PTD(Polar Transport Discrepancy)与DcPTD(Distance-convoluted PTD)——实现几何结构的保真编码。

PTD首先提取样本点的范数信息,映射到一维参考轴上,并通过求解与参考分布的一维最优传输,为每个点赋予一个“搬运距离”标量。为进一步捕捉点间几何关系,DcPTD引入空间距离矩阵进行加权卷积,使一维表征能显式反映原始结构的拓扑特征。这一设计确保了两个关键性质:一是等距一致性,即对任意刚体变换保持不变;二是维度无关性,无论输入空间维度多高,输出始终是一维标量,天然支持跨空间比较。

在此基础上,SEINT通过在一组候选参考分布上取“最不利”选择,构建最终距离。这种“对抗式”参考选择策略不仅消除了对单一参考的依赖,更从理论上保证了其作为度量的严格性——满足非负性、对称性与三角不等式。

效率与鲁棒性的双重跃升

SEINT的计算优势尤为突出。由于核心运算仅涉及一维最优传输与距离卷积,其复杂度在理想条件下可达近似线性水平。在ModelNet40-SE(3)点云分类实验中,面对随机旋转与平移干扰,SEINT保持了100%的分类准确率,而计算速度比同类不变性方法快50至300倍。相比之下,缺乏不变性的SW等方法准确率骤降至60%以下。多维缩放可视化进一步揭示,SEINT能完美保留数据的闭环拓扑结构,而其他方法则在旋转扰动下结构崩塌。

更令人振奋的是其在跨空间与高维场景下的表现。在Horse-Gallop实验中,SEINT成功通过2D投影与3D参考的对比,精准捕捉马匹奔跑的步态周期,展现出超越EGW的几何感知力。在高维混合高斯测试中,它有效克服了“维度灾难”,距离度量随差异增大平滑单调增长,数值稳定性显著优于传统OT方法。

从理论到实践:推动生成模型迈向几何精确

SEINT的价值不仅限于理论创新,更在实际应用中展现出强大潜力。当作为正则化项集成到EDM与UniGEM等主流扩散生成模型中时,SEINT显著提升了生成分子的原子与分子稳定性。在QM9与GEOM-Drugs数据集上,UniGEM模型借助SEINT在关键指标上达到SOTA性能,证明其能有效引导模型学习正确的几何结构,减少无效或不稳定构型的生成。

这一成果标志着结构数据度量研究的重要转折:从依赖复杂优化与显式对齐,迈向基于简洁表征与高效传输的新范式。SEINT所展现的“降维不失真、高效不失准”的特性,为3D视觉、计算化学、机器人感知等领域提供了通用且可靠的基础工具。未来,随着其在任意度量空间中的进一步拓展,有望成为连接高维结构与低维计算的智能桥梁,开启几何感知AI的新篇章。