从几何对齐到一维压缩：SEINT如何重塑高维结构数据的距离度量

2026-02-17 · 0 次浏览 ·来源: AI导航站

在3D点云、分子构型等复杂结构数据的距离度量中，如何同时满足旋转平移不变性、严格的数学度量性质与高效计算，一直是困扰研究者的核心难题。传统方法要么依赖高代价的几何对齐，要么牺牲理论保证换取速度。中国人民大学团队提出的SEINT方法，通过创新性地将高维结构信息压缩为无需训练的一维表征，巧妙结合最优传输与距离卷积，实现了SE(p)不变性、度量性与计算效率的三重突破。实验证明，SEINT在保持100%分类鲁棒性的同时，速度提升达两个数量级，并在3D分子生成任务中推动模型达到SOTA水平，为跨空间、高维稳定的结构数据分析提供了全新范式。

在人工智能与计算科学的前沿交叉地带，衡量复杂结构之间的距离始终是一项基础性挑战。无论是3D点云识别、高分子构型分析，还是分子生成模型的几何约束，研究者都面临一个共同难题：如何定义一种既对旋转和平移保持不变、又具备严格数学度量性质、还能高效计算的分布距离？

传统方法的困境：理论完备性与计算效率难以兼得

当前主流的最优传输（OT）方法在处理结构性数据时，往往陷入两难境地。内蕴式方法如GW（Gromov-Wasserstein）虽然能保持几何关系并满足度量性质，但需要显式求解复杂的几何对齐问题，计算复杂度高达多项式级别，难以应用于大规模场景。而外蕴式或表征式方法虽计算更快，却常因依赖特定坐标系或缺乏理论保障，无法严格满足SE(p)不变性，导致在旋转扰动下性能急剧下降。更棘手的是，多数方法局限于同维度空间内的比较，难以实现跨空间（如2D投影与3D模型）的分布对齐，极大限制了其在真实世界中的应用广度。

SEINT的突破：一维压缩与最优传输的巧妙融合

针对上述痛点，研究团队提出了一种名为SEINT的全新度量框架。其核心思想极具启发性：将高维空间中的复杂结构信息，通过无需训练的数学构造，压缩为一条一维“半径轴”上的标量表征。这一过程并非简单的统计降维，而是通过两种创新表征——PTD（Polar Transport Discrepancy）与DcPTD（Distance-convoluted PTD）——实现几何结构的保真编码。

PTD首先提取样本点的范数信息，映射到一维参考轴上，并通过求解与参考分布的一维最优传输，为每个点赋予一个“搬运距离”标量。为进一步捕捉点间几何关系，DcPTD引入空间距离矩阵进行加权卷积，使一维表征能显式反映原始结构的拓扑特征。这一设计确保了两个关键性质：一是等距一致性，即对任意刚体变换保持不变；二是维度无关性，无论输入空间维度多高，输出始终是一维标量，天然支持跨空间比较。

在此基础上，SEINT通过在一组候选参考分布上取“最不利”选择，构建最终距离。这种“对抗式”参考选择策略不仅消除了对单一参考的依赖，更从理论上保证了其作为度量的严格性——满足非负性、对称性与三角不等式。

效率与鲁棒性的双重跃升

SEINT的计算优势尤为突出。由于核心运算仅涉及一维最优传输与距离卷积，其复杂度在理想条件下可达近似线性水平。在ModelNet40-SE(3)点云分类实验中，面对随机旋转与平移干扰，SEINT保持了100%的分类准确率，而计算速度比同类不变性方法快50至300倍。相比之下，缺乏不变性的SW等方法准确率骤降至60%以下。多维缩放可视化进一步揭示，SEINT能完美保留数据的闭环拓扑结构，而其他方法则在旋转扰动下结构崩塌。

更令人振奋的是其在跨空间与高维场景下的表现。在Horse-Gallop实验中，SEINT成功通过2D投影与3D参考的对比，精准捕捉马匹奔跑的步态周期，展现出超越EGW的几何感知力。在高维混合高斯测试中，它有效克服了“维度灾难”，距离度量随差异增大平滑单调增长，数值稳定性显著优于传统OT方法。

从理论到实践：推动生成模型迈向几何精确

SEINT的价值不仅限于理论创新，更在实际应用中展现出强大潜力。当作为正则化项集成到EDM与UniGEM等主流扩散生成模型中时，SEINT显著提升了生成分子的原子与分子稳定性。在QM9与GEOM-Drugs数据集上，UniGEM模型借助SEINT在关键指标上达到SOTA性能，证明其能有效引导模型学习正确的几何结构，减少无效或不稳定构型的生成。

这一成果标志着结构数据度量研究的重要转折：从依赖复杂优化与显式对齐，迈向基于简洁表征与高效传输的新范式。SEINT所展现的“降维不失真、高效不失准”的特性，为3D视觉、计算化学、机器人感知等领域提供了通用且可靠的基础工具。未来，随着其在任意度量空间中的进一步拓展，有望成为连接高维结构与低维计算的智能桥梁，开启几何感知AI的新篇章。