# 通讯作者;* 共同贡献;+ 项目负责人 / 指导。
会议论文
作者:Chenguang Wang*, Zihan Zhou*, Lei Bai, Tianshu Yu#
发表于 ICML2026
本文提出一种结构感知的逆合成框架,将化学反应的两阶段本质编码为位置先验:把反应中心原子放置到序列头部,从而将隐式化学知识转化为模型可学习的显式模式。结合图扩散 Transformer 主干与离散流匹配,本方法在 USPTO-50k 上取得 61.2%、在 USPTO-Full 上取得 51.3% 的当前最优性能,相较之前的扩散方法训练速度提升 6 倍、采样步数减少 25 倍。值得注意的是,280K 参数的小模型在使用合适顺序后即可达到不使用顺序的 65M 参数模型的水平,表明在分子设计中精心设计的归纳偏置远胜于”堆参数”式的暴力扩展。
作者:Zihan Zhou, Chenguang Wang, Hongyi Ye, Yongtao Guan, Tianshu Yu#
发表于 ICLR2026
本文研究如何从不完整的观测数据中学习物理动力学——这是真实科学应用中普遍存在的根本性约束,因为完整测量往往无法获得。所提出的扩散式框架通过自适应于观测模式的”上下文-查询”切分策略,直接从部分观测中学习。理论分析证明该方法在渐近意义下收敛到真实的完整数据分布;在合成偏微分方程数据与 ERA5 气候数据上的实验表明,相较各类基线方法有显著提升,尤其在稀疏观测(覆盖率 1%–20%)的情形下优势更为明显。本工作为部分观测动力学的填补提供了一条具有坚实理论保障与广泛实用价值的方法路径。
作者:Yaoyao Xu, Di Wang, Zihan Zhou, Tianshu Yu#, Mingchen Chen#
发表于 NeurIPS2025
本文通过显式建模蛋白质动力学的多尺度本质,解决了生成时间连贯且物理上合理的蛋白质构象系综这一挑战。现有的扩散式方法独立地生成各构象状态,难以捕捉蛋白质运动中的因果依赖;为此,本文提出 TEMPO 框架,引入分层自回归结构,将动力学建模为马尔可夫随机过程。该方法将运动分解为两个时间尺度:低分辨率模型捕捉缓慢的集体跃迁;高分辨率模型在低分辨率运动的条件下生成精细的局部涨落。在 mdCATH 与 ATLAS 数据集上的全面评估显示,本方法在结构精度、时间连贯性与计算效率方面均显著优于已有方法,展现了其在高效且具有物理依据的蛋白质动力学模拟方面的潜力。
作者:Zihan Zhou, Xiaoxue Wang, Tianshu Yu#
发表于 ICLR2025
本文将物理先验融入扩散生成模型,解决在数据驱动场景下生成物理可行动力学的难题。传统生成方法往往难以满足基本物理规律,而本文提出的框架同时整合两类先验:分布性先验(如旋转-平移不变性)与物理可行性先验(如守恒律与偏微分方程约束)。通过将这些先验嵌入生成过程,该方法能够高效地生成真实合理的物理动力学,例如轨迹与流场。在多种物理系统上的实验验证了其有效性,展现了在 AI 驱动科学建模方向的潜力。
作者:Zihan Zhou, Tianshu Yu#
发表于 ICML2023
本文针对杂乱、不规则采样的序列数据学习难题,提出了一种基于”解耦”的新方法。该方法显式地将复杂系统拆分为多个潜在子系统以及一个用于刻画各子系统随时间相互作用的元系统。具体地,相互作用通过投影微分方程 (ProjDE) 建模,并采用受 Bregman 散度启发、对神经网络友好的投影算子。在合成数据与真实数据集上的实验结果表明,该方法在处理复杂、杂乱的序列数据方面具有有效性。
预印本
作者:Keyue Qiu*, Yixin Wu*, Zihan Zhou, Changze Lv, Lihao Wang, et al., Hao Zhou# (listed: Model core, co-first, and corresponding authors
发表于 arxiv
本文提出 AMix-2,一种蛋白–文本基础模型,将蛋白质确立为大语言模型中的原生模态,在单一模型内统一蛋白理解与条件序列设计。自然语言与蛋白序列共享 token 空间,以指令驱动生物推理与设计;块级扩散语言建模骨干在块间采用因果生成、在块内进行双向去噪与迭代细化,比严格从左到右的分解更契合蛋白的非局部依赖。我们同时发布 ProteinArena——具备时间与同源性感知协议的综合性基准,覆盖问答、EC/CATH 分类与功能条件设计等任务。在 ProteinArena 上,AMix-2 优于前沿通用 LLM,并与任务专用蛋白模型具有竞争力;对照实验进一步表明扩散范式普遍优于自回归对照,凸显灵活生成顺序对蛋白序列的优势。
作者:Chiyuan Ma, Zihan Zhou+, Tianshu Yu#
发表于 arxiv
当真实遮挡具有结构化、样本相关且常为 MNAR 的缺失模式时,从不完整观测中学习物理动力学极具挑战,而现有上下文-查询方法多依赖与真实传感拓扑不匹配的启发式掩码。本文提出观测对齐掩码先验(Observation-Aligned Mask Priors):先在二值观测掩码上预训练贝叶斯流网络以刻画真实遮挡分布,再以全局归一化交叉熵引导采样,为每个稀疏样本构建样本特定的上下文-查询划分;基于交集的划分保证每个有效观测维度具有严格正的查询概率,从而避免零查询死区与局部生成坍缩。在三个含真实卫星遮挡的海洋学数据集上(最高 256×256),无需完全观测训练场,本方法在 MSE 与 PSNR 上稳定优于强扩散基线。
Physics-Mediated Diffusion: Leveraging Intermediate Field Representations for Sparse PDE Inversion
作者:Zihan Zhou*, Chiyuan Ma*, Tianshu Yu#
发表于 arxiv
从稀疏观测反演物理参数是严重不适定的逆问题:多种参数配置可在观测点处同样拟合数据(等终性),传统优化方法也常在复杂损失景观中难以收敛。本文提出物理中介扩散(Physics-Mediated Diffusion),将完整时空场作为可学习的中间表示:条件扩散模型对合理解施加强结构先验,再通过由控制方程代数形式导出的可微算子(如以时间导数与空间导数之比估计扩散系数)提取参数,在无需完整前向求解器的情况下保证场与物理的一致性。理论分析表明恢复误差由提取算子的谱性质决定;实验显示,尤其在极端稀疏与良条件系统下,本方法在参数恢复上显著优于各类基线。
作者:Zihan Zhou, Ruiying Liu, Jiachen Zheng, Xiaoxue Wang, Tianshu Yu#
发表于 arxiv
本文借助微分几何工具分析 SE(3) 不变空间中的扩散过程,提出了一族无投影的扩散 SDE 与 ODE 形式。所给出的形式化在提升采样效率与精度的同时,对分子构象生成、人体姿态生成等应用尤为有益。
作者:Zihan Zhou, Ruiying Liu, Chaolong Ying, Ruimao Zhang, Tianshu Yu#
发表于 arxiv
本文提出 SDDiff,一种作用于原子间距的扩散式分子构象生成模型,从而天然满足 SE(3) 等变性。与假设距离扰动服从高斯分布的常规做法不同,SDDiff 从分子热力学出发,推导出一种”移位”得分函数,刻画了原子间距变化在噪声增大过程中如何由高斯分布过渡到 Maxwell-Boltzmann 分布。这一表述为扩散过程的反向求解提供了更具物理依据的方式,从而生成更合理可行的分子几何结构。