机器之心发布
近年来,科学界一个备受关注的议题是:“AlphaFold是否已经终结了结构生物学的研究?”我们要明白,AlphaFold等结构预测模型的训练数据主要来源于X射线、冷冻电镜(cryo-EM)等传统结构解析方法。虽然冷冻电镜技术擅长解析蛋白质的动态过程,但这也正是AlphaFold当前无法完全实现的。巧合的是,冷冻电镜技术在2017年也获得了化学奖。
相关论文信息如下:
论文主页:bytedance.github.io/cryostar/
开源链接:/bytedance/cryostar
CryoSTAR是首个在冷冻电镜实验数据上成功应用蛋白质原子结构模态先验的方法。其特点及优势如下:
1. 结合蛋白质结构先验知识。CryoSTAR方法创新性地利用原子模型信息作为结构正则化,解决冷冻电镜数据中的构象动态问题。这种方法避免了仅从计算机视觉角度处理问题的局限性,要求一个初始原子模型作为参考,将其结构信息用于适当约束模型解析的构象动态。
2. 输出两种模态的解析结果。该方法能同时输出粗粒度的原子模型和密度图解析结果,有助于研究人员更全面地了解生物分子的结构和动态过程。密度图的输出结果也可以验证原子模型结果的置信程度。
该方法分为两个阶段:
第一阶段,通过结构正则化约束的变分自动编码器(VAE)解析数据中的动态构象。CryoSTAR通过Encoder将构象的动态压缩到一个潜在变量中,Decoder将潜在变量解析成相应的先验粗粒度原子模型的变形来拟合数据。
第二阶段,训练一个密度图来得到密度图模态的动态构象解析结果。在VAE训练完成后,提取所有图像对应的潜在变量并用于训练密度图。
CryoSTAR在多个公开数据集的冷冻电镜实验数据上得到了验证,包括酵母预催化B复合物剪接体、U4/U6.U5三核糖白等大型复合物,以及毒素蛋白α-LCT等单链蛋白和膜蛋白。对于这些蛋白的数据验证,CryoSTAR均成功揭示了其构象变化,且生成的粗粒度模型与密度图拟合良好,展现出合理的运动模式。相比其他方法,如没有结构先验的cryoDRGN和3DFlex,CryoSTAR生成的密度图更连续,能有效避免密度图中的伪影。
总结来看,ByteDance Research提出的CryoSTAR方法显著提升了冷冻电镜在动态构象解析中的应用潜力。通过利用原子结构模态先验作为约束,同时输出两种模态的解析结果,这一创新方法在技术上展示了其独特的优势。该方法在生命科学和制领域具有广泛的应用前景。生物大分子的动态解析是理解其功能机制的关键,如蛋白质的折叠、酶活性部位的变化等。这些动态过程与众多生理与病理现象息息相关。准确解析这些动态过程不仅有助于揭示生物学基本问题,还能为发现新型物靶点和优化物设计提供重要依据。期待未来该方法能在更多研究和实际应用中得到验证和推广。
参考文献: