English 手机版 山大视点 | 山东大学 | 山东大学教师个人主页
新闻
当前位置: 中文主页 >> 新闻

基于我校“高性能云计算”构建蛋白质结构精准预测平台

发布时间:2021-08-16 点击次数:

生物大分子空间结构解析是生命科学领域的研究热点和难点,是生物学研究领域的“皇冠明珠”。大数据时代背景下,基于生物大数据和深度学习网络的基于蛋白质结构预测技术,形成了AlphaFold2、RoseTTAFold等蛋白质预测工具,并已形成具有划时代意义的颠覆性技术

      山东大学一直以来积极推进和探索大数据与高性能计算在生物学研究领域的学科交叉,初步构建了“快测-快存-快拼-快算”的全新模式。特别是基于我校高性能计算云平台,采用云计算行业中先进的容器技术,进行高效的环境配置和搭建,实现了“一次构建多次部署”的快速应用模式。近日,依托高性能计算云平台,软件学院与微生物技术研究院紧密配合针对AlphaFold2、RoseTTAFold等软件开展蛋白质结构预测计算环境的建设工作,构建了蛋白质结构预测应用镜像,建设了2.2TB相关的数据库资源,基于多GPU节点实现了高通量并行批量预测蛋白质结构技术。

1.jpg

1.jpg

1 高性能计算云平台硬件与简洁的用户使用界面

        在AlphaFold2软件测试的过程中,选择了来自12个不同家族的蛋白质作为批量测试目标。根据已知结构,测试样本中含不同二级和超二级构象,序列长度分布在200~500个氨基酸,总耗时约10小时。将预测结构与实验测得的蛋白质结构进行结构比对后,得到RMSD的平均值为0.290。

2.png

图 2 结构预测准确性

 目前平台已将整个AlphaFold 2应用模块、模型数据和应用软件集成在统一的虚拟环境中,用户只需要简单的虚拟环境导入即可使用,省去了数据下载、软件模块安装配置等诸多繁琐程序,同时也极大缓解了校园网国际出口带宽和流量压力。

 相较于国内其他高校的高性能计算平台,山东大学高性能计算云平台借助平台的资源共享理念和技术支持措施,提供了更加友好和丰富的用户交互模式。全校所有用户,均可登录高性能计算云平台,使用AlphaFold 2的全部功能组件,实现了一次构建、多次部署、全校共享、使用简便的良好效果。

 AlphaFold2批量结构预测平台的搭建,将使山东大学蛋白质结构测定分析平台更加完整,是 X射线晶体衍射(X-ray crystallography)平台、核磁共振波谱(NMR spectroscopy)分析平台及电子显微镜技术(electron microscopy)平台之后的,第四种蛋白质结构解析平台与技术,将大大推动生物大分子结构与功能的研究向更通用,更高效,更深入!