生物信息学从零开始学 5 蛋白质三级结构预测
2021-09-06
森言森语
昔日龌龊不足夸,今朝放荡思无涯。
春风得意马蹄疾,一日看尽长安花。
——登科后 (唐)孟郊
接下来的几天写一下关于分子对接的专题,今天的推文是导入,先了解一下基本的知识点。
□ 计算方法预测蛋白质三级结构
- 从头计算法(ab initio)
- 同源建模法(homolog modeling)
- 穿线法(threading)
- 综合法(ensemble method)
1 homolog modeling: SWISS-MODEL
原理:相似的氨基酸序列对应着相似的蛋白质结构 步骤:
- 找到与目标序列同源的已知结构作为模板(目标序列与模板序列之间的一致度要≥30%)
- 为目标序列与模板序列(可以多条)创建序列比对。通常比对软件自动创建的序列比对还需要进一步人工矫正。
- 根据第二步创建的序列比对,用同源建模软件预测结构模型 - 评估模型质量,并根据评估结果重复以上过程,直至模型质量合格。
https://swissmodel.expasy.org/
预测效果 如果目标序列与模板序列一致度极高,那么同源建模法是最准确的方法。
特例情况 虽然序列一致度达到很高水平,但是结构却并不相同。
2 threading:I-TASSER
原理:不相似的氨基酸序列也可以对应着相似的蛋白质结构
https://zhanglab.ccmb.med.umich.edu/I-TASSER/
单独注册账号,一次只能提交一个任务。
3 ab initio:QUARK
原理:1973年science,Anfinsen:蛋白质的三维结构决定于自身氨基酸序列,并且处于最低自由能状态。 QUARK适用于没有同源模板的蛋白质,且氨基酸序列长度应在200以内。 单独注册账号,一次只能提交一个任务。
https://zhanglab.ccmb.med.umich.edu/QUARK/
4 ensemble method:ROBETTA
原理:综合了前三种方法,将氨基酸序列分段,情况不同的片段采用不同的方法。
http://robetta.bakerlab.org/
模型质量评估
https://servicesn.mbi.ucla.edu/SAVES/
蛋白质三级结构的比对
http://superpose.wishartlab.com/
蛋白质三维结构比对就是对蛋白质三维空间结构的相似新进行比较。
-
可用于探索蛋白质进化及同源关系
-
改进序列比对的精度
-
改进蛋白质结构预测工具
-
为蛋白质结构分类提供依据
-
帮助了解蛋白质功能
结构比对的结果可以用很多种参数来衡量,最常用的是root mean squared deviations(RMSD)。如果两个结构的RMSD为0埃,则结构一致,可以完全重合;一般来说RMSD小于3埃时,认为两个结构相似。 蛋白结构叠合
https://spdbv.vital-it.ch/