作业帮 > 生物 > 作业

用bioedit怎么 预测蛋白质二级结构

来源:学生作业帮 编辑:作业帮 分类:生物作业 时间:2024/11/09 04:42:02
用bioedit怎么 预测蛋白质二级结构
结构预测是有意义的,因为通过实验来确定结构仍然要比通过实验确定序列慢得多.结构预测帮助我们理解蛋白质的功能和作用机制,对合理的药物设计也是很有意义的.
(理论基础)  蛋白质结构在进化中要比蛋白质序列保守得多.蛋白质可以自发地折叠成它们的天然结构,因此蛋白质的折叠在某种程度上就编码在氨基酸序列中.并且寻找蛋白正确结构的过程不能是随机搜索所有的可能性,探究蛋白质如何编码三级结构以及理解该结构如何折叠式个很有科学价值的问题.
结构预测   是指仅依据蛋白序列的信息来预测蛋白质每个原子在三维空间中的相对位置.
(理论基础) 可以是从零开始的,尝试计算并最小化自由能,或得出一个合适的近似最小值的方法
   也可以是基于一些已有知识的,尝试使用已知结构数据库中的信息来预测蛋白质结构.
结构预测方法 比较建模法,折叠识别法,二级结构预测法,从头预测法以及跨膜片段预测法
比较建模预测结构过程【掌握大概过程,复习课有讲】 书P161
保守核心残基的定位——可变回环的模型化——侧链的定位和优化——模型的提炼
保守残基和一些侧链的位置可以直接从模板结构信息中推导出,可变回环的建模常利用备件算法,对于侧链的定位也有精密的算法来获得优化包裹的疏水核心.
多序列信息:使用相关序列的多序列比对结果可以揭示某些特定二级结构的保守模式,从而显著地提高了二级结构预测的精确度,使得目前这方面预测的精确度达到了66%左右
二级结构预测:
当某一特定目标序列没有合适的相关模板结构时,可以考虑采用二级结构预测法.与比较建模法不同的是,该方法并不产生一个全原子三级结构模型,而是对每个残基二级结构状态进行预测,即预测该二级结构是否是螺旋、链或延伸以及圈.二级结构预测方法有Chou-Fasman法则和基于信息论的GOR方法
跨膜片段的预测:内在膜蛋白中的跨膜片段可以通过搜索跨越脂质膜的连续疏水残基来进行预测.有些方法还预测 跨膜片段的方向(进—出)或拓扑结构,但是这通常都不太准确.
跨膜片段往往含有较高比例的疏水残基,长度常常在20个残基以上,对应于6-7个跨膜螺旋的螺旋圈.这种相对较长的强烈疏水残基系列在可溶性球蛋自中很少见.这意味着可以基于疏水残基系列来进行预测.预测工具:TMPred,TMHMM and TopPred 可在ExPASy的站点上找到
高级蛋白质结构预测 折叠识别(线程):致力于检测非常疏远的结构和进化关系,能确定二级结构是如何包裹成三级折叠的 从头预测
预测策略 【详细看看】PPT10 91,92页 书P174
鉴定出该查询序列中的任何特征——采取一个适当的预测方法(首选比较建模,不行就二级结构预测,二级结构预测之后要进行折叠识别)
Step 1:鉴定出该查询序列中的任何特征.E.g.潜在跨膜片段; 低组成复杂度; 卷曲螺旋; 已知结构域或序列的整体结构域 (通过Interpro); 其他相关序列和亚序列 (通过PSI-BLAST).如果蛋白质是多结构域的,而且序列中结构域的位置可以找出,那么分别预测每个结构域将会很有用.
Step 2:采取一个适当的预测方法.
首选 比较建模方法,如果不成功,则进行二级结构预测 (可应用到对任何序列的结构预测,但对球蛋白的结构域预测更为精确) ,二级结构预测之后要进行fold recognition ,该方法能确定二级结构是如何包裹成三级折叠的,但是应该谨慎使用这类方法.
1.通过核酸数据库GenBank进行搜索,找到与该序列片段同源性较高的基因和基因组序列,获得这些序列的序列接受号
2.根据获得的序列接受号,通过使用如Entrez信息查询系统获得这些序列的详细序列信息,从而推测未知序列的相应功能信息
3.利用BioEdit软件对上述未知功能序列进行分析,如mRNA外显子调控区等序列,通过ORF框查看,对上述序列进行新基因发现
4.利用2、3步的相关信息,进一步利用Clustalx软件对已知序列做多序列比对,使用phylip软件构建系统发育树等方法,分析推测该未知序列的蛋白质编码序列和相关蛋白的功能
5.利用BioEdit软件对未知蛋白质序列进行分子质量、氨基酸组成和疏水性等基本性质分析,利用PredictProtein server对未知蛋白质进行二级结构预测,利用比较建模软件swiss-model对未知蛋白进行三维结构预测
6.通过上述结构预测的结果进行推测该未知蛋白的功能