蛋白质序列的数学描述及其应用提纲

时间:2021-03-15 14:21:50 论文提纲 我要投稿

蛋白质序列的数学描述及其应用提纲

    论文摘要: 蛋白质是由20个氨基酸残基组成的大分子,一个蛋白质序列可以看作是在20个氨基酸的字母表Ω上的字符串,即Ω={A,C,D,E,F,G,H,I,K,L,M,N,P,(略)T,V,W,Y}.因为蛋白质序列中氨(略)在蛋白质折叠为空间结构时起重要作用,进而最终决定它的功能,所以对蛋白质序列进行深层次的分析是一个重要且有意义的工作. 近几年,一些研究者将DNA序列的图形表示扩充到蛋白质序列的分析中,提出了蛋白质序列图形表示.然而DNA序列仅有4个碱基组成,要把DNA序列的图形表示应用到蛋白质序列上,需要考虑20个氨基酸按照(略)进行排列.目前主要有两种蛋白质序列的图形表示,一种是忽(略)中的个体差异,将原来20种氨基酸分为4类或5类,这样就把蛋白质序列简化成一个4个或5个字符序列,从而减少可能的排列数.另外一种是忽略所有氨基酸之间的`异同,直接根据氨基酸的字典序进行排列. 我们首次提出氨基酸的循环排序概念,即把氨基酸按照某种规律排列成一个首尾相连的环.在本文中基于氨基酸的理化性质分类、PAM250替换矩阵、6(略)y编码等,我们给出了几种不同的氨基酸循环排序.利用C...
    There are 20 amino acids that make up the standard chemical alphabet used to build p(omitted)hus, a protei(omitted) is a string ov(omitted)habetΩwith the 20 amino acids, thereΩ={A,C,D,E,F,G,H,I,K,L,M,N,P,Q(omitted),Y }. In molecular biology, the 3D structure of a protein is determined by the in(omitted)quence of amino acids that makes up the protein. So, the analysis of the protein sequences is an important and interesting work in bioinformatics. In recent years, some researchers generali...
目录:摘要 第4-5页
Abstract 第5-6页
第1章 绪论 第9-20页
  ·生物信息学的研究背景和问题 第9-10页
  ·生物序列图形表示的研究概况 第10-18页
    ·DNA 序列的图形表示 第11-12页
    ·蛋白质序列的图形表示 第12-18页
  ·本文的主要工作 第18-20页
第2章 蛋白质序列的图形表示 第20-38页
  ·蛋白质序列的2 维图形表示 第21-30页
    ·基于氨基酸理化性质分类的2维图形表示 第21-29页
    ·基于PAM250 矩阵的循环排序 第29-30页
  ·蛋白质序列的3 维空间表示 第30-37页
    ·基于氨基酸的字典序得到的3维空间表示 第30-32页
    ·基于 6 阶反射 Gray 编码得到的 3 维空间表示 第32-37页
  ·小结 第37-38页
第3章 蛋白质序列的数值特征及其相似性分析 第38-49页
  ·数值刻画方法 第38-39页
  ·数值刻画方法以及相似性分析 第39-47页
    ·矩阵特征值集 第39-41页
    ·一阶类中心矩 第41-43页
    ·矩阵最大特征值 第43-45页
    ·图形比对 第45-47页
  ·小结 第47-49页
第4章 进化树的构建 第49-73页
  ·构建进化树的步骤 第49-50页
  ·构建进化树工具 第50页
  ·构建进化树 第50-73页
    ·个物种的线粒体 NADH 脱氢酶的进化树 第51-53页
    ·种冠状病毒 spike 蛋白的进化分析 第53-64页
    ·种流感病毒 RNA 聚合酶 PB1 的进化分析 第64-72页
    ·小结 第72-73页
参考文献 第73-78页