本文作者:冷月如霜
课前复习:简明细胞生物学(一)
四、基因组与蛋白结构
这节课依旧是讲一些很基础的东西哇。。于是我好奇查了一下教学大纲,想知道什么时候停止这种基础的介绍,结果发现原来按照计划今天就应该开始讲细胞膜啊……好吧美国人这个上课效率……好在后半段开始讲蛋白质结构了,算是正式迈入了细胞生物学的大门吧。
不过首先还是一些基础的东西不是。。故事要从老板的这次圣诞度假说起。。当时他在机场,看到了一本叫做《TIME》的杂志。。。
”)这篇用作封面的文章讨论了利用全基因组测序的技术分析新生儿是否有患上某些疾病的可能。老板对着全班说,上次我们统计了一下将来有意向往医学方向发展的学生,人数大概是1/3。当你们正式成为医生时(大概10几年后吧……),这种技术应该已经得到了比较广泛的应用了。所以你们要……好好地听课……
老板如此自信的原因很简单,也很实在——测个序实在是太便宜了么……最初的人类基因组花了全球数千名科学家13年的时间,耗费30亿美元,才得到了寥寥几个人类的基因组。然而随着测序技术的高速发展,测序的速度在一直上升,而成本则在一直下降。到目前为止,测一个单人的基因组的花费已经接近1000美金,时间也能够缩短在一个月内。要知道,很多人一年来的支付宝花费都要大大高于这个数字哇。。
不过这也会带来一系列的问题。伦理什么的就不谈的,单单是个人的意志就可能让“人手一个全基因组测序”的愿望落空。老板自己当然是想测一份的,但同样是搞生命科学的老板太太则对此毫无兴趣。。在学术圈内尚且如此,学术圈外可想而知。人生往往充满了未知,而现在,未知可以成为一种选择。
除了分析疾病外,全基因组测序还有其他的应用。在一般的遗传学研究中,科学家们往往会把野生型进行突变,观察有没有奇怪的事情发生,然后在那些奇怪的突变体里找到突变的基因,并把这个基因与奇形怪状联系起来。这就是我们所谓的正向遗传学。而有了全基因组的测序结果,我们可以提前得到一个基因的序列,进行点对点的突变,并以此观察这个基因突变后可能造成的影响。由于方向从“影响——》基因”这个顺序变成了“基因——》影响”,这种方法也被称为反向遗传学。
随着现有技术的不断成熟,突变一个特定基因的方法也越来越多,这里稍微提几个上课时提到的。。其一是利用同源重组的方法,用已经突变了的基因去替换掉这个基因;二是利用基因敲除的方法,使这个基因得不到表达(也就是失去活性);三是添加上突变了的基因,但不删除原有的正常基因。在一些情况下,这些突变基因的表达量会远远大于正常的基因,所以即便原有基因还在那里,也起不了什么作用了。至于其他点突变,RNA干扰的方法,这里就不详述了。
好了,终于能够开始介绍蛋白质了。虽不乏例外,但一般说来,遗传信息的流向总是从DNA到RNA,再从RNA到蛋白质的。基因以DNA的形式储存于细胞核内。由于DNA不能随意进出细胞核,于是这些信息被转到了RNA上,并以RNA的形式被带出细胞核。这些RNA在细胞中的一种小结构——核糖体的作用下,成为了合成蛋白质的模板。不同的氨基酸按照模板按顺序出现,并且结合在一起,组成了蛋白质。而蛋白质就是我们体内干着粗活脏活累活的生物大分子……
所以要了解蛋白质,我们得先了解蛋白质的组成部分——氨基酸。对于诸如结构生物学的学科来说,这些氨基酸的化学式及其化学性质是极其重要的,必须牢记于心。不过还好细胞生物学的要求没那么高。如果你能够数量掌握这些性质,自然再好不过。不然,大概了解下氨基酸的分组,以及一些特定氨基酸的作用就足够了……
人体中主要有20种氨基酸作为构成蛋白质的元件。其中8种氨基酸由于侧链上不带电荷,与水的结合能力较弱,因此被称为疏水性氨基酸;5种氨基酸在侧链上带有电荷,其中3种带有正电荷,2种带有负电荷。它们也因此被分别称为碱性和酸性氨基酸。而另外4种氨基酸虽然侧链上没有电荷,侧链上的基团却带有极性。因此这4种氨基酸与碱性/酸性氨基酸一样,对水都有一定的亲和力。这9种氨基酸也被统称为亲水性氨基酸。
如果你开始感到一头雾水,那就无视掉上面这些内容吧……不过请你记住接下来要讨论的几个氨基酸。因为它们在蛋白质的结构中起了重要的作用。
首先是丝氨酸(S)和苏氨酸(T)。它们能被磷酸化,也就是会在它们的侧链上多上一个磷酸基团。在需要细胞内的信号传导活动中,磷酸与否就像是开关一样,控制着一系列生化反应的起始。
除了磷酸化之外,丝氨酸、苏氨酸还与天冬酰胺(N)一起,能够被糖基化。这个将在介绍高尔基体与内质网(两种都是大型的细胞结构,或称细胞器)时提到。
另外我们上头还漏了3种氨基酸。半胱氨酸(C)能够与另一个半胱氨酸形成一种稳定的化学作用力。我们称之为二硫键。这种化学作用力非常牢固,把它们理解为类似于相互吸引的吸铁石或者尼龙搭扣就可以了。
甘氨酸(G)的侧链只有一个氢原子,在所有的氨基酸中结构最为玲珑。因此,在蛋白质较为柔软灵活的地方,我们往往能看到甘氨酸的身影。
而脯氨酸(P)则正好相反。由于脯氨酸的侧链会自己形成一个环状的结构,反而会影响周围氨基酸的旋转。因此在那些需要固定的蛋白质区域,我们会看到脯氨酸。
两个氨基酸的头尾相连,失去一分子的水分子后,会形成一个叫做肽键的结构。“肽”这个词与氨基酸脱不了关系,它就是氨基酸的另一个名字。一条由多个氨基酸形成的链条也因此被称作为“多肽链”。我们把氨基酸按照顺序排成的多肽链称为蛋白质的一级结构。
但这些氨基酸们毕竟有着自己的特性。比如带有同样电荷的氨基酸会互相排斥,带有不同电荷的氨基酸会互相吸引,两个半胱氨酸会形成二硫键等。于是这些氨基酸组成的多肽链会自发地组成一些特定的结构,我们就把这些结构称为二级结构。其中比较常见的有α-螺旋和β-折叠。α-螺旋在蛋白质/蛋白质相互结合的过程中起到了比较重要的作用。另外对于一些嵌合在细胞膜上的蛋白来说,α-螺旋也是它们跨越细胞膜的桥梁。而β-折叠则会形成一个较为平整的面。有时,多个β-折叠也会卷曲起来,像一张白纸卷成一个纸筒一样,卷成一种叫做β-桶的结构……(这些人命名的想象力真是。。)
在二级结构的帮助下,氨基酸有了一定的三维结构,并最终折叠成蛋白质的模样。折叠后的蛋白质三维形状,就被称为三级结构。这个完整的蛋白质上或许有若干起功能的区域,这些区域就被称作是结构域。比如有些结构域起到了酶的作用,可以催化某个生化反应;而另外的结构域起到了支撑蛋白整体结构的作用。
【一个蛋白的三级结构,其中有两个结构域。一个能够结合磷酸集团,一个能进行进行催化反应】
需要注意的是,这些结构域中,真正在起作用的蛋白部分(或者说氨基酸)只有很小的一部分。其余的氨基酸只是起到维持这个结构域结构的作用。我们把真正起作用的那部分氨基酸的三维结构称为Motif。在国内这个词往往被翻译成“模体”,我个人不是很喜欢。。大家就记住这是一组起功能的氨基酸就可以了。
课堂总结:
1. 全基因组测序真是越来越便宜了……以后每个人都有一份自己基因组的文本并不是什么太过遥远的东西。
2. 我们可以通过反向遗传学来研究特定基因的功能。这样的研究更有的放矢。
3. 蛋白质主要由20种氨基酸来组成,不同的氨基酸有不同的性质,有些对于蛋白结构很重要。
4. 蛋白质有一级、二级、三级和四级结构。文中只提到3级结构。四级结构指多个蛋白形成的空间构象。
5. 蛋白上起功能的区域叫做结构域,结构域中真正起作用的一组氨基酸叫做Motif。
关于本文
简明细胞生物学系列
特别感谢刘洪瑞、宋超逸二位同学为此文配图所做的翻译、制图工作。
刘洪瑞:兰州大学网络与新媒体专业,热爱科学,喜欢钻研,总是以一种物质的视角观察生活,果壳昵称:刘洪瑞。
宋超逸:兰州大学生物学基础理论专业,喜欢大千世界的花鸟虫鱼,擅长PS,经常逛果壳。