密码子

密码子(codon)是指信使RNA分子(即mRNA)中每相邻的三个核苷酸编成一组,在蛋白质合成时,代表某一种氨基酸的规律。信使RNA在细胞中能决定蛋白质分子中的氨基酸种类和排列次序。信使RNA分子中的四种核苷酸(碱基)的序列能决定蛋白质分子中的20种氨基酸的序列。而在信使RNA分子上的三个碱基能决定一个氨基酸。
- 中文名 密码子
- 外文名 genetic code
- 学科 生物学
- 别称 三联体密码
种类
构成RNA的碱基有四种,每三个碱基的开始两个决定一个氨基酸。从理论上分析碱基的组合有4的3次方=64种,64种碱基的组合即64种密码子。怎样决定20种氨基酸呢?仔细分析20种氨基酸的密码子表,就可以发现,同一种氨基酸可以由几个不同的密码子来决定,起始密码子为AUG(甲硫氨酸) , 另外还有UAA、UAG、UGA三个密码子不能决定任何氨基酸,是蛋白质合成的终止密码子。1994年版曾邦哲著《结构论》中对密码子和氨基酸的组合数学计算公式为:C1/4+2C2/4+C3/4=20氨基酸,C1/4+6(C2/4+C3/4)=64密码子。(另有算法4*4*4=64,一个密码子里面三个碱基每个位置有4种可能)
特点
①. 遗传密码子是三联体密码:一个密码子由信使核糖核酸(mRNA)上相邻的三个碱基组成。② 密码子具有通用性:不同的生物密码子基本相同,即共用一套密码子。
③ 遗传密码子无逗号:两个密码子间没有标点符号,密码子与密码子之间没有任何不编码的核苷酸,读码必须按照一定的读码框架,从正确的起点开始,一个不漏地一直读到终止信号。
④ 遗传密码子不重叠,在多核苷酸链上任何两个相邻的密码子不共用任何核苷酸。
⑤ 密码子具有简并性:除了甲硫氨酸和色氨酸外,每一个氨基酸都至少有两个密码子。这样可以在一定程度内,使氨基酸序列不会因为某一个碱基被意外替换而导致氨基酸错误。
⑥ 密码子阅读与翻译具有一定的方向性:从5'端到3'端。
⑦有起始密码子和终止密码子,起始密码子有两种,一种是甲硫氨酸(AUG),一种是缬氨酸(GUG),而终止密码子(有3个,分别是UAA、UAG、UGA)没有相应的转运核糖核酸(tRNA)存在,只供释放因子识别来实现翻译的终止。
在信使RNA中,碱基代码A代表腺嘌呤,G代表鸟嘌呤,C代表胞嘧啶,U代表尿嘧啶(注意:RNA与DNA不同,RNA没有胸腺嘧啶T,取而代之的是尿嘧啶U,按照碱基互补配对原则,U与A形成配对)。
起源
除了少数的不同之外,地球上已知生物的遗传密码均非常接近;因此根据演化论,遗传密码应在生命历史中很早期就出现。现有的证据表明遗传密码的设定并非是随机的结果,对此有以下的可能解释 :
最近一项研究显示,一些氨基酸与它们相对应的密码子有选择性的化学结合力(立体化学假说,stereochemical hypothesis),这显示现在复杂的蛋白质制造过程可能并非一早存在,最初的蛋白质可能是直接在核酸上形成。但也有学者认为,氨基酸和相应编码的忠实性反映了氨基酸生物合成路径的相似性,并非物理化学性质的相似性(共进化假说,co-evolution hypothesis)。
谢平指出,遗传密码子是生化系统的一部分,因此,必须与生化系统的演化相关联,而生化系统的核心是ATP,只有它才能建立起核酸和蛋白质之间的联系(ATP中心假说,ATP-centric hypothesis) :ATP(a)是光能转化成化学能的终端,(b)导演了一系列的生化循环(如卡尔文循环、糖酵解和三羧酸循环等)及元素重组,(c)它通过自身的转化与缩合将错综复杂的生命过程信息化--筛选出用4种碱基编码20多个氨基酸的三联体密码子系统、精巧地构建了一套遗传信息的保存、复制、转录和翻译以及多肽链的生产体系,(d)演绎出蛋白质与核酸互为因果的反馈体系,在个体生存的方向性筛选中,构筑了对细胞内成百上千种同步发生的生化反应进行秩序化管控(自组织)的复杂体系与规则,并最终建立起个性生命的同质化传递机制--遗传 。

原始的遗传密码可能比今天简单得多,随着生命演化制造出新的氨基酸再被利用而令遗传密码变得复杂。虽然不少证据证明这观点,但详细的演化过程仍在探索之中,。 经过自然选择,现时的遗传密码减低了突变造成的不良影响。即,遗传密码是由选择(selection)、历史(history)和化学(chemistry)三个因素在不同阶段起作用的(综合进化假说) 。
作用
密码表
首先,密码表不是生物的事实。而是基于已有的20个必需氨基酸首字母缩写,添加缺如的6个字母后得到的。依次根据氨基酸三字母缩写,中文译名拼音首字母寻找相关,再以其中密码子简并性(即重复性)最强的氨基酸为首选进行替代,具体变换为:
GCA,GCG: A→B
AGA,AGG: R→J
CCA,CCG: P→O
UUA,UUG: L→U
GUA,GUG: V→X
CAC : H→Z
对终止密码子亦进行了调整。
需要强调,这一编码方案忽略了既有的B、Z的使用,以及忽略了终止密码子间真实的强弱性。
正向翻译备选方案
A: GCU, GCC.
B: GCA, GCG.
C: UGU, UGC.
D: GAU, GAC.
E: GAA, GAG.
F: UUU, UUC.
G: GGU, GGC, GGA, GGG.
H: CAU.
I: AUU, AUC, AUA.
J: AGA, AGG.
K: AAA, AAG.
L: CUU, CUC, CUA, CUG.
M: AUG.
N: AAU, AAC.
O: CCA, CCG.
P: CCU, CCC.
Q: CAA, CAG.

R: CGU, CGC, CGA, CGG.
S: UCU, UCC, UCA, UCG, AGU, AGC.
T: ACU, ACC, ACA, ACG.
U: UUA, UUG.
V: GUU, GUC.
W: UGG.
X: GUA, GUG.
Y: UAU, UAC.
Z: CAC.
起始符:AUG【与M的编码相同,但之后需加空格□(UAA)】
空格□:UAA
断句符:UAG
终止符:UGA反向翻译:见图"修改后的密码表"
氨基酸特性
第 一 位 碱 基 U
UUU (Phe/F)苯丙氨酸
UUC (Phe/F)苯丙氨酸
UUA (Leu/L)亮氨酸
UUG (Leu/L)亮氨酸
UCU (Ser/S)丝氨酸

UCC (Ser/S)丝氨酸
UCA (Ser/S)丝氨酸
UCG (Ser/S)丝氨酸
UAU (Tyr/Y)酪氨酸
UAC (Tyr/Y)酪氨酸
UAA (终止)
UAG (终止)
UGU (Cys/C)半胱氨酸
UGC (Cys/C)半胱氨酸
UGA (终止)
UGG (Trp/W)色氨酸
第 一 位 碱 基 C
CUU (Leu/L)亮氨酸
CUC (Leu/L)亮氨酸
CUA (Leu/L)亮氨酸
CUG (Leu/L)亮氨酸
CCU (Pro/P)脯氨酸
CCC (Pro/P)脯氨酸
CCA (Pro/P)脯氨酸
CCG (Pro/P)脯氨酸
CAU (His/H)组氨酸
CAC (His/H)组氨酸
CAA (Gln/Q)谷氨酰胺
CAG (Gln/Q)谷氨酰胺
CGU (Arg/R)精氨酸
CGC (Arg/R)精氨酸
CGA (Arg/R)精氨酸
CGG (Arg/R)精氨酸
第 一 位 碱 基 A
AUU (Ile/I)异亮氨酸
AUC (Ile/I)异亮氨酸
AUA (Ile/I)异亮氨酸
AUG (Met/M)甲硫氨酸(起始)
ACU (Thr/T)苏氨酸
ACC (Thr/T)苏氨酸
ACA (Thr/T)苏氨酸
ACG (Thr/T)苏氨酸
AAU (Asn/N)天冬酰胺
AAC (Asn/N)天冬酰胺
AAA (Lys/K)赖氨酸
AAG (Lys/K)赖氨酸
AGU (Ser/S)丝氨酸
AGC (Ser/S)丝氨酸
AGA (Arg/R)精氨酸
AGG (Arg/R)精氨酸
第 一 位 碱 基 G
GUU (Val/V)缬氨酸
GUC (Val/V)缬氨酸
GUA (Val/V)缬氨酸
GCU (Ala/A)丙氨酸
GCC (Ala/A)丙氨酸
GAU (Asp/D)天冬氨酸
GAC (Asp/D)天冬氨酸
GAA (Glu/E)谷氨酸
GGU (Gly/G)甘氨酸
GGC (Gly/G)甘氨酸
GCA (Ala/ A)丙氨酸
GCG (Ala/A)丙氨酸
GUG (Val/V)缬氨酸
GAG (Glu/E)谷氨酸
GGG (Gly/G)甘氨酸G)
语法及举例
语法:
a.以AUG表示进入正式信息编码区;
b.空格 (□) 用 UAA;
c.逗号或其它文章内断续标点用 UAG;
d.编码结束(最后一个句号)用 UGA表示;
e. 默认为表达英语,如果需要表达其它语种,可以在起始信号(5'端)前延长6个碱基,编码语言使用语言的国家双字母缩写,如拼音加注CN,日语假名罗马体加注JP等。
举例:
通用语言:I love U.
中转:(Start)□I□love□U.
最终的核酸语言:AUG UAA AUU UAA CUG CCA GUC GAA UAA UUA UGA
可以和连鹤或串珠等实体结构结合来进行空间变换,加强教学效果。但需要使使用者谨记这套密码系统是修改过的。
破解历史
尼伦伯格(M.W.Nirenberg,1927-2010 )和马太(H.Matthaei)破译出了第一个遗传密码。
尼伦伯格和马太采用了蛋白质的体外合成技术。他们在每个试管中分别加入一种氨基酸,再加入除去了DNA和mRNA的细胞提取液,以及人工合成的RNA多聚尿嘧啶核苷酸,结果加入了苯丙氨酸的试管中出现了多聚苯丙氨酸的肽链。实验结果说明,多聚尿嘧啶核苷酸导致了多聚苯丙氨酸的合成,而多聚尿嘧啶核苷酸的碱基序列是由许多个尿嘧啶组成的(UUUUUUUU......),可见尿嘧啶的碱基序列编码由苯丙氨酸组成的肽链。结合克里克得出的3个碱基决定1个氨基酸的实验结论,与苯丙氨酸对应的密码子应该是UUU。在此后的六七年里,科学家沿着蛋白质体外合成的思路,不断地改进实验方法,破译出了全部的密码子,并编辑出了密码子表。
区别联系
遗传信息、密码子、反密码子的区别与联系

遗传信息是指DNA分子中基因上的脱氧核苷(碱基)排列顺序,密码子是指信使RNA上决定一个氨基酸的三个相邻碱基的排列顺序,反密码子是指转运RNA上的一端的三个碱基排列顺序。其联系是:DNA(基因)的遗传信息通过转录传递到信使RNA上,转运RNA一端携带氨基酸,另一端反密码子与信使RNA上的密码子(碱基)配对。