遗传密碼规则,核鹼基 序列編碼所對應的氨基酸 。
在RNA 分子上一系列的密碼子(codons),每個密碼子由3個含氮鹼基 ,對應單個氨基酸 。核苷酸使用縮寫字母A、U、G和C。信使RNA 採用U(尿嘧啶 )代替DNA 採用T(胸腺嘧啶 )。此信使RNA分子將責成一個核糖體 根據這個密碼合成的蛋白質 。
遺傳密碼 [ 1] [ 2] (Genetic code)又稱遺傳編碼 ,是遺傳信息的傳遞規則,將DNA 或mRNA 序列以三個核苷酸 為一組的“密码子 (codon)”轉譯 為蛋白質 的氨基酸 序列,以用於蛋白質合成 。幾乎所有的生物 都使用同樣的遺傳密碼,稱為“標準遺傳密碼”;即使是非細胞結構的病毒 ,它們也是使用標準遺傳密碼。有些具感染性的致病因子,使用一些稍微不同的遺傳密碼,如朊毒體 以蛋白質為遺傳密碼。密码子简并性是遗传密码的突出特征。[ 3]
破解歷史
遗传密码
自從發現了DNA 的結構,科學家便開始致力研究有關製造蛋白質的秘密。伽莫夫 通过计算指出需要以三個核酸一組才能為20個氨基酸編碼[ 4] 。1961年,弗朗西斯·克里克 对T4 噬菌体 的某个基因中增加或删除碱基对。以该基因最终合成蛋白的情况。证明“以三个碱基对编码一个氨基酸”,以及遗传密码有固定起点,且以非重叠无分隔符形式阅读的特点。美國國家衛生院 的J·海因里希·马特伊 與馬歇爾·沃倫·尼倫伯格 在無細胞系統 環境下,把一條只由尿嘧啶 (U)組成的RNA 轉釋成一條只有苯丙氨酸(Phe)的多肽 ,由此破解了首個密碼子(UUU -> Phe )[ 5] 。隨後哈爾·葛賓·科拉納 破解了其它密碼子,接著羅伯特·W·霍利 發現了負責轉錄 過程的tRNA 。1968年,科拉納、霍利和尼倫伯格分享了諾貝爾生理學或醫學獎 。
基因組的表達
一個生物體攜帶的遺傳信息-即基因組 -被記錄在DNA或RNA分子中,分子中每個有功能的單位被稱作基因 。每個基因均是由一連串單核苷酸 組成。每個單核苷酸均由鹼基 ,戊糖 (即五碳糖 ,DNA中為脫氧核糖 ,RNA中為核糖 )和磷酸 三部分組成。碱基不同構成了不同的單核苷酸。組成DNA的碱基有腺嘌呤 (A),鳥嘌呤 (G),胞嘧啶 (C)及胸腺嘧啶 (T)。組成RNA的碱基以尿嘧啶 (U)代替了胸腺嘧啶(T)。三個單核苷酸 形成一組密碼子 ,而每個密碼子代表一個氨基酸 或停止訊號。
製造蛋白質的過程中,基因先被從DNA 轉錄 為對應的RNA 範本,即信使RNA (mRNA)。接下來在核糖體 和轉移RNA (tRNA)以及一些酶 的作用下,由該RNA範本轉譯 成為氨基酸 組成的鏈(多肽 ),然後經過轉譯後修飾 形成蛋白質。詳情參閱轉譯 。
因為密碼子由三個核苷酸組成,故一共有43 =64種密碼子。例如,RNA序列UAGCAAUCC包含了三個密碼子:UAG,CAA和UCC。這段RNA編碼代表了長度為3個氨基酸的一段蛋白質序列。(DNA也有類似的序列,但是以T代替了U)。
標準遺傳密碼如下表所示:由3個鹼基對應到氨基酸的密碼子表以及由氨基酸對應到3個鹼基的反密碼子表。
密码子表
RNA密码子表
标准遗传密码
碱基1
碱基2
碱基3
U
C
A
G
U
UUU
(Phe/F)
苯丙氨酸
UCU
(Ser/S)
丝氨酸
UAU
(Tyr/Y)
酪氨酸
UGU
(Cys/C)
半胱氨酸
U
UUC
UCC
UAC
UGC
C
UUA
(Leu/L)
亮氨酸
UCA
UAA[B]
终止 (赭石 )
UGA[B]
终止 (蛋白石 )
A
UUG
UCG
UAG[B]
终止 (琥珀 )
UGG
(Trp/W)色氨酸
G
C
CUU
CCU
(Pro/P)
脯氨酸
CAU
(His/H)
组氨酸
CGU
(Arg/R)
精氨酸
U
CUC
CCC
CAC
CGC
C
CUA
CCA
CAA
(Gln/Q)
谷氨酰胺
CGA
A
CUG
CCG
CAG
CGG
G
A
AUU
(Ile/I)
异亮氨酸
ACU
(Thr/T)
苏氨酸
AAU
(Asn/N)
天冬酰胺
AGU
(Ser/S)
丝氨酸
U
AUC
ACC
AAC
AGC
C
AUA
ACA
AAA
(Lys/K)
赖氨酸
AGA
(Arg/R)
精氨酸
A
AUG[A]
(Met/M)
甲硫氨酸
ACG
AAG
AGG
G
G
GUU
(Val/V)
缬氨酸
GCU
(Ala/A)
丙氨酸
GAU
(Asp/D)
天冬氨酸
GGU
(Gly/G)
甘氨酸
U
GUC
GCC
GAC
GGC
C
GUA
GCA
GAA
(Glu/E)
谷氨酸
GGA
A
GUG
GCG
GAG
GGG
G
A 密码子AUG同时编码甲硫氨酸并作为起始点:在信使RNA 的编码区里,首个ATG的出现标志着蛋白质翻译的开始。[ 6]
B ^ ^ ^ 标示终止密码子为琥珀、赭石和蛋白石的历史原因可在悉尼·布伦纳(Sydney Brenner )的自传[ 7] 和鲍勃·埃德加(Bob Edgar )的一篇历史性文章中找到。[ 8]
反向密码子表(使用IUPAC符号 缩写)
氨基酸
密码子
缩写
氨基酸
密码子
缩写
Ala/A
GCU、GCC、GCA、GCG
GCN
Leu/L
UUA、UUG、CUU、CUC、CUA、CUG
YUR、CUN
Arg/R
CGU、CGC、CGA、CGG、AGA、AGG
CGN、MGR
Lys/K
AAA、AAG
AAR
Asn/N
AAU、AAC
AAY
Met/M
AUG
Asp/D
GAU、GAC
GAY
Phe/F
UUU、UUC
UUY
Cys/C
UGU、UGC
UGY
Pro/P
CCU、CCC、CCA、CCG
CCN
Gln/Q
CAA、CAG
CAR
Ser/S
UCU、UCC、UCA、UCG、AGU、AGC
UCN、AGY
Glu/E
GAA、GAG
GAR
Thr/T
ACU、ACC、ACA、ACG
ACN
Gly/G
GGU、GGC、GGA、GGG
GGN
Trp/W
UGG
His/H
CAU、CAC
CAY
Tyr/Y
UAU、UAC
UAY
Ile/I
AUU、AUC、AUA
AUH
Val/V
GUU、GUC、GUA、GUG
GUN
起始
AUG
终止
UAA、UGA、UAG
UAR、URA
DNA密码子表
DNA密码子表与RNA密码子表基本相同,除了使用T 来替代U 。
技術細節
起始和終止密碼子
蛋白質的轉譯從初始化密碼子(起始密碼子 )開始,但亦需要適當的初始化序列和起始因子 才能使mRNA和核糖體結合。最常見的起始密碼子為AUG,其同時編碼的氨基酸在細菌為甲醯甲硫氨酸 ,在真核生物為甲硫氨酸 ,但在個別情況其它一些密碼子也具有起始的功能。
在經典遺傳學中,終止密碼子 各有名稱:UAG為琥珀 (amber),UGA為蛋白石 (opal),UAA為赭石 (ochre)。這些名稱來源於最初發現到這些終止密碼子的基因的名稱。終止密碼子使核醣體和釋放因子 結合,使多肽 從核醣體 分離而結束轉譯的程式。另外,在哺乳動物的線粒體中,AGA和AGG也充當終止密碼子。
密碼子簡併性
大部分密碼子具有簡併性,即兩個或者多個密碼子編碼同一氨基酸。簡併的密碼子通常只有第三位元碱基不同,例如,GAA和GAG都編碼穀氨醯胺 。如果密码子前两位相同,而且不管密碼子的第三位為哪種核苷酸,都編碼同一種氨基酸,則稱之為四重簡併密碼子 (fourfold degenerate codons);如果三位中的某一位有两种核苷酸使该密码子編碼同一種氨基酸,則稱之為二重簡併密碼子 (twofold degenerate codons),一般第三位上兩種等價的核苷酸同為嘌呤 (A/G,或R)或者嘧啶 (C/T,或Y)。只有兩種氨基酸僅由一個密碼子編碼,一個是甲硫氨酸,由AUG編碼,同時也是起始密碼子;另一個是色氨酸 ,由UGG編碼。
遺傳密碼的這些性質可使基因更加耐受點突變 。例如,四重簡併密碼子可以容忍密碼子第三位元的任何變異;二重簡併密碼子使三分之一可能的第三位的變異不影響蛋白質序列。由於轉換變異 (嘌呤變為嘌呤或者嘧啶變為嘧啶)比顛換變異 (嘌呤變為嘧啶或者嘧啶變為嘌呤)的可能性更大,因此二重簡併密碼子也具有很強的對抗突變的能力。不影響氨基酸序列的突變稱為沉默突變 (英语 ) 。
簡併性的出現是由於tRNA反密碼子 的第一位碱基可以和mRNA構成擺動碱基對 ,常見的情況為反密碼子上的次黃嘌呤 (I),以及和密碼子形成非標準的U-G配對。
另一種有助對抗點突變 的情況,是NUN(N代表任何核苷酸)傾向於代表疏水性 氨基酸,故此即使出現突變,仍有較大機會維持蛋白質的親水度 ,減低致命破壞的可能。
閱讀框
“密碼子”是由閱讀的起始位點決定的。例如,一段序列GGGAAACCC,如果由第一個位置開始讀,包括3個密碼子GGG,AAA和CCC。如果從第二位開始讀,包括GGA和AAC(忽略不完整的密碼子)。如果從第三位開始讀,則為GAA和ACC。故此每段序列都包括多個閱讀框 ,每個都能產生不同的氨基酸序列(在上例中,相應為Gly-Lys-Pro,Gly-Asp,和Glu-Thr)。而因為DNA的雙螺旋結構,每段DNA實際上有六個閱讀框。
實際的框架是由起始密碼子 確定,通常是mRNA序列上第一個出現的AUG。
破壞閱讀框架的變異(例如,插入或刪除1個或2個核苷酸)稱為閱讀框變異 ,通常會嚴重影響到蛋白質的功能,故此並不常見,因為它們通常不能在演化 中存活下來。
非標準的遺傳密碼
雖然遺傳密碼在不同生命之間有很強的一致性,但亦存在非標準的遺傳密碼。在有「細胞能量工廠」之稱的線粒體 中,便有和標準遺傳密碼數個相異的之處,甚至不同生物的線粒體有不同的遺傳密碼。支原體 會把UGA轉譯為色氨酸。纖毛蟲 則把UAG(有時候還有UAA)轉譯為穀氨醯胺(一些綠藻 也有同樣現象),或把UGA轉譯為半胱氨酸。一些酵母 會把GUG轉譯為絲氨酸。在一些罕見情況,一些蛋白質會有AUG以外的起始密碼子。
真菌、原生生物和人以及其它動物的粒線體中的遺傳密碼 與標準遺傳密碼的差異,主要變化如下:
密码子
通常的作用
例外的作用
所屬的生物
UGA
中止編碼
色氨酸 編碼
人、牛、酵母線粒體,支原體(Mycoplasma)基因組,如Capricolum
UGA
中止編碼
半胱氨酸 編碼
一些纖毛蟲(ciliate)細胞核基因組,如遊纖蟲屬(Euplotes)
UGA
中止編碼
硒半胱氨酸 編碼
人,大鼠,小鼠等哺乳体系
AGR
精氨酸 編碼
中止編碼
大部分動物線粒體,脊椎動物線粒體
AGA
精氨酸 編碼
絲氨酸 編碼
果蠅線粒體
AUA
異亮氨酸 編碼
蛋氨酸 編碼
一些動物和酵母線粒體
UAA
中止編碼
穀氨醯胺 編碼
草履蟲、一些纖毛蟲(ciliate)細胞核基因組,如嗜熱四膜蟲(ThermophAilus tetrahymena )
UAG
中止編碼
谷氨酸 編碼
草履蟲核細胞核基因組
UAG
中止編碼
吡咯赖氨酸 編碼
甲烷八叠球菌(Methanosarcina barkeri )核基因組,表达转甲基酶(methyltransferase)
GUG
纈氨酸 編碼
絲氨酸 編碼
假絲酵母核基因組
AAA
賴氨酸 編碼
天冬氨酸 編碼
一些動物的線粒體,果蠅線粒體
CUG
亮氨酸 編碼
絲氨酸 編碼
白色念珠菌 (Candida albicans)等酵母的細胞核基因組
CUN
亮氨酸 編碼
蘇氨酸 編碼
酵母線粒體
按信使RNA的序列,在一些蛋白質裏停止密碼子會被翻譯成非標準的氨基酸,例如UGA轉譯為硒半胱氨酸 和UAG轉譯為吡咯賴氨酸 ,隨著對基因組序列加深瞭解,科學家可能還會發現其它非標準的轉譯方式,以及其它未知氨基酸在生物中的應用。
遺傳密碼的起源
除了少數的不同之外,地球 上已知生物的遺傳密碼均非常接近;這顯示遺傳密碼應在生命演化 的歷史中很早期就出現,並且證明了所有生物都源自共同祖先 。
現有的證據表明遺傳密碼的設定並非是隨機的結果,對此有以下的可能解釋1 :
最近一項研究顯示,一些氨基酸與它們相對應的密碼子有選擇性的化學結合力2 ,這顯示現在複雜的蛋白質製造過程可能並非一早存在,最初的蛋白質可能是直接在核酸上形成。
原始的遺傳密碼可能比今天簡單得多,隨著生命演化製造出新的氨基酸再被利用而令遺傳密碼變得複雜。雖然不少證據證明這觀點3 ,但詳細的演化過程仍在探索之中4 ,5 。
搖擺特性
1966年,弗朗西斯·克里克 提出了摆动假说 (英文:wobble hypothesis)。即一組密碼子 可對應多個反密碼子 。因為第三對鹼基對 有時不遵守配對原則 ,稱為搖擺鹼基對 。[ 5]
搖擺特性的碱基配对如下:
密碼子第三對鹼基
反密碼子第一對鹼基
G
C
U
A
A、G
U
C、U
G
摆动假说现已被多方实验证明。[ 5]
參考資料
^ 注解1: Knight, R.D.; Freeland S. J. and Landweber, L.F. (1999) The 3 Faces of the Genetic Code. Trends in the Biochemical Sciences 24 (6), 241-247.
^ 注解2: Knight, R.D. and Landweber, L.F. (1998). Rhyme or reason: RNA-arginine interactions and the genetic code. (页面存档备份 ,存于互联网档案馆 ) Chemistry & Biology 5 (9), R215-R220. PDF version of manuscript
^ 注解3: Brooks, Dawn J.; Fresco, Jacques R.; Lesk, Arthur M.; and Singh, Mona. (2002). Evolution of Amino Acid Frequencies in Proteins Over Deep Time: Inferred Order of Introduction of Amino Acids into the Genetic Code . Molecular Biology and Evolution 19 , 1645-1655.
^ 注解4: Amirnovin R. (1997) An analysis of the metabolic theory of the origin of the genetic code. Journal of Molecular Evolution 44 (5), 473-6.
^ 注解5: Ronneberg T.A.; Landweber L.F. and Freeland S.J. (2000) Testing a biosynthetic theory of the genetic code: Fact or artifact? (页面存档备份 ,存于互联网档案馆 ) Proceedings of the National Academy of Sciences, USA 97 (25), 13690-13695.
^ 注解6: Freeland S.J.; Wu T. and Keulmann N. (2003) The Case for an Error Minimizing Genetic Code. (页面存档备份 ,存于互联网档案馆 ) Orig Life Evol Biosph. 33 (4-5), 457-77.
其它參考資料
網路上有很多有關本題目的資料,由美國國家衛生院 提供NCBI Bookshelf 。
Griffiths, Anthony J.F.; Miller, Jeffrey H.; Suzuki, David T.; Lewontin, Richard C.; Gelbart, William M. (1999). Introduction to Genetic Analysis (7th ed.) . New York: W. H. Freeman & Co. ISBN 0-7167-3771-X
Alberts, Bruce; Johnson, Alexander; Lewis, Julian; Raff, Martin; Roberts, Keith; Walter, Peter. (2002). Molecular Biology of the Cell (4th ed.) . New York: Garland Publishing. ISBN 0-8153-3218-1
Lodish, Harvey; Berk, Arnold; Zipursky, S. Lawrence; Matsudaira, Paul; Baltimore, David; Darnell, James E. (1999). Molecular Cell Biology (4th ed.) . New York: W. H. Freeman & Co. ISBN 0-7167-3706-X
有關遺傳密碼演化的wiki (页面存档备份 ,存于互联网档案馆 )
NCBI網頁,有關遺傳密碼的詳細的說明 (页面存档备份 ,存于互联网档案馆 )
参考文献
相關條目
外部連結