Cod genetic: descriere, caracteristici, istoria cercetării. Cod genetic: proprietăți și funcții Ce este un cod genetic în informatică

Ele se aliniază în lanțuri și astfel produc secvențe de litere genetice.

Cod genetic

Proteinele aproape tuturor organismelor vii sunt construite din doar 20 de tipuri de aminoacizi. Acești aminoacizi sunt numiți canonici. Fiecare proteină este un lanț sau mai multe lanțuri de aminoacizi conectate într-o secvență strict definită. Această secvență determină structura proteinei și, prin urmare, toate proprietățile sale biologice.

C

CUU (Leu/L)Leucină
CUC (Leu/L)Leucină
CUA (Leu/L)Leucină
CUG (Leu/L)Leucină

În unele proteine, aminoacizii nestandard, cum ar fi selenocisteina și pirolizina, sunt inserați de un ribozom care citește codonul stop, în funcție de secvențele din ARNm. Selenocisteina este acum considerată al 21-lea, iar pirolizina al 22-lea, aminoacizi care alcătuiesc proteinele.

În ciuda acestor excepții, toate organismele vii au coduri genetice comune: un codon este format din trei nucleotide, unde primii doi codoni sunt traduși de tARN și ribozomi într-o secvență de aminoacizi;

Abateri de la codul genetic standard.
Exemplu Codon Sens normal Se citește ca:
Unele tipuri de drojdie Candida C.U.G. Leucina Serin
Mitocondriile, în special în Saccharomyces cerevisiae CU(U, C, A, G) Leucina Serin
Mitocondriile plantelor superioare CGG Arginina Triptofan
Mitocondriile (în toate organismele studiate fără excepție) U.G.A. Stop Triptofan
Mitocondriile la mamifere, Drosophila, S. cerevisiaeși multe protozoare AUA izoleucina Metionina = Start
procariote G.U.G. Valin Început
eucariote (rare) C.U.G. Leucina Început
eucariote (rare) G.U.G. Valin Început
Procariote (rare) UUG Leucina Început
eucariote (rare) A.C.G. Treonina Început
Mitocondriile mamiferelor AGC, AGU Serin Stop
mitocondriile Drosophila A.G.A. Arginina Stop
Mitocondriile mamiferelor AG(A, G) Arginina Stop

Istoria ideilor despre codul genetic

Cu toate acestea, la începutul anilor 60 ai secolului XX, noi date au relevat inconsecvența ipotezei „cod fără virgule”. Apoi experimentele au arătat că codonii, considerați fără sens de către Crick, ar putea provoca sinteza proteinelor in vitro, iar până în 1965 a fost stabilit semnificația tuturor celor 64 de tripleți. S-a dovedit că unii codoni sunt pur și simplu redundanți, adică o serie intreaga aminoacizii sunt codificați de doi, patru sau chiar șase tripleți.

Vezi de asemenea

Note

  1. Codul genetic acceptă inserția țintită a doi aminoacizi de către un codon. Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN. Ştiinţă. 9 ianuarie 2009;323(5911):259-61.
  2. Codonul AUG codifică metionina, dar în același timp servește ca un codon de început - traducerea începe de obicei cu primul codon AUG al ARNm.
  3. NCBI: „Codurile genetice”, compilat de Andrzej (Anjay) Elzanowski și Jim Ostell
  4. Jukes TH, Osawa S, Codul genetic din mitocondrii și cloroplaste., Experiență. 1990 Dec 1;46(11-12):1117-26.
  5. Osawa S, Jukes TH, Watanabe K, Muto A (martie 1992). „Dovezi recente pentru evoluția codului genetic”. Microbiol. Rev. 56 (1): 229–64. PMID 1579111.
  6. SANGER F. (1952). „Dispunerea aminoacizilor în proteine”. Adv Protein Chem. 7 : 1-67. PMID 14933251.
  7. M. Ichas Cod biologic. - Lumea, 1971.
  8. WATSON JD, CRICK FH. (aprilie 1953). „Structura moleculară a acizilor nucleici; o structură pentru acidul nucleic dezoxiriboză”. Natură 171 : 737-738. PMID 13054692.
  9. WATSON JD, CRICK FH. (mai 1953). „Implicații genetice ale structurii acidului dezoxiribonucleic”. Natură 171 : 964-967. PMID 13063483.
  10. Crick FH. (aprilie 1966). „Codul genetic - ieri, azi și mâine.” Cold Spring Harb Symp Quant Biol.: 1-9. PMID 5237190.
  11. G. GAMOW (februarie 1954). „Posibilă relație între acidul dezoxiribonucleic și structurile proteice”. Natură 173 : 318. DOI:10.1038/173318a0. PMID 13882203.
  12. GAMOW G, RICH A, YCAS M. (1956). „Problema transferului de informații de la acizii nucleici la proteine”. Adv Biol Med Phys. 4 : 23-68. PMID 13354508.
  13. Gamow G, Ycas M. (1955). „CORELAȚIA STATISTICĂ A COMPOZIȚIEI PROTEINELOR ȘI A ACIDULUI RIBONUCLEIC. " Proc Natl Acad Sci U S A. 41 : 1011-1019. PMID 16589789.
  14. Crick FH, Griffith JS, Orgel LE. (1957). „CODURI FĂRĂ virgule. " Proc Natl Acad Sci U S A. 43 : 416-421. PMID 16590032.
  15. Hayes B. (1998). „Invenția codului genetic”. (Retipărire PDF). om de știință american 86 : 8-14.

Literatură

  • Azimov A. Cod genetic. De la teoria evoluției la descifrarea ADN-ului. - M.: Tsentrpoligraf, 2006. - 208 p. - ISBN 5-9524-2230-6.
  • Ratner V. A. Genetic code as a system - Soros educational journal, 2000, 6, No. 3, pp. 17-22.
  • Crick FH, Barnett L, Brenner S, Watts-Tobin RJ. Natura generală a codului genetic pentru proteine ​​- Nature, 1961 (192), pp. 1227-32

Legături

  • Cod genetic- articol din Marea Enciclopedie Sovietică

Fundația Wikimedia.

2010. Capitol Natura matriceală a reacțiilor de biosinteză. Biosinteza proteinelor și acizilor nucleici

Peste 6 miliarde de oameni trăiesc deja pe Pământ. În afară de cele 25-30 de milioane de perechi de gemeni identici, genetic toți oamenii sunt diferiți. Aceasta înseamnă că fiecare dintre ei este unic, are caracteristici ereditare unice, trăsături de caracter, abilități, temperament și multe alte calități. Ce determină astfel de diferențe între oameni? Desigur, diferențele dintre acestea genotipuri , adică seturi de gene ale unui organism dat. Este unic pentru fiecare persoană, la fel cum genotipul unui animal sau al unei plante individuale este unic. Dar trăsături genetice această persoanăîntruchipat în proteine ​​sintetizate în corpul său. În consecință, structura proteinei unei persoane diferă, deși foarte puțin, de proteina altei persoane. De aceea se pune problema transplantului de organe, de aceea apar reacții alergice la alimente, mușcături de insecte, polen de plante etc. Asta nu înseamnă că oamenii nu au exact aceleași proteine. Proteinele care îndeplinesc aceleași funcții pot fi aceleași sau pot diferi doar puțin prin unul sau doi aminoacizi unul de celălalt. Dar nu există oameni pe Pământ (cu excepția gemenilor identici) care să aibă toate aceleași proteine.

Informațiile despre structura primară a unei proteine ​​sunt codificate ca o secvență de nucleotide într-o secțiune a unei molecule de ADN - o genă. Gene este o unitate de informație ereditară a unui organism. Fiecare moleculă de ADN conține multe gene. Totalitatea tuturor genelor unui organism o constituie genotip.

Codarea informațiilor ereditare are loc folosind cod genetic . Codul este similar cu binecunoscutul cod Morse, care codifică informațiile cu puncte și liniuțe. Codul Morse este universal pentru toți operatorii radio, iar diferențele constau doar în traducerea semnalelor în diferite limbi. Codul genetic este, de asemenea, universal pentru toate organismele și diferă doar prin alternanța nucleotidelor care formează gene și codifică proteine ​​ale unor organisme specifice.

Proprietățile codului genetic : tripletitate, specificitate, universalitate, redundanță și nesuprapunere.

Deci, care este codul genetic? Inițial este format din tripleți ( tripleti ) Nucleotide ADN combinate în secvențe diferite. De exemplu, AAT, GCA, ACG, THC etc. Fiecare triplet de nucleotide codifică un aminoacid specific care va fi integrat în lanțul polipeptidic. De exemplu, tripletul CGT codifică aminoacidul alanină, iar tripletul AAG codifică aminoacidul fenilalanina. Există 20 de aminoacizi și există 64 de posibilități de combinare a patru nucleotide în grupuri de trei. Prin urmare, patru nucleotide sunt suficiente pentru a codifica 20 de aminoacizi. Acesta este motivul pentru care un aminoacid poate fi codificat de mai multe triplete. Unii tripleți nu codifică deloc aminoacizi, dar încep sau opresc biosinteza proteinelor.

Se ia în considerare codul genetic real secvența de nucleotide dintr-o moleculă de ARNm, deoarece elimină informații din ADN ( procesul de transcriere ) și îl traduce într-o secvență de aminoacizi din moleculele proteinelor sintetizate ( procesul de difuzare ). Compoziția ARNm include nucleotidele ACGU. Tripleții de nucleotide ARNm se numesc codoni. Exemplele date deja de tripleți ADN pe ARNm vor arăta astfel - tripletul CGT pe ARNm va deveni un triplet GCA, iar tripletul ADN - AAG - va deveni un triplet UUC. Codonii ARNm sunt cei care reflectă codul genetic din înregistrare. Deci, codul genetic este triplet, universal pentru toate organismele de pe pământ, degenerat (fiecare aminoacid este criptat de mai mult de un codon). Între gene există semne de punctuație - acestea sunt triplete, care sunt numite codoni de oprire . Ele semnalează sfârșitul sintezei unui lanț polipeptidic. Există tabele cu codul genetic pe care trebuie să le puteți utiliza pentru a descifra codonii ARNm și pentru a construi lanțuri de molecule de proteine ​​(ADN complementar între paranteze).

Astăzi nu este un secret pentru nimeni că programul de viață al tuturor organismelor vii este scris pe o moleculă de ADN. Cel mai simplu mod de a imagina o moleculă de ADN este ca o scară lungă. Stâlpii verticali ai acestei scări sunt formați din molecule de zahăr, oxigen și fosfor. Toate informațiile importante de funcționare din moleculă sunt scrise pe treptele scării - acestea constau din două molecule, fiecare fiind atașată la unul dintre stâlpii verticali. Aceste molecule – bazele azotate – se numesc adenină, guanină, timină și citozină, dar de obicei sunt desemnate pur și simplu prin literele A, G, T și C. Forma acestor molecule le permite să formeze legături – scări complete – numai de un anumit tip. Acestea sunt conexiuni între bazele A și T și între bazele G și C (perechea astfel formată se numește "pereche de baze"). Nu pot exista alte tipuri de conexiuni într-o moleculă de ADN.

Coborând treptele de-a lungul unei catene a unei molecule de ADN, obțineți o secvență de baze. Acest mesaj sub forma unei secvențe de baze determină fluxul reacțiilor chimice în celulă și, în consecință, caracteristicile organismului care posedă acest ADN. Conform dogmei centrale a biologiei moleculare, molecula de ADN codifică informații despre proteine, care, la rândul lor, acționează ca enzime ( cm. Catalizatorii și enzimele) reglează totul reactii chimiceîn organismele vii.

Corespondența strictă dintre secvența perechilor de baze dintr-o moleculă de ADN și secvența de aminoacizi care alcătuiesc enzimele proteice se numește cod genetic. Codul genetic a fost descifrat la scurt timp după descoperirea structurii dublu catenare a ADN-ului. Se știa că molecula nou descoperită informativ, sau matrice ARN-ul (ARNm sau ARNm) poartă informații scrise pe ADN. Biochimiștii Marshall W. Nirenberg și J. Heinrich Matthaei din Institutul National Health din orașul Bethesda de lângă Washington, DC, a efectuat primele experimente care au dus la soluționarea codului genetic.

Ei au început prin a sintetiza molecule artificiale de ARNm constând numai din baza azotată repetată uracil (care este un analog al timinei, „T”, și formează legături numai cu adenina, „A”, din molecula de ADN). Ei au adăugat acești ARNm în eprubete cu un amestec de aminoacizi, iar în fiecare tub doar unul dintre aminoacizi a fost marcat cu o etichetă radioactivă. Cercetătorii au descoperit că ARNm pe care l-au sintetizat artificial a inițiat formarea proteinelor într-o singură eprubetă, care conținea aminoacidul marcat fenilalanină. Așa că au stabilit că secvența „—U—U—U—” de pe molecula de ARNm (și, prin urmare, secvența echivalentă „—A—A—A—” de pe molecula de ADN) codifică o proteină constând numai din aminoacid fenilalanina. Acesta a fost primul pas spre descifrarea codului genetic.

Astăzi se știe că trei perechi de baze ale unei molecule de ADN (acest triplet se numește codon) codifică un aminoacid dintr-o proteină. Efectuând experimente similare celor descrise mai sus, geneticienii au descifrat în cele din urmă întregul cod genetic, în care fiecăruia dintre cei 64 de codoni posibili corespunde unui aminoacid specific.

Cursul 5. Cod genetic

Definiția conceptului

Codul genetic este un sistem de înregistrare a informațiilor despre secvența de aminoacizi din proteine ​​folosind secvența de nucleotide din ADN.

Deoarece ADN-ul nu este implicat direct în sinteza proteinelor, codul este scris în limbajul ARN. ARN-ul conține uracil în loc de timină.

Proprietățile codului genetic

1. Tripletate

Fiecare aminoacid este codificat de o secvență de 3 nucleotide.

Definiție: un triplet sau codon este o secvență de trei nucleotide care codifică un aminoacid.

Codul nu poate fi monoplet, deoarece 4 (numărul de nucleotide diferite din ADN) este mai mic de 20. Codul nu poate fi dublu, deoarece 16 (numărul de combinații și permutări a 4 nucleotide din 2) este mai mic de 20. Codul poate fi triplet, deoarece 64 (numărul de combinații și permutări de la 4 la 3) este mai mare de 20.

2. Degenerescenta.

Toți aminoacizii, cu excepția metioninei și triptofanului, sunt codificați de mai mult de un triplet:

2 AK pentru 1 triplet = 2.

9 AK, câte 2 tripleți = 18.

1 AK 3 tripleți = 3.

5 AK din 4 tripleți = 20.

3 AK din 6 tripleți = 18.

Un total de 61 de tripleți codifică 20 de aminoacizi.

3. Prezența semnelor de punctuație intergenice.

Definiţie:

Gene - o secțiune de ADN care codifică un lanț polipeptidic sau o moleculă ARNt, rARN sausARN.

GeneleARNt, ARNr, sARNproteinele nu sunt codificate.

La sfârșitul fiecărei gene care codifică o polipeptidă există cel puțin unul dintre cei 3 tripleți care codifică codoni stop ARN sau semnale stop. În ARNm au următoarea formă: UAA, UAG, UGA . Ei termină (încheie) difuzarea.

În mod convențional, codonul aparține și semnelor de punctuație AUG - primul după secvența lider. (Vezi Lectura 8) Funcționează ca o literă mare. În această poziție, codifică formilmetionina (la procariote).

4. Neambiguitate.

Fiecare triplet codifică doar un aminoacid sau este un terminator de traducere.

Excepția este codonul AUG . La procariote, în prima poziție (litera mare) codifică formilmetionina, iar în orice altă poziție codifică metionina.

5. Compactitatea sau absența semnelor de punctuație intragenice.
În cadrul unei gene, fiecare nucleotidă face parte dintr-un codon semnificativ.

În 1961, Seymour Benzer și Francis Crick au demonstrat experimental natura tripletă a codului și compactitatea acestuia.

Esența experimentului: mutația „+” - inserarea unei nucleotide. Mutația „-” - pierderea unei nucleotide. O singură mutație „+” sau „-” la începutul unei gene strică întreaga genă. O mutație dublă „+” sau „-” strică, de asemenea, întreaga genă.

O triplă mutație „+” sau „-” la începutul unei gene strică doar o parte a acesteia. O mutație cvadruplă „+” sau „-” strică din nou întreaga genă.

Experimentul demonstrează că Codul este transcris și nu există semne de punctuație în interiorul genei. Experimentul a fost efectuat pe două gene fagice adiacente și a arătat, în plus, prezența semnelor de punctuație între gene.

6. Versatilitate.

Codul genetic este același pentru toate creaturile care trăiesc pe Pământ.

În 1979, Burrell s-a deschis ideal codul mitocondriilor umane.

Definiţie:

„Ideal” este un cod genetic în care este îndeplinită regula de degenerescență a codului de cvasi-dublu: dacă în două triplete primele două nucleotide coincid, iar a treia nucleotide aparțin aceleiași clase (ambele sunt purine sau ambele sunt pirimidine) , atunci acești tripleți codifică același aminoacid.

Există două excepții de la această regulă în codul universal. Ambele abateri de la codul ideal în universal se referă la puncte fundamentale: începutul și sfârșitul sintezei proteinelor:

Codon

Universal

cod

Codurile mitocondriale

Vertebrate

Nevertebrate

Drojdie

Plante

STOP

STOP

Cu UA

A G A

STOP

STOP

Substituțiile 230 nu schimbă clasa aminoacidului codificat. la lacrimabilitate.

În 1956, Georgiy Gamow a propus o variantă a codului suprapus. Conform codului Gamow, fiecare nucleotidă, începând de la a treia din genă, face parte din 3 codoni. Când codul genetic a fost descifrat, s-a dovedit că nu se suprapune, adică. Fiecare nucleotidă face parte dintr-un singur codon.

Avantajele unui cod genetic suprapus: compactitate, dependență mai mică a structurii proteinei de inserția sau deleția unei nucleotide.

Dezavantaj: structura proteinei este foarte dependentă de înlocuirea nucleotidelor și de restricțiile asupra vecinilor.

În 1976, ADN-ul fagului φX174 a fost secvențiat. Are ADN circular monocatenar format din 5375 nucleotide. Fagul era cunoscut că codifică 9 proteine. Pentru 6 dintre ele au fost identificate gene situate una după alta.

S-a dovedit că există o suprapunere. Gena E este localizată în întregime în interiorul genei D . Codonul său de pornire rezultă dintr-o schimbare a cadrului a unei nucleotide. Gene J începe acolo unde se termină gena D . Codonul de pornire al genei J se suprapune cu codonul stop al genei D ca urmare a unei deplasări a două nucleotide. Construcția este numită „schimbarea cadrului de citire” de către un număr de nucleotide, nu un multiplu de trei. Până în prezent, suprapunerea a fost demonstrată doar pentru câțiva fagi.

Capacitatea de informare a ADN-ului

Pe Pământ trăiesc 6 miliarde de oameni. Informații ereditare despre ei
închis în 6x10 9 spermatozoizi. Potrivit diverselor estimări, o persoană are de la 30 la 50
mii de gene. Toți oamenii au ~30x1013 gene sau 30x1016 perechi de baze, care alcătuiesc 1017 codoni. Pagina medie a cărții conține 25x10 2 caractere. ADN-ul spermatozoizilor 6x109 conține informații egale ca volum cu aproximativ

4x10 13 pagini de carte. Aceste pagini ar ocupa spațiul a 6 clădiri NSU. 6x10 9 spermatozoizii ocupa o jumatate de degetar. ADN-ul lor ocupă mai puțin de un sfert de degetar.

este o metodă caracteristică tuturor organismelor vii de codificare a secvenței de aminoacizi a proteinelor folosind secvența de nucleotide dintr-o moleculă de ADN.

Implementarea informației genetice în celulele vii (adică sinteza unei proteine ​​codificate în ADN) se realizează folosind două procese matrice: transcripția (adică sinteza ARNm pe o matrice de ADN) și translația (sinteza unui ADN). lanț polipeptidic pe o matrice de ARNm).

ADN-ul folosește patru nucleotide - adenină (A), guanină (G), citozină (C), timină (T). Aceste „litere” formează alfabetul codului genetic. ARN-ul folosește aceleași nucleotide, cu excepția timinei, care este înlocuită cu uracil (U). În moleculele de ADN și ARN, nucleotidele sunt aranjate în lanțuri și, astfel, se obțin secvențe de „litere”.

Secvența de nucleotide ADN conține „cuvinte” de cod pentru fiecare aminoacid al viitoarei molecule de proteine ​​- codul genetic. Constă într-o anumită secvență de aranjare a nucleotidelor într-o moleculă de ADN.

Trei nucleotide consecutive codifică „numele” unui aminoacid, adică fiecare dintre cei 20 de aminoacizi este criptat de o unitate semnificativă de cod - o combinație de trei nucleotide numită triplet sau codon.

În prezent, codul ADN a fost complet descifrat și despre care putem vorbi anumite proprietăți, caracteristic acestui sistem biologic unic, care asigură traducerea informațiilor din „limbajul” ADN-ului în „limbajul” proteinei.

Purtătorul de informații genetice este ADN-ul, dar din moment ce ARNm, o copie a uneia dintre catenele de ADN, este direct implicat în sinteza proteinelor, codul genetic este cel mai adesea scris în „limbajul ARN”.

Aminoacid ARN care codifică tripleți
Alanin GCU GCC GCA GCH
Arginina TsGU TsGTs TsGA TsGG AGA AGG
Asparagină AAU AAC
Acid aspartic GAU GAC
Valin GUU GUTS GUA GUG
Histidină TsAU TsATs
Glicina GGU GGC GGA YYY
Glutamina CAA CAG
Acidul glutamic GAA GAG
izoleucina AUU AUC AUA
Leucina TSUU TSUTS TSUA TSUG UUA UUG
Lizina AAA AAG
Metionină AUG
Proline TsTsU TsTs TsTsTsG
Serin UCU UCC UCA UCG ASU AGC
tirozină UAU UAC
Treonina ACU ACC ACA ACG
Triptofan UGG
Fenilalanina UUU UUC
cisteină UGU UGC
STOP UGA UAG UAA

Proprietățile codului genetic

Trei nucleotide consecutive (baze de azot) codifică „numele” unui aminoacid, adică fiecare dintre cei 20 de aminoacizi este criptat cu o unitate de cod semnificativă - o combinație de trei nucleotide numită triplet sau codon.

triplet (codon)- o secvență de trei nucleotide (baze azotate) într-o moleculă de ADN sau ARN care determină includerea unui anumit aminoacid în molecula proteică în timpul sintezei acesteia.

  • Unicitate (discret)

Un triplet nu poate codifica doi aminoacizi diferiți, acesta criptează doar un aminoacid. Un codon specific corespunde unui singur aminoacid.

Fiecare aminoacid poate fi definit prin mai mult de un triplet. Excepție - metioninăŞi triptofan. Cu alte cuvinte, mai mulți codoni pot corespunde aceluiași aminoacid.

  • Nesuprapunere

Aceeași bază nu poate apărea în doi codoni adiacenți în același timp.

Unii tripleți nu codifică aminoacizi, dar sunt deosebite " indicatoare rutiere„, care definesc începutul și sfârșitul gene individuale, (UAA, UAG, UGA), fiecare dintre acestea înseamnă încetarea sintezei și este situat la capătul fiecărei gene, deci putem vorbi despre polaritatea codului genetic.

La animale și plante, ciuperci, bacterii și viruși, aceleași coduri triplete pentru același tip de aminoacid, adică codul genetic este același pentru toate ființele vii. Cu alte cuvinte, versatilitate - capacitatea codului genetic de a funcționa în mod egal în organisme cu diferite niveluri de complexitate de la viruși la oameni.Universalitatea codului ADN confirmă unitateaoriginea întregii vieți de pe planeta noastră. Metodele de inginerie genetică se bazează pe utilizarea proprietății universalității codului genetic.

Din istoria descoperirii codului genetic

Pentru prima dată ideea existenței cod genetic formulat de A. Down în 1952 - 1954. Oamenii de știință au arătat că secvența de nucleotide care determină în mod unic sinteza unui anumit aminoacid trebuie să conțină cel puțin trei unități. S-a dovedit ulterior că o astfel de secvență este formată din trei nucleotide numite codon sau triplet .

Întrebările despre care nucleotide sunt responsabile pentru includerea unui anumit aminoacid într-o moleculă de proteină și câte nucleotide determină această includere au rămas nerezolvate până în 1961. Analiza teoretică a arătat că codul nu poate consta dintr-o singură nucleotidă, deoarece în acest caz pot fi codificați doar 4 aminoacizi. Cu toate acestea, codul nu poate fi un dublet, adică o combinație de două nucleotide dintr-un „alfabet” de patru litere nu poate acoperi toți aminoacizii, deoarece doar 16 astfel de combinații sunt teoretic posibile (4 2 = 16).

Pentru a codifica 20 de aminoacizi, precum și un semnal „stop”, care indică sfârșitul secvenței proteice, sunt suficiente trei nucleotide consecutive, când numărul de combinații posibile este de 64 (4 3 = 64).