Генетический код: описание, характеристики, история исследования. Генетический код: свойства и функции Что такое генетический код в информатике

Выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Генетический код

Белки практически всех живых организмов построены из аминокислот всего 20 видов. Эти аминокислоты называют каноническими. Каждый белок представляет собой цепочку или несколько цепочек аминокислот, соединённых в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства.

C

CUU (Leu/L)Лейцин
CUC (Leu/L)Лейцин
CUA (Leu/L)Лейцин
CUG (Leu/L)Лейцин

В некоторых белках нестандартные аминокислоты, такие как селеноцистеин и пирролизин , вставляются рибосомой, прочитывающей стоп-кодон, что зависит от последовательностей в мРНК . Селеноцистеин сейчас рассматривается в качестве 21-й, а пирролизин 22-й аминокислот, входящих в состав белков.

Несмотря на эти исключения, у всех живых организмов генетический код имеет общие черты: кодон состоят из трёх нуклеотидов, где два первых являются определяющими, кодоны транслируются тРНК и рибосомами в последовательность аминокислот.

Отклонения от стандартного генетического кода .
Пример Кодон Обычное значение Читается как:
Некоторые виды дрожжей рода Candida CUG Лейцин Серин
Митохондрии, в частности у Saccharomyces cerevisiae CU(U, C, A, G) Лейцин Серин
Митохондрии высших растений CGG Аргинин Триптофан
Митохондрии (у всех без исключения исследованных организмов) UGA Стоп Триптофан
Митохондирии млекопитающих, дрозофилы , S. cerevisiae и многих простейших AUA Изолейцин Метионин = Старт
Прокариоты GUG Валин Старт
Эукариоты (редко) CUG Лейцин Старт
Эукариоты (редко) GUG Валин Старт
Прокариоты (редко) UUG Лейцин Старт
Эукариоты (редко) ACG Треонин Старт
Митохондрии млекопитающих AGC, AGU Серин Стоп
Митохондрии дрозофилы AGA Аргинин Стоп
Митохондрии млекопитающих AG(A, G) Аргинин Стоп

История представлений о генетическом коде

Тем не менее в начале 60-х годов XX века новые данные обнаружили несостоятельность гипотезы «кода без запятых». Тогда эксперименты показали, что кодоны, считавшиеся Криком бессмысленными, могут провоцировать белковый синтез в пробирке, и к 1965 году был установлен смысл всех 64 триплетов. Оказалось, что некоторые кодоны просто-напросто избыточны, то есть целый ряд аминокислот кодируется двумя, четырьмя или даже шестью триплетами.

См. также

Примечания

  1. Genetic code supports targeted insertion of two amino acids by one codon. Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN. Science. 2009 Jan 9;323(5911):259-61.
  2. Кодон AUG кодирует метионин, но одновременно служит стартовым кодоном - с первого AUG-кодона мРНК как правило начинается трансляция.
  3. NCBI: «The Genetic Codes», Compiled by Andrzej (Anjay) Elzanowski and Jim Ostell
  4. Jukes TH, Osawa S, The genetic code in mitochondria and chloroplasts. , Experientia. 1990 Dec 1;46(11-12):1117-26.
  5. Osawa S, Jukes TH, Watanabe K, Muto A (March 1992). «Recent evidence for evolution of the genetic code ». Microbiol. Rev. 56 (1): 229–64. PMID 1579111 .
  6. SANGER F. (1952). «The arrangement of amino acids in proteins.». Adv Protein Chem. 7 : 1-67. PMID 14933251 .
  7. М. Ичас Биологический код. - Мир, 1971.
  8. WATSON JD, CRICK FH. (April 1953). «Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid.». Nature 171 : 737-738. PMID 13054692 .
  9. WATSON JD, CRICK FH. (May 1953). «Genetical implications of the structure of deoxyribonucleic acid.». Nature 171 : 964-967. PMID 13063483 .
  10. Crick FH. (April 1966). «The genetic code - yesterday, today, and tomorrow.». Cold Spring Harb Symp Quant Biol. : 1-9. PMID 5237190 .
  11. G. GAMOW (February 1954). «Possible Relation between Deoxyribonucleic Acid and Protein Structures.». Nature 173 : 318. DOI :10.1038/173318a0 . PMID 13882203 .
  12. GAMOW G, RICH A, YCAS M. (1956). «The problem of information transfer from the nucleic acids to proteins.». Adv Biol Med Phys. 4 : 23-68. PMID 13354508 .
  13. Gamow G, Ycas M. (1955). «STATISTICAL CORRELATION OF PROTEIN AND RIBONUCLEIC ACID COMPOSITION. ». Proc Natl Acad Sci U S A. 41 : 1011-1019. PMID 16589789 .
  14. Crick FH, Griffith JS, Orgel LE. (1957). «CODES WITHOUT COMMAS. ». Proc Natl Acad Sci U S A. 43 : 416-421. PMID 16590032 .
  15. Hayes B. (1998). «The Invention of the Genetic Code.» (PDF reprint). American Scientist 86 : 8-14.

Литература

  • Азимов А. Генетический код. От теории эволюции до расшифровки ДНК. - М.: Центрполиграф, 2006. - 208 с - ISBN 5-9524-2230-6 .
  • Ратнер В. А.Генетический код как система - Соросовский образовательный журнал, 2000, 6, № 3, с.17-22.
  • Crick FH, Barnett L, Brenner S, Watts-Tobin RJ. General nature of the genetic code for proteins - Nature, 1961 (192), pp. 1227-32

Ссылки

  • Генетический код - статья из Большой советской энциклопедии

Wikimedia Foundation . 2010 .

Раздел ЕГЭ: 2.6. Генетическая информация в клетке. Гены, генетический код и его свойства. Матричный характер реакций биосинтеза. Биосинтез белка и нуклеиновых кислот

На Земле живет уже более 6 млрд людей. Если не считать 25-30 млн пар однояйцевых близнецов, то генетически все люди разные. Это означает, что каждый из них уникален, обладает неповторимыми наследственными особенностями, свойствами характера, способностями, темпераментом и многими другими качествами. Чем же определяются такие различия между людьми? Конечно различиями в их генотипах , т.е. наборах генов данного организма. У каждого человека он уникален, так же как уникален генотип отдельного животного или растения. Но генетические признаки данного человека воплощаются в белках, синтезированных в его организме. Следовательно, и строение белка одного человека отличается, хотя и совсем немного, от белка другого человека. Вот почему возникает проблема пересадки органов, вот почему возникают аллергические реакции на продукты, укусы насекомых, пыльцу растений и т.д. Сказанное не означает, что у людей не встречается совершенно одинаковых белков. Белки, выполняющие одни и те же функции, могут быть одинаковыми или совсем незначительно отличаться одной-двумя аминокислотами друг от друга. Но не существует на Земле людей (за исключением однояйцевых близнецов), у которых все белки были бы одинаковы.

Информация о первичной структуре белка закодирована в виде последовательности нуклеотидов в участке молекулы ДНК — гене. Ген — это единица наследственной информации организма. Каждая молекула ДНК содержит множество генов. Совокупность всех генов организма составляет его генотип .

Кодирование наследственной информации происходит с помощью генетического кода . Код подобен всем известной азбуке Морзе, которая точками и тире кодирует информацию. Азбука Морзе универсальна для всех радистов, и различия состоят только в переводе сигналов на разные языки. Генетический код также универсален для всех организмов и отличается лишь чередованием нуклеотидов, образующих гены и кодирующих белки конкретных организмов.

Свойства генетического кода : триплетность, специфичность, универсальность, избыточность и неперекрываемость.

Итак, что же собой представляет генетический код? Изначально он состоит из троек (триплетов ) нуклеотидов ДНК, комбинирующихся в разной последовательности. Например, ААТ, ГЦА, АЦГ, ТГЦ и т.д. Каждый триплет нуклеотидов кодирует определенную аминокислоту, которая будет встроена в полипептидную цепь. Так, например, триплет ЦГТ кодирует аминокислоту аланин, а триплет ААГ — аминокислоту фенилаланин. Аминокислот 20, а возможностей для комбинаций четырех нуклеотидов в группы по три — 64. Следовательно, четырех нуклеотидов вполне достаточно, чтобы кодировать 20 аминокислот. Вот почему одна аминокислота может кодироваться несколькими триплетами. Часть триплетов вовсе не кодирует аминокислоты, а запускает или останавливает биосинтез белка.

Собственно генетическим кодом считается последовательность нуклеотидов в молекуле иРНК , ибо она снимает информацию с ДНК (процесс транскрипции ) и переводит ее в последовательность аминокислот в молекулах синтезируемых белков (процесс трансляции ). В состав иРНК входят нуклеотиды АЦГУ. Триплеты нуклеотидов иРНК называются кодонами. Уже приведенные примеры триплетов ДНК на иРНК будут выглядеть следующим образом — триплет ЦГТ на иРНК станет триплетом ГЦА, а триплет ДНК — ААГ — станет триплетом УУЦ. Именно кодонами иРНК отражается генетический код в записи. Итак, генетический код триплетен, универсален для всех организмов на земле, вырожден (каждая аминокислота шифруется более чем одним кодоном). Между генами имеются знаки препинания — это триплеты, которые называются стоп-кодонами . Они сигнализируют об окончании синтеза одной полипептидной цепи. Существуют таблицы генетического кода, которыми нужно уметь пользоваться, для расшифровки кодонов иРНК и построения цепочек белковых молекул (в скобках — комплементарные ДНК).

Сегодня ни для кого не секрет, что программа жизнедеятельности всех живых организмов записана на молекуле ДНК. Проще всего представить молекулу ДНК в виде длинной лестницы. Вертикальные стойки этой лестницы состоят из молекул сахара, кислорода и фосфора. Вся важная рабочая информация в молекуле записана на перекладинах лестницы — они состоят из двух молекул, каждая из которых крепится к одной из вертикальных стоек. Эти молекулы — азотистые основания — называются аденин, гуанин, тимин и цитозин, но обычно их обозначают просто буквами А, Г, Т и Ц. Форма этих молекул позволяет им образовывать связи — законченные ступеньки — лишь определенного типа. Это связи между основаниями А и Т и между основаниями Г и Ц (образованную таким образом пару называют «парой оснований» ). Других типов связи в молекуле ДНК быть не может.

Спускаясь по ступенькам вдоль одной цепи молекулы ДНК, вы получите последовательность оснований. Именно это сообщение в виде последовательности оснований и определяет поток химических реакций в клетке и, следовательно, особенности организма, обладающего данной ДНК. Согласно центральной догме молекулярной биологии , на молекуле ДНК закодирована информация о белках , которые, в свою очередь, выступая в роли ферментов (см. Катализаторы и ферменты), регулируют все химические реакции в живых организмах.

Строгое соответствие между последовательностью пар оснований в молекуле ДНК и последовательностью аминокислот, составляющих белковые ферменты, называется генетическим кодом. Генетический код был расшифрован вскоре после открытия двуспиральной структуры ДНК. Было известно, что недавно открытая молекула информационной , или матричной РНК (иРНК, или мРНК), несет информацию, записанную на ДНК. Биохимики Маршалл Уоррен Ниренберг (Marshall W. Nirenberg) и Дж. Генрих Маттеи (J. Heinrich Matthaei) из Национального института здравоохранения в городке Бетезда под Вашингтоном, округ Колумбия, поставили первые эксперименты, которые привели к разгадке генетического кода.

Они начали с того, что синтезировали искусственные молекулы иРНК, состоявшие только из повторяющегося азотистого основания урацила (который является аналогом тимина, «Т», и образует связи только с аденином, «А», из молекулы ДНК). Они добавляли эти иРНК в тестовые пробирки со смесью аминокислот, причем в каждой пробирке лишь одна из аминокислот была помечена радиоактивной меткой. Исследователи обнаружили, что искусственно синтезированная ими иРНК инициировала образование белка лишь в одной пробирке, где находилась меченая аминокислота фенилаланин. Так они установили, что последовательность «—У—У—У—» на молекуле иРНК (и, следовательно, эквивалентную ей последовательность «—А—А—А—» на молекуле ДНК) кодирует белок, состоящий только из аминокислоты фенилаланина. Это было первым шагом к расшифровке генетического кода.

Сегодня известно, что три пары оснований молекулы ДНК (такой триплет получил название кодон ) кодируют одну аминокислоту в белке. Выполняя эксперименты, аналогичные описанному выше, генетики в конце концов расшифровали весь генетический код, в котором каждому из 64 возможных кодонов соответствует определенная аминокислота.

Лекция 5. Генетический код

Определение понятия

Генетический код - это система записи информации о последовательности расположения аминокислот в белках с помощью последовательности расположения нуклеотидов в ДНК.

Поскольку ДНК непосредственного участия в синтезе белка не принимает, то код записывается на языке РНК. В РНК вместо тимина входит урацил.

Свойства генетического кода

1. Триплетность

Каждая аминокислота кодируется последовательностью из 3-х нуклеотидов.

Определение: триплет или кодон - последовательность из трех нуклеотидов, кодирующая одну аминокислоту.

Код не может быть моноплетным, поскольку 4 (число разных нуклеотидов в ДНК) меньше 20. Код не может быть дуплетным, т.к. 16 (число сочетаний и перестановок из 4-х нуклеотидов по 2) меньше 20. Код может быть триплетным, т.к. 64 (число сочетаний и перестановок из 4-х по 3) больше 20.

2. Вырожденность.

Все аминокислоты, за исключением метионина и триптофана, кодируются более чем одним триплетом:

2 АК по 1 триплету = 2.

9 АК по 2 триплета = 18.

1 АК 3 триплета = 3.

5 АК по 4 триплета = 20.

3 АК по 6 триплетов = 18.

Всего 61 триплет кодирует 20 аминокислот.

3. Наличие межгенных знаков препинания.

Определение:

Ген - это участок ДНК, кодирующий одну полипептидную цепь или одну молекулу tPHK , r РНК или sPHK .

Гены tPHK , rPHK , sPHK белки не кодируют.

В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х триплетов, кодирующих терминирующие кодоны РНК, или стоп-сигналы. В мРНК они имеют следующий вид: UAA , UAG , UGA . Они терминируют (оканчивают) трансляцию.

Условно к знакам препинания относится и кодон AUG - первый после лидерной последовательности. (См. лекцию 8) Он выполняет функцию заглавной буквы. В этой позиции он кодирует формилметионин (у прокариот).

4. Однозначность.

Каждый триплет кодирует лишь одну аминокислоту или является терминатором трансляции.

Исключение составляет кодон AUG . У прокариот в первой позиции (заглавная буква) он кодирует формилметионин, а в любой другой - метионин.

5. Компактность, или отсутствие внутригенных знаков препинания.
Внутри гена каждый нуклеотид входит в состав значащего кодона.

В 1961 г. Сеймур Бензер и Френсис Крик экспериментально доказали триплетность кода и его компактность.

Суть эксперимента: "+" мутация - вставка одного нуклеотида. "-" мутация - выпадение одного нуклеотида. Одиночная "+" или "-" мутация в начале гена портит весь ген. Двойная "+" или "-" мутация тоже портит весь ген.

Тройная "+" или "-" мутация в начале гена портит лишь его часть. Четверная "+" или "-" мутация опять портит весь ген.

Эксперимент доказывает, что код тршплетен и внутри гена нет знаков препинания. Эксперимент был проведен на двух рядом расположенных фаговых генах и показал, кроме того, наличие знаков препинания между генами.

6. Универсальность.

Генетический код един для всех живущих на Земле существ.

В 1979 г. Беррел открыл идеальный код митохондрий человека.

Определение:

«Идеальным» называется генетический код, в котором выполняется правило вырожденности квазидублетного кода: Если в двух триплетах совпадают первые два нуклеотида, а третьи нуклеотиды относятся к одному классу (оба - пурины или оба - пиримидины), то эти триплеты кодируют одну и ту же аминокислоту.

Из этого правила в универсальном коде есть два исключения. Оба отклонения от идеального кода в универсальном касаются принципиальных моментов: начала и конца синтеза белка:

Кодон

Универсальный

код

Митохондриальные коды

Позвоночные

Беспозвоночные

Дрожжи

Растения

STOP

STOP

С UA

А G А

STOP

STOP

230 замен не меняют класс кодируемой аминокислоты. к рываемость.

В 1956 г. Георгий Гамов предложил вариант перекрываемого кода. Согласно Гамовскому коду, каждый нуклеотид, начиная с третьего в гене, входит в состав 3-х кодонов. Когда генетический код был расшифрован, оказалось, что он неперекрываем, т.е. каждый нуклеотид входит в состав лишь одного кодона.

Достоинства перекрываемого генетического кода: компактность, меньшая зависимость структуры белка от вставки или делеции нуклеотида.

Недостаток: большая зависимость структуры белка от замены нуклеотида и ограничение на соседей.

В 1976 г. была секвенирована ДНК фага φХ174. У него одноцепочечная кольцевая ДНК, состоящая из 5375 нуклеотидов. Было известно, что фаг кодирует 9 белков. Для 6 из них были определены гены, располагающиеся друг за другом.

Выяснилось, что есть перекрывание. Ген Е полностью находится внутри гена D . Его инициирующий кодон появляется в результате сдвига считывания на один нуклеотид. Ген J начинается там, где кончается ген D . Инициирующий кодон гена J перекрывается с терминирующим кодоном гена D в результате сдвига на два нуклеотида. Конструкция называется "сдвиг рамки считывания" на число нуклеотидов, некратное трем. На сегодняшний день перекрывание показано только для нескольких фагов.

Информационная емкость ДНК

На Земле живет 6 миллиардов человек. Наследственная информация о них
заключена в 6x10 9 сперматозоидах. По разным оценкам у человека от 30 до 50
тысяч генов. У всех людей ~ 30x10 13 генов или 30x10 16 пар нуклеотидов, которые составляют 10 17 кодонов. Средняя книжная страница содержит 25x10 2 знаков. ДНК 6x10 9 сперматозоидов содержит информацию, равную по объему примерно

4x10 13 книжных страниц. Эти страницы заняли бы объем 6-и зданий НГУ. 6x10 9 сперматозоидов занимают половину наперстка. Их ДНК занимает менее четверти наперстка.

— это свойственный всем живым организмам способ кодирования аминокислотной последовательности белков при помощи последовательности нуклеотидов в молекуле ДНК.

Реализация генетической информации в живых клетках (то есть синтез белка, закодированного в ДНК) осуществляется при помощи двух матричных процессов: транскрипции (то есть синтеза иРНК на матрице ДНК) и трансляции (синтез полипептидной цепи на матрице иРНК).

В ДНК используется четыре нуклеотида — аденин (А), гуанин (Г), цитозин (Ц), тимин (T). Эти «буквы» составляют алфавит генетического кода. В РНК используются те же нуклеотиды, за исключением тимина, который заменен урацилом (У). В молекулах ДНК и РНК нуклеотиды выстраиваются в цепочки и, таким образом, получаются последовательности «букв».

В нуклеотидной последовательности ДНК имеются кодовые «слова» для каждой аминокислоты будущей молекулы белка — генетический код. Он заключается в определенной последовательности расположения нуклеотидов в молекуле ДНК.

Три стоящих подряд нуклеотида кодируют «имя» одной аминокислоты, то есть каждая из 20 аминокислот зашифрована значащей единицей кода — сочетанием из трех нуклеотидов, называемых триплет или кодон.

В настоящее время код ДНК полностью расшифрован, и мы можем говорить об определенных свойствах, характерных для этой уникальной биологической системы, обеспечивающей перевод информации с «языка» ДНК на «язык» белка.

Носителем генетической информации является ДНК, но так как непосредственное участие в синтезе белка принимает иРНК — копия одной из нитей ДНК, то чаще всего генетический код записывают на "языке РНК".

Аминокислота Кодирующие триплеты РНК
Аланин ГЦУ ГЦЦ ГЦА ГЦГ
Аргинин ЦГУ ЦГЦ ЦГА ЦГГ АГА АГГ
Аспарагин ААУ ААЦ
Аспарагиновая кислота ГАУ ГАЦ
Валин ГУУ ГУЦ ГУА ГУГ
Гистидин ЦАУ ЦАЦ
Глицин ГГУ ГГЦ ГГА ГГГ
Глутамин ЦАА ЦАГ
Глутаминовая кислота ГАА ГАГ
Изолейцин АУУ АУЦ АУА
Лейцин ЦУУ ЦУЦ ЦУА ЦУГ УУА УУГ
Лизин ААА ААГ
Метионин АУГ
Пролин ЦЦУ ЦЦЦ ЦЦА ЦЦГ
Серин УЦУ УЦЦ УЦА УЦГ АГУ АГЦ
Тирозин УАУ УАЦ
Треонин АЦУ АЦЦ АЦА АЦГ
Триптофан УГГ
Фенилаланин УУУ УУЦ
Цистеин УГУ УГЦ
СТОП УГА УАГ УАА

Свойства генетического кода

Три стоящих подряд нуклеотида (азотистых оснований) кодируют «имя» одной аминокислоты, то есть каждая из 20 аминокислот зашифрована значащей единицей кода — сочетанием из трех нуклеотидов, называемых триплет или кодон.

Триплет (кодон) — последовательность из трех нуклеотидов (азотистых оснований) в молекуле ДНК или РНК, определяющая включение в молекулу белка в процессе ее синтеза определенной аминокислоты.

  • Однозначность (дискретность)

Один триплет не может кодировать две разные аминокислоты, шифрует только одну аминокислоту. Определенный кодон соответствует только одной аминокислоте.

Каждая аминокислота может определяться более, чем одним триплетом. Исключение — метионин и триптофан . Другими словами — одной и той же аминокислоте может соответствовать несколько кодонов.

  • Неперекрываемость

Одно и то же основание не может одновременно входить в два соседних кодона.

Некоторые триплеты не кодируют аминокислоты, а являются своеобразными «дорожными знаками», которые определяют начало и конец отдельных генов, (УАА, УАГ, УГА), каждый из которых означает прекращение синтеза и расположен в конце каждого гена, поэтому мы можем говорить о полярности генетического кода.

У животных и растений, у грибов, бактерий и вирусов один и тот же триплет кодирует один и тот же тип аминокислоты, то есть генетический код одинаков для всех живых существ. Други ми словами, у ниверсальность — способность генетического кода работать одинаково в организмах разного уровня сложности от вирусов до человека. Универсальность кода ДНК подтверждает единство п роисхождения всего живого на нашей планете. На использовании свойства универсальности генетического кода основаны методы генной инженерии.

Из истории открытия генетического кода

Впервые идея о существовании генетического кода сформулирована А. Дауном и в 1952 — 1954 годах. Учёные показали, что последовательность нуклеотидов, однозначно определяющая синтез той или иной аминокислоты, должна содержать не менее трёх звеньев. Позднее было доказано, что такая последовательность состоит из трех нуклеотидов, названных кодоном или триплетом .

Вопросы о том, какие нуклеотиды ответственны за включение определенной аминокислоты в белковую молекулу и какое количество нуклеотидов определяет это включение, оставались нерешенными до 1961 года. Теоретический разбор показал, что код не может состоять из одного нуклеотида, поскольку в этом случае только 4 аминокислоты могут кодироваться. Однако код не может быть и дуплетным, то есть комбинация двух нуклеотидов из четырехбуквенного «алфавита» не может охватить всех аминокислот, так как подобных комбинаций теоретически возможно только 16 (4 2 = 16).

Для кодирования 20 аминокислот, а также сигнала «стоп», означающего конец белковой последовательности, достаточно трех последовательных нуклеотидов, когда число возможных комбинаций составит 64 (4 3 = 64).