Все для детей

Валерий Сойфер. Арифметика наследственности

Глава 16. Генетический код

Проблема кодирования

В 1954 году физик Георгий Гамов провел простой расчет.

Ему нужно было из четырех различных элементов получить двадцать различных элементов. Ясно, что если одно азотистое основание будет определять место одной аминокислоты, то удастся закодировать лишь четыре аминокислоты из двадцати. Следовательно, одну аминокислоту может кодировать только различное сочетание из четырех букв. Но какое?

Если делать слова двухбуквенными, то из четырех букв можно составить шестнадцать таких слов. Чтобы расчет был нагляднее, выпишем эти шестнадцать сочетаний:

АА АЦ ТТ ТГ ГГ ГЦ ЦЦ ЦГ
АТ АГ ТА ТЦ ГА ГТ ЦА ЦТ

Шестнадцати двухбуквенных слов недостаточно, чтобы записать двадцать аминокислот. Остается перепробовать сочетания из четырех букв по три в слове. Вот теперь получится 64 слова, даже больше, чем нужно для записи 20 слов.

Все возможные варианты триплетов

Из сочетаний по четыре элемента получится гораздо больше слов (256). Но здесь Гамов воспользовался старым принципом экономии: раз можно обойтись шестьюдесятью четырьмя элементами, то так природа и сделает. Ведь давно известно, что в эволюции выживают наиболее приспособленные организмы, и тот из них, который умеет обойтись меньшим числом слов, получит больше шансов выжить, чем тот, кому необходимо гораздо больше слов. Гамов остановил свой выбор на трехбуквенном коде (его иногда называют триплетным кодом).

Теперь следовало определить, как же эти трехбуквенные слова располагаются вдоль молекулы ДНК. Гамов опять прибегнул к принципу экономности. Если вдоль молекулы ДНК чередование оснований пишет слова генетической книги, то первая, вторая и третья буквы составят первое слово, вторая, третья и четвертая буквы — второе слово, третья, четвертая и пятая буквы — третье слово и т. д. Этот код назвали сплошным перекрывающимся.

Другой тип кода предложил Крик. По его мнению, код в ДНК должен состоять из троек, следующих одна за другой, но без перекрывания. Этот код назвали сплошным неперекрывающимся.

Но против обоих типов кодов были выставлены веские возражения.

Игорь Евгеньевич Тамм, обсуждая сплошные коды, говорил, что они не могут быть использованы в природе, так же как нельзя в жизни обойтись словами, идущими одно за другим без промежутков, запятых, точек... В подтверждение этого тезиса он рассказывал смешную историю, случившуюся с ним. В те годы Тамм много и безуспешно работал над одной проблемой. Однажды он получает телеграмму с довольно странным текстом: «Дело не едет». Ученый решил, что кто-то из друзей, осведомленный о состоянии его работы, охарактеризовал ее столь метко. На следующий день раздался телефонный звонок, и старинный друг Тамма — Борис Николаевич Делоне сердитым голосом отчитал его за то, что Тамм не встретил его на вокзале, хотя телеграмма была послана в срок. Смысл странной телеграммы стал ясен. Телеграфисты сделали всего один лишний пробел, отделив «не» от слова «Делоне». Такая невинная опечатка полностью исказила текст.

Тамм считал, что код в ДНК должен состоять из слов, чередующихся с бессмысленными сочетаниями оснований (например, бессмысленными могли быть слова из одинаковых букв ААААА или ГГГГГГ и т. д.). Так родился третий тип кодов — неперекрывающийся код с запятыми. Большинство ученых склонялось в пользу именно этого кода.

Довольно быстро нашлись и экспериментальные доказательства, опровергшие сплошной перекрывающийся код Гамова. Из кода Гамова следовало, что при изменении одного основания в ДНК должны были испортиться сразу три аминокислоты в белке. Действительно, в его коде одно основание входило в состав сразу трех кодонов (кодоном назвали одно слово в ДНК):

Недостаток перекрывающегося кода

Анализ аминокислотных последовательностей ряда белков показал, что чаще всего заменяется только одна из аминокислот, а это противоречило коду Гамова. Американский ученый С. Бреннер довольно остроумно доказал, что если допустить существование единого кода для всех организмов живого мира, то код Гамова нельзя будет использовать. Осталось выбирать между двумя типами кодов — сплошным неперекрывающимся и кодом с запятыми.

«Установив таким образом, что в коде нет перекрывания, мы очутились перед новой проблемой. Как можно установить, где кончается одна тройка и где начинается другая? Если, например, в среднем участке гена имеется последовательность

...ЦАТЦАТЦАТ...

где Ц обозначает цитозин, А — аденин, а Т — тимин, то не следует ли ее читать как

...ЦАТ ЦАТ ЦАТ...

или же как

...Ц АТЦ АТЦ АТ...?» — писал Фрэнсис Крик. Но это выяснить не удавалось.

К концу шестидесятых годов «кодовые страсти» стихли, были перепробованы многие схемы, но последнее слово осталось за самой природой. А выпытать у нее это слово не представлялось возможным: природа крепко хранила секрет «трех карт».