Валерий Сойфер. Арифметика наследственности
Глава 13. Знакомьтесь: ДНК!
Алфавит наследственной записи
На первый взгляд записать все, что нужно для развития сотен и даже тысяч признаков организма с помощью одной молекулы, да еще при наличии всего шести знаков:
невозможно. Тем более, если вспомнить, что у каждого вида живых существ «наследственная книга» своя и таких видов на Земле не один миллион.
Но это нисколько не смутило Крика и Уотсона. Более того, они сократили возможное число наследственных букв до четырех. Раз во всех сахарофосфатных цепях сахар (с) чередуется с фосфатом (ф), то такая запись ...сфсфсфсфсф-сфсф... у всех без исключения видов будет одинаково бессмысленной.
Остается, заключили авторы гипотезы, признать, что наследственный алфавит состоит из четырех букв А, Т, Г и Ц. Фразы пишутся этими буквами следующим образом. Вдоль нити ДНК чередуются расставленные разными способами четыре буквы, и, скажем, АТАГЦТГГЦА — одно слово, а ГГТЦАГ — другое слово. Итак, что ни новая перестановка букв, то новый смысл. Длина слов при этом может быть, конечно, разной.
Недоверие уже, вероятно, беспокоит вас. Мыслимое ли дело четырьмя буквами переписать, по крайней мере, сотни тысяч миллиардов слов? Наверное, все возможные перестановки из четырех букв скоро окажутся исчерпанными и начнется повторение уже известных слов.
Но простой расчет показывает, что опасение беспочвенно. Прежде всего, относительно четырех букв. Такой короткий алфавит не мешает выразить самое сложное предположение.
Всем известно, что сочинение любой длины вовсе не обязательно передавать тридцатью шестью буквами русского алфавита, а с тем же успехом можно записать всего двумя «буквами» азбуки Морзе — точка и тире.
Следовательно, четыре буквы ДНК не помеха, а может быть, даже и преимущество. Недаром каждое изобретение в области хранения и передачи информации использует словарь, составленный минимальным числом букв: в телеграфе точка и тире, в кибернетических устройствах — ноль и единица.
Остается узнать, хватит ли того набора букв, какой есть в ДНК, для того чтобы составить нужное число неповторяющихся слов. Например, чтобы передать энциклопедию по телеграфу, можно использовать столько точек и тире, сколько потребуется (это в воле человека). А длина ДНК, иначе говоря — число оснований, укладывающихся по длине молекулы, строго задано. Но это опасение отпало, как только удалось «взвесить» ДНК. Ее молекулярный вес говорил, что по длине полимера уложено от нескольких десятков тысяч оснований для просто устроенных организмов до нескольких сотен тысяч или даже миллионов оснований для высших организмов.
Такого «запаса памяти» хватит с избытком. Если же учесть, что в ДНК каждого вида эти громады букв расставлены своим, специфическим образом, то станет ясно, что никаких ограничений нет. Американский физик Гамов даже подсчитал число различных перестановок, которые можно получить из четырех букв. Цифра превышала число атомов в Солнечной системе!