Центральную догму биологии, сформулированную Фрэнсисом Криком в конце 1950-х, изучают в классическом виде: ДНК—>РНК—>белок. Но данных достаточно, чтобы усомниться в буквальном понимании этого главного принципа жизни.
Последний пример: в июньской публикации Scientific Reports российские ученые из Института биоорганической химии и Федерального научно-клинического центра физико-химической медицины показали, что разнообразие изоформ белков в клетках значительно меньше теоретически возможного. Журналисты поспешили сообщить, что меняется представление о центральной догме молекулярной биологии. Однако догма меняется уже 70 лет, потому что исходно была всего лишь гипотезой. Словом “догма” ее создатель Крик назвал потому, что нравилось это слово! Важно другое: как и почему меняется главная гипотеза молекулярной биологии.
Слишком много РНК
Генетическая информация считывается с кодирующих последовательностей генома, представленных генами. Только малая часть генома эукариот (растения, животные, грибы) содержит гены, а основная часть представлена протяженными нуклеотидными последовательностями с малоизученными функциями. В геноме человека только четверть покрыта генами и только 1% последовательностей ДНК кодирует информацию, записываемую в функциональных молекулах РНК (часть догмы “ДНК–>РНК”). То есть 1% геномной ДНК содержит информацию обо всех молекулах РНК. Зачем нужны оставшиеся 99%?
В последние годы стало понятно, что межгенные участки ДНК несут в себе регуляторную функцию: в них заложены системы и элементы, обеспечивающие тонкую настройку работы генов, их включение или выключение в определенных тканях организма или на конкретных стадиях развития. С такими элементами связываются различные комплексы, которые содержат молекулы регуляторных белков и РНК. Уже на этом уровне очевидно, что модель “ДНК–>РНК–>белок” полноценно не работает, так как основная масса ДНК не дает начала РНК, а несет другие функции.
Часть генов кодирует РНК с регуляторными функциями. Эти РНК не содержат информации о последовательности белка, а преимущественно организуют синтез белка в клетке. Основная часть таких РНК — компоненты рибосом (рибосомальные РНК), комплексы, осуществляющие трансляцию, а также молекулы-переносчики аминокислот (транспортные РНК), необходимые участникам процесса синтеза белка на матрице РНК (трансляции). 90% всей РНК клетки относится к перечисленным типам.
Среди оставшихся 10% молекул РНК представлены все белок-кодирующие РНК, но даже среди этих РНК найдены некодирующие молекулы, в частности, малые ядерные РНК. Эти РНК — необходимые компоненты комплекса сплайсинга. Сплайсинг — процесс удаления из первичной молекулы РНК некодирующих участков (интронов) и последовательного соединения кодирующих (экзонов); в итоге получается матричная РНК (мРНК), содержащая готовую к считыванию информацию о последовательности белка.
Именно этот комплекс готовит предшественников мРНК к синтезу правильных белков — путем вырезания из середины РНК последовательностей, не несущих в себе информации о составе белка, но содержащих регуляторные элементы. Так что и часть догмы “РНК –> белок” имеет свои ограничения.
Молекулярный “контроль качества”
А что мы знаем про так называемые “белок-кодирующие” гены? В клетках прокариот (бактерии) для такого типа генов все просто: на матрице ДНК транскрибируются молекулы РНК, на их базе идет синтез белковых молекул. Чаще всего молекулы РНК готовы для синтеза уже во время транскрипции.
В клетках эукариот все гораздо сложней: синтезирующиеся в процессе транскрипции молекулы РНК не готовы к трансляции (синтезу белка), прежде они должны претерпеть ряд изменений. Определенный набор модификаций вносится на концы молекул РНК (и РНК становится стабильной, а также попадает в определенные зоны клетки — “фабрики белка”), из середины молекул вырезаются интроны. Без сплайсинга и объединения экзонов правильную белковую молекулу не синтезировать.
С усложнением геномов вклад сплайсинга в процесс созревания мРНК увеличивается: у дрожжей только 4% белок-кодирующих генов подвергается сплайсингу, у дрозофилы — 83%, а у человека — 94%. Основная часть генов человека содержит более одного интрона в своем составе, и более половины генов человека могут сплайсироваться несколькими способами. Так что сплайсинг — это дополнительный регуляторный механизм, контролирующий количество “правильных” РНК, на матрице которых может запускаться синтез белковых молекул.
Кроме этого, сплайсинг часто является своего рода “контролем качества” молекул РНК, регулирует их стабильность. А так как альтернативный сплайсинг приводит к образованию на основе одной и той же молекулы РНК разных вариантов зрелых мРНК, это способ обеспечить дополнительное разнообразие белков в клетке. Такое разнообразие нужно для лучшей приспосабливаемости организма: разные изоформы белка могут работать в разных типах клеток, транспортироваться в разные компартменты или формировать разные поверхности узнавания для лигандов и т. д.
О чем “шумят” гены
Далеко не для всех изоформ белков известны функции, а во многих случаях для альтернативно сплайсированных молекул РНК не удается обнаружить белковый продукт. Авторы указанной статьи в Scientific Reports, изучавшие продукты альтернативного сплайсинга на модели мха, не обнаружили белков для большей части альтернативно сплайсированных молекул мРНК. В работах, выполненных на других модельных организмах, для многих альтернативно сплайсированных вариантов мРНК белковые молекулы также не были найдены.
Возможно, такие молекулы — побочный продукт регуляции “количества” генной экспрессии, “генный шум”; либо некоторые изоформы белка нужны в крайне ограниченных количествах.
Кроме этого, во многих интронах генов находятся регуляторные элементы, управляющие процессами сплайсинга, и там же могут находиться некодирующие РНК, участвующие в клеточном метаболизме. Так что и многообразие изоформ, и даже экспрессии белка могут контролироваться непосредственно молекулами РНК, без участия ДНК.
С развитием полногеномных технологий появляется все больше работ о некодирующих молекулах РНК. В геноме человека описан огромный пул таких РНК — “длинных” и “коротких”: они осуществляют важные регуляторные функции в клетке. Эти РНК следят за стабильностью белок-кодирующих РНК, активируют или репрессируют гены, являются сенсорами при разных стрессах. Функции основной части некодирующих РНК еще не описаны, это целый мир, без которого клетка и организм не могут существовать.
Накопленные на сегодня данные наталкивают на мысль, что на молекулярном уровне жизнь — это форма реализации функций РНК. ДНК хранит информацию, белок отвечает за клеточный метаболизм, а жизнь клетки (и организма) организуется и контролируется на этапе функционирования молекул РНК.
Существуют даже предположения, что именно РНК на заре эволюции была первым биополимером, способным к самовоспроизводству. РНК, с одной стороны, подобно ДНК, способна быть хранилищем генетической информации (геномы огромной группы вирусов представлены РНК). С другой — известны и РНК с каталитической функцией, способные выполнять часть функций белков. Сторонники РНК-мира считают, что свойства РНК, позволившие им воспроизводить за счет собственной ферментной активности записанную в последовательностях нуклеотидов информацию, сыграли решающую роль в становлении генетического аппарата живых организмов.
Время для подобных обобщений еще не пришло. Ученые только начинают понимать, что система, которую они изучают уже 100 лет, гораздо сложней, чем казалось даже 20 лет назад.
Оксана Максименко, кандидат биологических наук, Институт биологии гена РАН