Филогенетический след - Википедия - Phylogenetic footprinting

Филогенетический след гена HOXA5

Филогенетический след это метод, используемый для идентификации фактор транскрипции сайты связывания (TFBS) в некодирующей области интересующей ДНК, сравнивая ее с ортологичный последовательность в разных разновидность. Когда этот метод используется с большим количеством близкородственных видов, это называется филогенетическая слежка.[1]

Исследователи обнаружили, что некодирующие части ДНК содержат сайты связывания для регуляторных белков, которые регулируют пространственно-временную экспрессию гены. Эти сайты связывания факторов транскрипции (TFBS) или регуляторные мотивы оказалось трудно идентифицировать, прежде всего потому, что они короткие по длине и могут показывать последовательность вариация. Важность понимания регуляции транскрипции для многих областей биология побудила исследователей разработать стратегии для прогнозирования наличия TFBS, многие из которых привели к созданию общедоступных баз данных. Один из таких приемов Филогенетический След.

Филогенетический след основан на двух основных концепциях:

  1. Функция и ДНК привязка предпочтения факторы транскрипции хорошо сохраняются между различными разновидность.
  2. Важный некодирующая ДНК последовательности, которые необходимы для регуляции экспрессии генов, будут демонстрировать дифференциальное давление отбора. В TFBS происходит более медленная скорость изменений, чем в других, менее важных частях некодирующего генома.[2]

История

Филогенетический след был впервые использован и опубликован Tagle et al. в 1988 г., что позволило исследователям предсказать эволюционно консервативные цис-регуляторные элементы, ответственные за эмбриональные ε и γ глобулин экспрессия генов у приматов.[3]

Перед филогенетическим отпечатком ног, ДНКаза Использовался футпринтинг, при котором белок связывается с сайтами связывания фактора транскрипции ДНК (TFBS), защищая его от переваривания ДНКазой. Одна из проблем, связанных с этой техникой, заключалась в количестве времени и трудозатрат. В отличие от ДНКазного отпечатка, филогенетический отпечаток опирается на эволюционный ограничения внутри генома, при этом «важные» части последовательности сохраняются у разных видов.[4]

Протокол

Протокол техники филогенетического следа

При использовании этого метода важно решить, с каким геномом следует выровнять последовательность. Более дивергентные виды будут иметь меньшее сходство последовательностей между ортологичными генами. Следовательно, ключевым моментом является выбор видов, которые достаточно родственны, чтобы обнаружить гомологию, но достаточно расходятся, чтобы максимизировать «шум» несовпадения. Поэтапный подход к филогенетическому выявлению следов состоит из:

  1. Следует определиться с интересующим геном.
  2. Тщательно выбирайте виды с ортологичными генами.
  3. Определите длину участка, расположенного выше или ниже по течению, который необходимо исследовать.
  4. Выровняйте последовательности.
  5. Ищите консервативные регионы и анализируйте их.

Не все TFBS найдены

Не все сайты связывания транскрипции можно найти с помощью филогенетического следа из-за статистической природы этого метода. Вот несколько причин, по которым некоторые TFBS не обнаруживаются:

Видоспецифические сайты связывания

Некоторые сайты связывания, по-видимому, не имеют значимых совпадений у большинства других видов. Следовательно, обнаружение этих сайтов с помощью филогенетического отпечатка ног, вероятно, невозможно, если не доступно большое количество близкородственных видов.

Очень короткие места привязки

Некоторые участки связывания демонстрируют отличную сохранность, но только в более короткой области, чем искали. Такие короткие мотивы (например, GC-бокс) часто возникают случайно в нефункциональных последовательностях, и обнаружение этих мотивов может быть сложной задачей.

Менее специфические связывающие факторы

Некоторые сайты связывания демонстрируют некоторую сохранность, но имеют вставки или делеции. Не очевидно, функционируют ли эти последовательности со вставками или делециями. Хотя они могут по-прежнему работать, если фактор привязки менее специфичен (или менее «разборчив», если хотите). Поскольку делеции и вставки в сайтах связывания редки, рассмотрение вставок и делеций в последовательности позволит обнаружить несколько больше истинных TFBS, но, вероятно, может включать гораздо больше ложных срабатываний.

Недостаточно данных

Некоторые мотивы достаточно хорошо сохраняются, но они статистически не значимы в конкретном наборе данных. Мотив мог появиться у разных видов случайно. Эти мотивы можно было бы обнаружить, если бы были доступны последовательности от большего количества организмов. Так что в будущем это не будет проблемой.

Области связывания соединений

Некоторые факторы транскрипции связываются в виде димеров. Следовательно, их сайты связывания могут состоять из двух консервативных областей, разделенных несколькими вариабельными нуклеотидами. Из-за переменной внутренней последовательности мотив не может быть обнаружен. Однако, если бы мы могли использовать программу для поиска мотивов, содержащих вариабельную последовательность в середине, без подсчета мутаций, эти мотивы можно было бы обнаружить.

Точность

Важно помнить, что не все консервативные последовательности находятся под давлением отбора. Чтобы исключить ложноположительные результаты, необходимо провести статистический анализ, который покажет, что указанные мотивы имеют значительно меньшую скорость мутаций, чем у окружающей нефункциональной последовательности.

Более того, результаты могут быть более точными, если принять во внимание предварительные знания о последовательности. Например, некоторые регуляторные элементы повторяются 15 раз в области промотора (например, некоторые промоторы металлотионеина содержат до 15 элементов ответа на металл (MRE)). Таким образом, чтобы устранить ложные мотивы с непоследовательным порядком у разных видов, ориентация и порядок регуляторных элементов в промоторной области должны быть одинаковыми у всех видов. Этот тип информации может помочь нам идентифицировать регуляторные элементы, которые недостаточно законсервированы, но встречаются в нескольких копиях во входной последовательности.[5]

Рекомендации

  1. ^ Филогенетическое наблюдение за последовательностями приматов для поиска функциональных областей генома человека Дои:10.1126 / science.1081331
  2. ^ Неф, С. и Томпа, М. 2006. MicroFootPrinter: инструмент для филогенетического следа в геномах прокариот. Исследования нуклеиновых кислот. 34: 366-368
  3. ^ Tagle, DA, Koop, BF, Goodman, M., Slightom, JL, Hess, D., and Jones, RT 1988. Эмбриональные гены ε- и γ-глобина прозимического приматы (Galago crassicaudatis): нуклеотидные и аминокислотные последовательности, онтогенетические регуляция и филогенетические следы. J. Mol. Биол. 203:439-455.
  4. ^ Чжан З. и Герштейн М. 2003. О мышах и людях: филогенетический отпечаток ног помогает открытию регуляторных элементов.J. Biol.2:11-11.4
  5. ^ Бланшетт, М. и Томпа, М. 2002. Открытие регулирующих элементов с помощью вычислительного метода для филогенетического следа. Genome Res. 12: 739-748