Пангеном - Pan-genome

В полях молекулярная биология и генетика, а пангеном (пангеном или же супрагеном) это весь набор гены для всех напряжения в пределах клады.[1][2][3] Пангеном включает: основной геном, содержащий гены, присутствующие во всех штаммах внутри клады, дополнительный геном, содержащий «необязательные» гены, присутствующие в подмножестве штаммов, и гены, специфичные для штамма.[1][2][3] Исследование пангенома называется пангеномика.[1]

Немного разновидность имеют открытые (или обширные) пангеномы, в то время как другие имеют закрытые пангеномы.[1] Для видов с закрытым пангеномом очень мало генов добавляется на секвенированный геном (после секвенирования многих штаммов), и размер полного пангенома можно теоретически предсказать. Виды с открытым пангеномом имеют достаточно добавленных генов на каждый дополнительный секвенированный геном, поэтому предсказать размер полного пангенома невозможно.[3] Размер населения и ниша универсальность были предложены как наиболее влиятельные факторы при определении размера пангенома.[1] Пангеном можно разбить на «сердцевинный пангеном», который содержит гены, присутствующие у всех индивидуумов, «пангеном оболочки», который содержит гены, присутствующие в двух или более штаммах, и «облачный пангеном», который содержит гены, встречающиеся только в одиночный штамм.[2][3][4][5]

Пангеномы изначально создавались для видов бактерии и археи, но совсем недавно были разработаны пангеномы эукариот, особенно для растение разновидность. Исследования растений показали, что динамика пангенома связана с мобильными элементами.[6][7][8] Значение пангенома возникает в эволюционном контексте, особенно в связи с метагеномика,[9] но также используется в более широком геномика контекст.[10]

Весной 2020 года была опубликована книга в открытом доступе, в которой рассматривается концепция пангенома и ее значение, под редакцией Теттелина и Медини.[11]

История

Этимология

Термин «пангеном» был определен в его нынешнем значении Tettelin et al. в 2005 году;[1] оно происходит от греческого слова παν, означающего «целый» или «все», в то время как геном - это широко используемый термин для описания полного генетического материала организма. Tettelin et al. применил термин специально к бактериям, пангеном которых «включает основной геном, содержащий гены, присутствующие во всех штаммах, и необязательный геном, состоящий из генов, отсутствующих в одном или нескольких штаммах, и генов, уникальных для каждого штамма».[1]

Оригинальная концепция

В S. pneumoniae пангеном. (а) Количество новых генов как функция количества секвенированных геномов. Прогнозируемое количество новых генов резко падает до нуля, когда количество геномов превышает 50. (b) Количество ядерных генов как функция количества секвенированных геномов. Количество ядерных генов сходится к 1,647 для числа геномов n → ∞. Донати и др.[12]

Первоначальная концепция пангенома была разработана Tettelin et al.[1] когда они проанализировали геномы восьми изолятов Streptococcus agalactiae который можно описать как основной геном, общий для всех изолятов, составляющий примерно 80% любого отдельного генома, плюс необязательный геном, состоящий из частично общих и специфичных для штамма генов. Экстраполяция предполагает, что резервуар генов в S. agalactiae пангеном огромен, и новые уникальные гены будут продолжать идентифицироваться даже после секвенирования сотен геномов.[1]

Структуры данных

Графы пангеномов - это новые структуры данных, предназначенные для представления пангеномов и эффективного сопоставления с ними чтения. Они были рассмотрены Eizenga et al. [13]

Примеры

Похожая картина была обнаружена в Пневмококк при секвенировании 44 штаммов (см. рисунок). С каждым секвенированием нового генома обнаруживалось все меньше новых генов. Фактически, прогнозируемое количество новых генов упало до нуля, когда количество геномов превышает 50 (обратите внимание, однако, что это характерно не для всех видов). Это означало бы, что S. pneumoniae имеет «закрытый пангеном».[14] Основной источник новых генов в S. pneumoniae был Стрептококковый митит откуда гены были перенесены горизонтально. Размер пангенома S. pneumoniae увеличивается логарифмически с числом штаммов и линейно с числом полиморфных сайтов выбранных геномов, что позволяет предположить, что приобретенные гены накапливаются пропорционально возрасту клонов.[12]

Другой пример последнего можно увидеть при сравнении размеров ядра и пангенома Прохлорококк. Основной набор генома логически намного меньше пангенома, который используется различными экотипами Прохлорококк.[15] Исследование 2015 г. Prevotella бактерии, выделенные из люди, сравнил репертуар генов этого вида, полученный из разных участков тела человека. Он также сообщил об открытом пангеноме, демонстрирующем огромное разнообразие генофонда.[16]. Открытый пангеном наблюдается в изолятах из окружающей среды, таких как Алкалигены sp.[17] и Серратия sp. [18], демонстрируя симпатичный образ жизни.

Программные инструменты

По мере роста интереса к пангеномам возник ряд программного обеспечения инструменты, разработанные для анализа данных такого рода. В 2015 году группа рассмотрела различные виды анализов и инструменты, которые могут быть доступны исследователю.[19] Для анализа пангеномов разработано семь видов аналитического программного обеспечения: кластерные гомологичные гены; идентифицировать SNP; построить пангеномные профили; выстраивать филогенетические отношения ортологичных генов / семейств штаммов / изолятов; поиск по функциям; аннотация и / или курирование; и визуализации.[19]

Два наиболее цитируемых программных инструмента на конец 2014 г.[19] были Пансек[20] и конвейер пангеномного анализа (PGAP).[21] Другие варианты включают BPGA - конвейер пан-геномного анализа прокариотических геномов,[22] GET_HOMOLOGUES ,[23] Ревущий[24] и ПанДелос.[25]

Обзор, посвященный пангеномам растений, был опубликован в 2015 году.[26] Среди первых программных пакетов, разработанных для пангеномов растений, были: PanTools[27] и GET_HOMOLOGUES-EST.[8][28]

Совсем недавно было выполнено вычислительное сравнение инструментов для извлечения пангеномного содержимого на основе генов (таких как GET_HOMOLOGUES, PanDelos, Roary и другие). [29]. Инструменты сравнивались с методологической точки зрения, анализируя причины, по которым данная методология превосходит другие инструменты. Анализ проводился с учетом различных бактериальных популяций, которые генерируются синтетически в результате изменения параметров эволюции. Результаты показывают дифференциацию производительности каждого инструмента, которая зависит от состава входных геномов.

Смотрите также

Рекомендации

  1. ^ а б c d е ж грамм час я Tettelin H, Masignani V, Cieslewicz MJ, Donati C, Medini D, Ward NL и др. (Сентябрь 2005 г.). «Геномный анализ множественных патогенных изолятов Streptococcus agalactiae: значение для микробного» пангенома"". Труды Национальной академии наук Соединенных Штатов Америки. 102 (39): 13950–5. Bibcode:2005ПНАС..10213950Т. Дои:10.1073 / pnas.0506758102. ЧВК  1216834. PMID  16172379.
  2. ^ а б c Медини Д., Донати С., Теттелин Н., Масиньяни В., Раппуоли Р (Декабрь 2005 г.). «Пангеном микробов». Текущее мнение в области генетики и развития. 15 (6): 589–94. Дои:10.1016 / j.gde.2005.09.006. PMID  16185861.
  3. ^ а б c d Верникос Г., Медини Д., Райли Д. Р., Теттелин Н. (февраль 2015 г.). «Десять лет пангеномного анализа». Текущее мнение в микробиологии. 23: 148–54. Дои:10.1016 / j.mib.2014.11.016. PMID  25483351.
  4. ^ Вольф Ю.И., Макарова К.С., Ютин Н., Кунин Е.В. (декабрь 2012 г.). «Обновленные кластеры ортологичных генов архей: сложный предок архей и пути горизонтального переноса генов». Биол. Прямой. 7: 46. Дои:10.1186/1745-6150-7-46. ЧВК  3534625. PMID  23241446.
  5. ^ Верникос, Джордж; Медини, Дуччо; Райли, Дэвид Р.; Теттелин, Эрве (2015). «Десять лет пангеномного анализа». Текущее мнение в микробиологии. 23: 148–154. Дои:10.1016 / j.mib.2014.11.016. PMID  25483351.
  6. ^ Морганте М., Де Паоли Э, Радович С. (апрель 2007 г.). «Мобильные элементы и пангеномы растений». Текущее мнение в области биологии растений. 10 (2): 149–55. Дои:10.1016 / j.pbi.2007.02.001. PMID  17300983.
  7. ^ Гордон С.П., Контрерас-Морейра Б., Вудс Д.П., Де Марэ Д.Л., Берджесс Д., Шу С. и др. (Декабрь 2017 г.). «Обширные вариации содержания генов в пангеноме Brachypodium distachyon коррелируют со структурой популяции». Nature Communications. 8 (1): 2184. Bibcode:2017 НатКо ... 8,2184 г. Дои:10.1038 / s41467-017-02292-8. ЧВК  5736591. PMID  29259172.
  8. ^ а б Контрерас-Морейра Б., Канталапьедра С.П., Гарсия-Перейра М.Дж., Гордон С.П., Фогель Дж.П., Игартуа Э. и др. (Февраль 2017). «Анализ пангеномов и транскриптомов растений с помощью GET_HOMOLOGUES-EST, решения для кластеризации последовательностей одного и того же вида». Границы науки о растениях. 8: 184. Дои:10.3389 / fpls.2017.00184. ЧВК  5306281. PMID  28261241.
  9. ^ Рено М.Л., Хелд Н.Л., Филдс С.Дж., Берк П.В., Уитакер Р.Дж. (май 2009 г.). «Биогеография пангенома Sulfolobus islandicus». Труды Национальной академии наук Соединенных Штатов Америки. 106 (21): 8605–10. Bibcode:2009ПНАС..106.8605Р. Дои:10.1073 / pnas.0808945106. ЧВК  2689034. PMID  19435847.
  10. ^ Рейнхардт Дж. А., Балтрус Д. А., Нишимура М. Т., Джек В. Р., Джонс CD, Дангл Дж. Л. (февраль 2009 г.). «Сборка de novo с использованием данных последовательности короткого считывания с низким уровнем покрытия из патогена риса Pseudomonas syringae pv. Oryzae». Геномные исследования. 19 (2): 294–305. Дои:10.1101 / гр.083311.108. ЧВК  2652211. PMID  19015323.
  11. ^ Tettelin, H .; Медини, Д. (2020). Теттелин, Эрве; Медини, Дуччо (ред.). Пангеном (PDF). Дои:10.1007/978-3-030-38281-0. ISBN  978-3-030-38280-3. PMID  32633908. S2CID  217167361.
  12. ^ а б Донати Ч., Хиллер Н.Л., Теттелин Х., Муцци А., Краучер Н.Дж., Ангиуоли С.В. и др. (2010). «Структура и динамика пангенома Streptococcus pneumoniae и близкородственных видов». Геномная биология. 11 (10): R107. Дои:10.1186 / gb-2010-11-10-r107. ЧВК  3218663. PMID  21034474.
  13. ^ Eizenga JM, Novak AM, Sibbesen JA, Heumos S, Ghaffaari A, Hickey G, Chang X, Seaman JD, Rounthwaite R, Ebler J, Rautiainen M, Garg S, Paten B, Marschall T, Sirén T, Garrison E (август 2020 г.) ). "Графики пангенома". Ежегодный обзор геномики и генетики человека. 21: 139–162. Дои:10.1146 / annurev-genom-120219-080406. PMID  32453966.
  14. ^ Рули Л., Мерхей В., Фурнье П. Е., Рауль Д. (сентябрь 2015 г.). «Бактериальный пангеном как новый инструмент для анализа патогенных бактерий». Новые микробы и новые инфекции. 7: 72–85. Дои:10.1016 / j.nmni.2015.06.005. ЧВК  4552756. PMID  26442149.
  15. ^ Kettler GC, Martiny AC, Huang K, Zucker J, Coleman ML, Rodrigue S и др. (Декабрь 2007 г.). «Паттерны и последствия приобретения и потери генов в эволюции Prochlorococcus». PLOS Genetics. 3 (12): e231. Дои:10.1371 / journal.pgen.0030231. ЧВК  2151091. PMID  18159947.
  16. ^ Гупта В.К., Чаудхари Н.М., Искепалли С., Датта С. (март 2015 г.). «Расхождения в репертуаре генов эталонных геномов Prevotella, полученных из различных участков тела человека». BMC Genomics. 16 (153): 153. Дои:10.1186 / s12864-015-1350-6. ЧВК  4359502. PMID  25887946.
  17. ^ Башарат З., Ясмин А., Хе Т, Тонг Ю. (2018). «Секвенирование генома и анализ Alcaligenes faecalis subsp. Phenolicus MB207». Научные отчеты. 8 (1): 3616. Bibcode:2018НатСР ... 8,3616B. Дои:10.1038 / s41598-018-21919-4. ЧВК  5827749. PMID  29483539.
  18. ^ Башарат З., Ясмин А. (2016). «Пангеномный анализ рода Serratia». arXiv:1610.04160 [q-bio.GN ].
  19. ^ а б c Сяо Дж, Чжан З, Ву Дж, Ю Дж (февраль 2015 г.). «Краткий обзор программных средств пангеномики». Геномика, протеомика и биоинформатика. 13 (1): 73–6. Дои:10.1016 / j.gpb.2015.01.007. ЧВК  4411478. PMID  25721608.
  20. ^ Laing C, Buchanan C, Taboada EN, Zhang Y, Kropinski A, Villegas A, et al. (Сентябрь 2010 г.). «Пан-геномный анализ последовательности с использованием Panseq: онлайн-инструмент для быстрого анализа основных и дополнительных участков генома». BMC Bioinformatics. 11 (1): 461. Дои:10.1186/1471-2105-11-461. ЧВК  2949892. PMID  20843356.
  21. ^ Чжао Й, Ву Дж, Ян Дж, Сунь С, Сяо Дж, Ю Дж (февраль 2012 г.). "PGAP: конвейер пангеномного анализа". Биоинформатика. 28 (3): 416–8. Дои:10.1093 / биоинформатика / btr655. ЧВК  3268234. PMID  22130594.
  22. ^ Чаудхари Н.М., Гупта В.К., Датта С. (апрель 2016 г.). «BPGA - сверхбыстрый конвейер пангеномного анализа». Научные отчеты. 6 (24373): 24373. Bibcode:2016НатСР ... 624373C. Дои:10.1038 / srep24373. ЧВК  4829868. PMID  27071527.
  23. ^ Контрерас-Морейра Б., Винуеса П. (декабрь 2013 г.). "GET_HOMOLOGUES, универсальный программный пакет для масштабируемого и надежного анализа микробных пангеномов". Прикладная и экологическая микробиология. 79 (24): 7696–701. Дои:10.1128 / AEM.02411-13. ЧВК  3837814. PMID  24096415.
  24. ^ Пейдж AJ, Cummins CA, Hunt M, Wong VK, Reuter S, Holden MT и др. (Ноябрь 2015 г.). «Роури: быстрый крупномасштабный пангеномный анализ прокариот». Биоинформатика. 31 (22): 3691–3. Дои:10.1093 / биоинформатика / btv421. ЧВК  4817141. PMID  26198102.
  25. ^ Bonnici V, Giugno R, Manca V (ноябрь 2018 г.). "PanDelos: словарный метод для обнаружения пан-геномного содержания". BMC Bioinformatics. 19 (Приложение 15): 437. Дои:10.1186 / s12859-018-2417-6. ЧВК  6266927. PMID  30497358.
  26. ^ Голич А.А., Бэтли Дж., Эдвардс Д. (апрель 2016 г.). «К пангеномике растений» (PDF). Журнал биотехнологии растений. 14 (4): 1099–105. Дои:10.1111 / pbi.12499. PMID  26593040.
  27. ^ Шейхизаде С., Шранц М.Э., Акдел М., де Риддер Д., Смит С. (сентябрь 2016 г.). «PanTools: представление, хранение и исследование пангеномных данных». Биоинформатика. 32 (17): i487 – i493. Дои:10.1093 / биоинформатика / btw455. PMID  27587666.
  28. ^ Контрерас-Морейра Б., Винуеса П. (декабрь 2013 г.). "GET_HOMOLOGUES, универсальный программный пакет для масштабируемого и надежного анализа микробных пангеномов". Прикладная и экологическая микробиология. 79 (24): 7696–701. Дои:10.1128 / AEM.02411-13. ЧВК  3837814. PMID  24096415.
  29. ^ Бонничи В., Марези Э., Джуньо Р. (2020). «Проблемы в генно-ориентированных подходах к открытию содержания пангенома». Брифинги по биоинформатике. Дои:10.1093 / bib / bbaa198. ISSN  1477-4054. PMID  32893299.