Генная онтология - Gene ontology

Генная онтология
Database.png
Содержание
ОписаниеРесурс с контролируемый словарный запас описать функцию гены и генные продукты
Доступ
Интернет сайтгенеонтология.org

В Генная онтология (ИДТИ) является основным биоинформатика инициатива по унификации представительства ген и генный продукт атрибуты по всем разновидность.[1] В частности, проект направлен на: 1) поддержание и развитие своего контролируемый словарный запас атрибутов генов и генных продуктов; 2) аннотировать гены и генные продукты, а также ассимилировать и распространять аннотационные данные; и 3) предоставить инструменты для легкого доступа ко всем аспектам данных, предоставляемых проектом, и для обеспечения функциональной интерпретации экспериментальных данных с использованием GO, например, посредством анализа обогащения.[2][3] GO является частью более крупной классификации, Открытые биомедицинские онтологии, являясь одним из первых кандидатов в члены OBO Foundry.[4]

В то время как номенклатура генов фокусируется на генах и генных продуктах, генная онтология сосредотачивается на функциях генов и генных продуктах. GO также расширяет возможности, используя язык разметки для получения данных (не только о генах и их продуктах, но и о тщательно подобранных атрибутах) машиночитаемый, и делать это таким образом, чтобы это было едино для всех видов (тогда как соглашения о номенклатуре генов различаются в зависимости от биологических таксон ).

Термины и онтология

С практической точки зрения онтология - это представление того, о чем мы знаем. «Онтологии» состоят из представлений вещей, которые можно обнаружить или непосредственно наблюдать, и взаимосвязей между этими вещами. В биологии и смежных областях не существует универсальной стандартной терминологии, а использование терминов может быть специфическим для вида, области исследования или даже конкретной исследовательская группа. Это затрудняет обмен данными и обмен данными. Проект Gene Ontology предоставляет онтология определенных терминов, представляющих генный продукт характеристики. Онтология охватывает три области:

Каждый термин GO в онтологии имеет имя термина, которое может быть словом или строкой слов; уникальный буквенно-цифровой идентификатор; определение с цитированием источников; и онтология, указывающая домен, к которому он принадлежит. У терминов также могут быть синонимы, которые классифицируются как полностью эквивалентные названию термина, более широкие, узкие или связанные; ссылки на эквивалентные концепции в других базах данных; и комментарии по значению или использованию термина. Онтология GO структурирована как ориентированный ациклический граф, и каждый термин определил отношения к одному или нескольким другим терминам в том же домене, а иногда и к другим доменам. Словарь GO разработан так, чтобы не зависеть от вида, и включает термины, применимые к прокариоты и эукариоты, Один и многоклеточные организмы.

GO не статичен, и дополнения, исправления и изменения предлагаются и запрашиваются членами исследовательских сообществ и сообществ аннотаций, а также теми, кто непосредственно участвует в проекте GO.[5] Например, аннотатор может запросить конкретный термин для представления метаболического пути, или часть онтологии может быть изменена с помощью экспертов сообщества (например,[6]). Предлагаемые изменения проверяются редакторами онтологий и при необходимости применяются.

Файлы онтологии и аннотации GO находятся в свободном доступе на веб-сайте GO.[7] в нескольких форматах или доступны в Интернете с помощью браузера GO AmiGO. Проект Gene Ontology также предоставляет загружаемые сопоставления своих терминов с другими системами классификации.

Пример термина

id: GO: 0000016
название: активность лактазы
онтология: молекулярная функция
def: «Катализ реакции: лактоза + H2O = D-глюкоза + D-галактоза». [EC: 3.2.1.108]
синоним: «активность лактазы-флоризингидролазы» ШИРОКО [EC: 3.2.1.108]
синоним: «активность лактозогидролазы» ТОЧНО [EC: 3.2.1.108]
xref: EC: 3.2.1.108
xref: MetaCyc: LACTASE-RXN
xref: Reactome: 20536
is_a: GO: 0004553! гидролазная активность, гидролизующие О-гликозильные соединения

Источник данных:[8]

Аннотации

Аннотации генома охватывает практику сбора данных о генном продукте, а в аннотациях GO для этого используются термины из GO. Аннотации от кураторов GO интегрированы и распространяются на веб-сайте GO, где их можно скачать напрямую или просмотреть в Интернете с помощью AmiGO.[9] Помимо идентификатора генного продукта и соответствующего термина GO, аннотации GO содержат как минимум следующие данные: ссылка используется для аннотации (например, журнальной статьи); An код доказательства обозначение типа свидетельства, на котором основывается аннотация; Дата и автор аннотации


В аннотацию GO также может быть включена вспомогательная информация, в зависимости от термина GO и используемых доказательств, а также дополнительная информация, такая как условия, при которых наблюдается функция.

Код доказательств взят из контролируемый словарный запас кодов, онтология кода свидетельства, охватывающая как ручные, так и автоматизированные методы аннотации.[10] Например, Заявление отслеживаемого автора (TAS) означает, что куратор прочитал опубликованную научную статью, и метаданные для этой аннотации содержат ссылку на эту статью; Выводится из сходства последовательностей (ISS) означает, что куратор проанализировал результаты поиска по сходству последовательностей и подтвердил их биологическое значение. Аннотации из автоматизированных процессов (например, переназначение аннотаций, созданных с использованием другого словаря аннотаций) получают код Предполагается из электронной анотации (МЭА). В 2010 году более 98% всех аннотаций GO были выведены с помощью вычислений, а не кураторами, но по состоянию на 2 июля 2019 года только около 30% всех аннотаций GO были выведены с помощью вычислений.[11][12]Поскольку эти аннотации не проверяются человеком, Консорциум GO считает их несколько менее надежными, и они обычно относятся к более высокоуровневым и менее подробным условиям. Полные наборы аннотационных данных можно загрузить с веб-сайта GO. Чтобы поддержать разработку аннотаций, Консорциум GO проводит семинары и наставляет новые группы кураторов и разработчиков.

Много машинное обучение были разработаны и реализованы алгоритмы для прогнозирования аннотаций генных онтологий.[13][14]

Пример аннотации

Генный продукт: актин, альфа-сердечная мышца 1, UniProtKB: P68032
Срок действия: сердечное сокращение; GO: 0060047 (биологический процесс)
Код доказательства: выведен из мутантного фенотипа (IMP)
Ссылка: PMID  17611253
Назначен: UniProtKB, 6 июня 2008 г.

Источник данных:[15]

Инструменты

Доступно большое количество инструментов[16] как онлайн, так и для загрузки, использующие данные, предоставленные проектом GO. Подавляющее большинство из них поступает от третьих лиц; Консорциум GO разрабатывает и поддерживает два инструмента: AmiGO и OBO-Edit.

AmiGO[17][9] это веб-приложение, которое позволяет пользователям запрашивать, просматривать и визуализировать онтологии и данные аннотаций генных продуктов. Он также имеет ВЗРЫВ инструмент,[18] инструменты, позволяющие анализировать большие наборы данных,[19][20] и интерфейс для прямого запроса базы данных GO.[21]

AmiGO можно использовать онлайн на веб-сайте GO для доступа к данным, предоставленным Консорциумом GO, или его можно загрузить и установить для локального использования в любой базе данных, использующей схему базы данных GO (например,[22]). Это бесплатно программное обеспечение с открытым исходным кодом и доступен как часть распространения программного обеспечения go-dev.[23]

OBO-Edit[24] - это редактор онтологий с открытым исходным кодом, независимый от платформы, разработанный и поддерживаемый Gene Ontology Consortium. Он реализован в Ява, и использует ориентированный на граф подход к отображению и редактированию онтологий. OBO-Edit включает в себя комплексный интерфейс поиска и фильтрации с возможностью отображать подмножества терминов, чтобы сделать их визуально различимыми; пользовательский интерфейс также можно настроить в соответствии с предпочтениями пользователя. OBO-Edit также имеет рассуждающий которые могут выводить ссылки, которые не были явно указаны, на основе существующих отношений и их свойств. Хотя он был разработан для биомедицинских онтологий, OBO-Edit можно использовать для просмотра, поиска и редактирования любой онтологии. Он доступен для бесплатного скачивания.[23]

Консорциум

Консорциум Gene Ontology - это набор биологические базы данных и исследовательские группы, активно участвующие в проекте генной онтологии.[12] Это включает в себя ряд модельный организм базы данных и многовидовые белковые базы данных, группы разработки программного обеспечения и отдельная редакция.

История

Онтология генов была первоначально создана в 1998 году консорциумом исследователей, изучающих геномы из трех модельные организмы: Drosophila melanogaster (плодовая муха), Mus musculus (мышь) и Saccharomyces cerevisiae (пивные или пекарские дрожжи).[25] Много других Базы данных модельных организмов присоединились к Консорциуму генных онтологий, предоставляя не только аннотационные данные, но также внося свой вклад в разработку онтологий и инструментов для просмотра и применения данных. Многие крупные базы данных по растениям, животным и микроорганизмам вносят свой вклад в этот проект.[7] По состоянию на июль 2019 года GO содержит 44 945 терминов; Есть 6 408 283 аннотаций к 4 467 различным биологическим организмам.[7] Существует значительный объем литературы по разработке и использованию GO, и он стал стандартным инструментом в биоинформатика арсенал. Их цели включают три аспекта: построение генной онтологии, присвоение онтологии генам / генным продуктам и разработка программного обеспечения и баз данных для первых двух объектов.

Также начинает появляться несколько анализов генной онтологии с использованием формальных, независимых от предметной области свойств классов (метасвойств). Например, онтологический анализ биологических онтологий см.[26]

Смотрите также

Рекомендации

  1. ^ Консорциум генных онтологий (январь 2008 г.). «Проект генной онтологии в 2008 году». Исследования нуклеиновых кислот. 36 (Выпуск базы данных): D440–4. Дои:10.1093 / нар / гкм883. ЧВК  2238979. PMID  17984083.
  2. ^ Дессимоз, Кристоф; Škunca, Nives, eds. (2017). Справочник по генной онтологии. Методы молекулярной биологии. 1446. Дои:10.1007/978-1-4939-3743-1. ISBN  9781493937431. ISSN  1064-3745. S2CID  3708801. открытый доступ
  3. ^ Годе, Паскаль; Шкунца, Нивес; Ху, Джеймс С .; Дессимоз, Кристоф (2017). «Букварь по онтологии генов». Справочник по генной онтологии. Методы молекулярной биологии. 1446. С. 25–37. Дои:10.1007/978-1-4939-3743-1_3. ISBN  978-1-4939-3741-7. ISSN  1064-3745. ЧВК  6377150. PMID  27812933.
  4. ^ Смит Б., Эшбёрнер М., Россе С., Бард Дж., Баг В., Цеустерс В., Голдберг Л.Дж., Эйлбек К., Ирландия А., Мунгалл С.Дж., Леонтис Н., Рокка-Серра П., Руттенберг А., Сансон С.А., Шойерманн Р.Х., Шах Н., Whetzel PL, Lewis S (ноябрь 2007 г.). «The OBO Foundry: скоординированная эволюция онтологий для поддержки интеграции биомедицинских данных». Природа Биотехнологии. 25 (11): 1251–5. Дои:10.1038 / nbt1346. ЧВК  2814061. PMID  17989687.
  5. ^ Ловеринг, Рут С. (2017). «Как научное сообщество вносит свой вклад в генную онтологию?». In Dessimoz, C; Skunca, N (ред.). Справочник по генной онтологии. Методы молекулярной биологии. 1446. Спрингер (Нью-Йорк). С. 85–93. Дои:10.1007/978-1-4939-3743-1_7. ISBN  978-1-4939-3741-7. ISSN  1064-3745. PMID  27812937.
  6. ^ Диль А.Д., Ли Дж.А., Шойерманн Р.Х., Блейк Дж. (Апрель 2007 г.). «Разработка онтологии биологических систем: иммунология». Биоинформатика. 23 (7): 913–5. Дои:10.1093 / биоинформатика / btm029. PMID  17267433.
  7. ^ а б c "Ресурс генной онтологии". Консорциум генных онтологий.
  8. ^ Сджкарбон, Wiki Консорциума генных онтологий (2013-07-10). "AmiGO_2_Manual: term_Page" (HTML).
  9. ^ а б AmiGO - текущий официальный веб-набор инструментов для поиска и просмотра базы данных Gene Ontology
  10. ^ «Онтология кода свидетельств». Онтология кода свидетельств.
  11. ^ дю Плесси Л., Скунка Н., Дессимоз С. (ноябрь 2011 г.). «Что, где, как и почему онтологии генов - учебник для биоинформатиков». Брифинги по биоинформатике. 12 (6): 723–35. Дои:10.1093 / bib / bbr002. ЧВК  3220872. PMID  21330331.
  12. ^ а б «Консорциум ГО». Получено 2009-03-16.
  13. ^ Пиноли П., Чикко Д., Массероли М. (июнь 2013 г.). «Вычислительные алгоритмы для прогнозирования аннотации генной онтологии». BMC Bioinformatics. 16 (6): S4. Дои:10.1186 / 1471-2105-16-S6-S4. ЧВК  4416163. PMID  25916950.
  14. ^ Коццетто, Доменико; Джонс, Дэвид Т. (2017). «Вычислительные методы передачи аннотаций из последовательности». In Dessimoz, C; Skunca, N (ред.). Справочник по генной онтологии. Методы молекулярной биологии. 1446. Спрингер (Нью-Йорк). С. 55–67. Дои:10.1007/978-1-4939-3743-1_5. ISBN  978-1-4939-3741-7. ISSN  1064-3745. PMID  27812935.
  15. ^ Консорциум GO (16 марта 2009 г.). "AmiGO: P68032 Ассоциации".
  16. ^ Mosquera JL, Sánchez-Pla A (июль 2008 г.). «SerbGO: в поисках лучшего инструмента GO». Исследования нуклеиновых кислот. 36 (Выпуск веб-сервера): W368–71. Дои:10.1093 / нар / gkn256. ЧВК  2447766. PMID  18480123.
  17. ^ Углерод С., Ирландия А., Мунгалл С. Дж., Шу С., Маршал Б., Льюис С. (январь 2009 г.). AmiGO Hub; Рабочая группа по веб-присутствию. «AmiGO: онлайн-доступ к онтологическим и аннотационным данным». Биоинформатика. 25 (2): 288–9. Дои:10.1093 / биоинформатика / btn615. ЧВК  2639003. PMID  19033274.
  18. ^ «Инструмент AmiGO BLAST». Архивировано из оригинал на 2011-08-20. Получено 2009-03-13.
  19. ^ Инструмент расширения терминов AmiGO В архиве 2008-04-07 на Wayback Machine; находит важные общие термины GO в наборе аннотаций
  20. ^ AmiGO Slimmer В архиве 2011-09-29 на Wayback Machine; отображает подробные аннотации до терминов высокого уровня
  21. ^ ГУСЬ, GO Online SQL Environment; позволяет выполнять прямой SQL-запрос к базе данных GO
  22. ^ Консорциум онтологии растений (16 марта 2009 г.). «Консорциум онтологии растений». Получено 2009-03-16.
  23. ^ а б "Онтология генов загружается на SourceForge". Получено 2009-03-16.
  24. ^ Дэй-Рихтер Дж., Харрис М.А., Хендель М., Льюис С. (Август 2007 г.). «OBO-Edit - редактор онтологий для биологов». Биоинформатика. 23 (16): 2198–200. Дои:10.1093 / биоинформатика / btm112. PMID  17545183.
  25. ^ Ashburner M, Ball CA, Блейк Дж., Botstein D, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, Harris MA, Hill DP, Issel-Tarver L, Kasarskis A, Lewis S, Matese JC, Richardson JE, Ringwald M, Rubin GM , Шерлок Джи (май 2000 г.). «Генная онтология: инструмент для объединения биологии. Консорциум генных онтологий». Природа Генетика. 25 (1): 25–9. Дои:10.1038/75556. ЧВК  3037419. PMID  10802651.
  26. ^ Деб, Б. (2012). «Онтологический анализ некоторых биологических онтологий». Границы генетики. 3: 269. Дои:10.3389 / fgene.2012.00269. ЧВК  3509948. PMID  23226158.
  27. ^ Гётц С., Гарсия-Гомес Дж. М., Терол Дж., Уильямс Т. Д., Нагарадж С.Х., Нуеда М.Дж., Роблес М., Талон М., Допазо Дж., Конеса А. (июнь 2008 г.). «Функциональная аннотация и интеллектуальный анализ данных с высокой пропускной способностью с помощью пакета Blast2GO». Исследования нуклеиновых кислот. 36 (10): 3420–35. Дои:10.1093 / nar / gkn176. ЧВК  2425479. PMID  18445632.

внешняя ссылка

  • AmiGO - текущий официальный веб-набор инструментов для поиска и просмотра базы данных Gene Ontology
  • Консорциум генных онтологий - официальный сайт
  • PlantRegMap - аннотация GO для 165 видов растений и анализ обогащения GO
  • SimCT - веб-инструмент для отображения взаимосвязей между биологическими объектами, аннотированными онтологией, в виде дерева кластеризации.
  • SerbGO - инструмент GO для сравнения возможностей различных программ, чтобы показать их общие особенности и различия, а также определить, какие инструменты, если таковые имеются, обладают некоторыми специфическими необходимыми для пользователя возможностями для анализа GO.
  • Доменно-ориентированная онтология генов - база данных предметно-ориентированных онтологий по функциям, фенотипам, заболеваниям и др.