GeneNetwork - GeneNetwork

GeneNetwork
Разработчики)Группа разработчиков GeneNetwork, Университет Теннесси
Стабильный выпуск
2.0 / 15 января 1994; 26 лет назад (1994-01-15)
Репозиторийgithub.com/ genenetwork/ genenetwork2
Написано вJavaScript, HTML, Python, CSS, CoffeeScript, PHP
ЛицензияСтандартная общественная лицензия Affero
Интернет сайтwww.genenetwork.org

GeneNetwork это комбинированная база данных и Открытый исходный код биоинформатика программный ресурс для анализа данных для системная генетика.[1] Этот ресурс используется для изучения сети регуляции генов которые связывают различия в последовательностях ДНК с соответствующими различиями в экспрессии генов и белков, а также с вариациями в таких характеристиках, как здоровье и риск заболевания. Наборы данных в GeneNetwork обычно состоят из больших наборов генотипов (например, SNP ) и фенотипы групп людей, включая людей, линии мышей и крыс, а также такие разнообразные организмы, как Drosophila melanogaster, Arabidopsis thaliana, и ячмень.[2] Включение генотипов делает практичным проведение веб- генное картирование чтобы обнаружить те области генома, которые вносят вклад в различия между людьми в уровнях мРНК, белка и метаболитов, а также в различия в функции клеток, анатомии, физиологии и поведении.

История

Разработка GeneNetwork началась в Медицинском научном центре Университета Теннесси в 1994 году как веб-версия Переносной словарь генома мыши (1994).[3] GeneNetwork - это первая и самая продолжительная непрерывно работающая веб-служба в области биомедицинских исследований [см. https://en.wikipedia.org/wiki/List_of_websites_founded_before_1995 ]. В 1999 г. Portable Gene Dictionary был объединен с изданием Kenneth F. Manly. Менеджер карты Программа картирования QT для создания онлайн-системы для генетического анализа в реальном времени.[4] В начале 2003 г. состоялся первый крупный Affymetrix наборы данных экспрессии генов (целые мозг мыши мРНК и гемопоэтические стволовые клетки), и система была переименована в WebQTL.[5][6] GeneNetwork теперь разрабатывается международной группой разработчиков и имеет зеркала и сайты разработки в Европе, Азии и Австралии. Производственные услуги размещены в системах по адресу Научный центр здоровья Университета Теннесси с резервным экземпляром в Европе.

Текущая производственная версия GeneNetwork (также известная как GN2) была выпущена в 2016 году.[7] Текущая версия GeneNetwork использует ту же базу данных, что и ее предшественник, GN1, но имеет гораздо более модульный и поддерживаемый открытый исходный код (доступен на GitHub ). GeneNetwork теперь также имеет важные новые функции, включая поддержку:

Организация и использование

GeneNetwork состоит из двух основных компонентов:

  • Огромные коллекции генетических, геномных и фенотипических данных для больших когорт людей
  • Сложное программное обеспечение для статистического анализа и картирования генов, которое позволяет анализировать молекулярные и клеточные сети и отношения генотип-фенотип

Для каждой семьи или группы населения обычно получают четыре уровня данных:

  1. Последовательности ДНК и генотипы
  2. Данные молекулярной экспрессии часто генерируются с использованием массивы, РНК-последовательность, эпигеномный, протеомный, метаболомный и метагеномный методы (молекулярные фенотипы)
  3. Стандартный количественный фенотипы которые часто являются частью типичной медицинской карты (например, химический анализ крови, масса тела)
  4. Файлы аннотаций и метаданные для признаков и наборов данных

Комбинированные типы данных размещаются вместе в реляционной базе данных и на файловом сервере IPSF и концептуально организованы и сгруппированы по видам, когортам и семействам. Система реализована как ЛАМПА (комплект ПО) куча. Код и упрощенная версия MariaDB базы данных доступны на GitHub.

GeneNetwork в основном используется исследователями, но также была успешно принята для студентов и аспирантов в области генетики и биоинформатики (см. Пример YouTube ), биоинформатики, физиологии и психологии.[11] Исследователи и студенты обычно извлекают наборы генотипов и фенотипов из одной или нескольких семей и используют встроенные статистические и картографические функции, чтобы исследовать отношения между переменными и создавать сети ассоциаций. Ключевые шаги включают анализ этих факторов:

  1. Диапазон варьирования черт
  2. Ковариация между признаками (диаграммы рассеяния и корреляции, анализ главных компонент)
  3. Архитектура больших сетей черт
  4. Локус количественного признака картирование и причинно-следственные модели связи между различиями последовательностей и различиями фенотипа

Источники данных

Наборы данных по признакам и молекулярной экспрессии отправляются исследователями напрямую или извлекаются из таких репозиториев, как Национальный центр биотехнологической информации Омнибус экспрессии генов. Данные охватывают множество клеток и тканей - от одноклеточных популяций иммунной системы, конкретных тканей (сетчатка, префронтальная кора) до целых систем (весь мозг, легкие, мышцы, сердце, жир, почки, цветы, зародыши целых растений) . Типичный набор данных охватывает сотни полностью генотипированных людей и может также включать технические и биологические копии. Генотипы и фенотипы обычно берутся из рецензируемых статей. GeneNetwork включает файлы аннотаций для нескольких платформ профилирования РНК (Affymetrix, Illumina и Agilent). RNA-seq и количественные протеомные, метаболомные, эпигенетические и метагеномные данные также доступны для нескольких видов, включая мыши и человека.

Инструменты и особенности

На сайте есть инструменты для широкого спектра функций, которые варьируются от простых графических отображений вариаций в экспрессии генов или других фенотипов до диаграмм разброса пар признаков (Пирсона или порядок ранжирования), построения простых и сложных сетевых графиков, анализа основных компонентов и синтетических признаков, картирование QTL с использованием маркерной регрессии, интервальное картирование и парное сканирование для эпистатических взаимодействий. Большинство функций работают со 100 признаками, а несколько функций работают с целым транскриптом.

Базу данных можно просматривать и искать на главном поиск страница. Он-лайн руководство доступен. Пользователи также могут скачать первичные наборы данных в виде текстовых файлов, Excel или, в случае сетевых графиков, как SBML. По состоянию на 2017 год GN2 доступна в виде бета-версии.

Код

GeneNetwork - это проект с открытым исходным кодом, выпущенный под Стандартная общественная лицензия Affero (AGPLv3). Большая часть кода написана на Python, но включает модули и другой код, написанный на C, R и JavaScript. Код в основном Python 2.4. GN2 в основном написан на Python 2.7 в Колба рамки с Джиндзя 2 HTML-шаблона), но с переходом на Python 3.X, запланированным в ближайшие несколько лет. GN2 вызывает множество статистических процедур, написанных в Язык программирования R. Оригинальный исходный код 2010 года вместе с компактной базой данных доступен на SourceForge. Пока GN1 активно поддерживался в течение 2019 г. GitHub, по состоянию на 2020 год вся работа сосредоточена на GN2.

Смотрите также

Рекомендации

  1. ^ Morahan, G; Уильямс, RW (2007). «Системная генетика: следующее поколение генетических исследований?». Симпозиум фонда Novartis. 281: 181–8, обсуждение 188–91, 208–9. Дои:10.1002 / 9780470062128.ch15. PMID  17534074.
  2. ^ Друка, А; Друка, я; Сентено, АГ; Ли, Н; Солнце, Z; Томас, WT; Bonar, N; Стеффенсон, Б. Дж.; Ullrich, SE; Кляйнхофс, Андрис; Мудрый, Роджер П.; Близко, Тимоти Дж; Потокина, Елена; Луо, Зевей; Вагнер, Карола; Schweizer, Günther F; Маршалл, Дэвид Ф; Кирси, Майкл Дж; Уильямс, Роберт В; Во, Робби (2008). «На пути к системному генетическому анализу ячменя: интеграция фенотипических, экспрессионных и генотипических данных в GeneNetwork». BMC Genetics. 9: 73. Дои:10.1186/1471-2156-9-73. ЧВК  2630324. PMID  19017390.
  3. ^ Уильямс, RW (1994). «Портативный словарь генома мыши: персональная база данных для картирования генов и молекулярной биологии». Геном млекопитающих. 5 (6): 372–5. Дои:10.1007 / bf00356557. PMID  8043953.
  4. ^ Chesler, EJ; Лу, Л; Ван, Дж; Уильямс, RW; Мэнли, KF (2004). «WebQTL: быстрый исследовательский анализ экспрессии генов и генетических сетей для мозга и поведения». Природа Неврология. 7 (5): 485–6. Дои:10.1038 / nn0504-485. PMID  15114364.
  5. ^ Chesler, EJ; Лу, Л; Шоу, S; Qu, Y; Гу, Дж; Ван, Дж; Hsu, HC; Mountz, JD; и другие. (2005). «Комплексный анализ признаков экспрессии генов раскрывает полигенные и плейотропные сети, которые модулируют функцию нервной системы». Природа Генетика. 37 (3): 233–42. Дои:10,1038 / ng1518. PMID  15711545.
  6. ^ Быстрых, Л; Weersing, E; Dontje, B; Саттон, S; Плетчер, МП; Уилтшир, Т; Су, AI; Велленга, Э; и другие. (2005). «Выявление регуляторных путей, которые влияют на функцию гемопоэтических стволовых клеток, с использованием генетической геномики.'". Природа Генетика. 37 (3): 225–32. Дои:10,1038 / ng1497. PMID  15711547.
  7. ^ Sloan, Z (2016). «GeneNetwork: структура для веб-генетики». Журнал программного обеспечения с открытым исходным кодом. 1 (2): 25. Дои:10.21105 / joss.00025.
  8. ^ Чжоу, X (2014). «Эффективные многомерные алгоритмы линейной смешанной модели для полногеномных ассоциаций». Природные методы. 11 (2): 407–9. Дои:10.1038 / nmeth.2848. ЧВК  4211878. PMID  24531419.
  9. ^ Арендс, Д. (2016). «Картирование локусов корреляционных признаков (CTL): вывод сети фенотипа в зависимости от генотипа». Журнал программного обеспечения с открытым исходным кодом. 1 (6): 87. Дои:10.21105 / joss.00087.
  10. ^ Зибарт, JD (2013). «Веб-сервер байесовской сети: комплексный инструмент для моделирования биологических сетей». Биоинформатика. 29 (2 1): 2803–3. Дои:10.1093 / биоинформатика / btt472. PMID  23969134.
  11. ^ Гришэм, Вт; Schottler, NA; Валли-Марилл, Дж .; Бек, L; Битти, Дж (2010). «Обучение биоинформатике и нейроинформатике с использованием бесплатных веб-инструментов». CBE: Образование в области естественных наук. 9 (2): 98–107. Дои:10.1187 / cbe.09-11-0079. ЧВК  2879386. PMID  20516355.

внешняя ссылка

Связанные ресурсы

Другая системная генетика и сетевые базы данных