C19orf67 - Википедия - C19orf67

Белок UPF0575 C19orf67 это белок которые у людей (Homo sapiens ) кодируется C19orf67 ген.[1] Ортологи C19orf67 обнаружены у многих млекопитающих, некоторых рептилий и большинства челюстных рыб.[2][3] Белок экспрессируется на низком уровне по всему телу, за исключением яичек и ткани груди.[4][5] Предполагается, что там, где он экспрессируется, белок локализуется в ядро для выполнения функции. Предполагается, что высококонсервативный и медленно эволюционирующий регион DUFF3314 будет образовывать многочисленные альфа спирали и может иметь жизненно важное значение для функции белка.

Ген

У человека C19orf67 находится на минусовой цепи Хромосома 19 на 19p13.12 и охватывает 4 163 пары оснований (п.о.).[1][6]

Следующие гены находятся рядом с C19orf67 на положительной цепи:[1]

  • MISP3
  • Фактор элонгации трансляции эукариот 1, дельта-псевдоген 1 (EEF1DP1)
  • МикроРНК 1199 (MIR1199)
    Джин Окрестности C19orf67

Следующие гены находятся рядом с C19orf67 на минусовой цепи:[1]

транскрипт мРНК

C19orf67 имеет три варианта транскрипции, хотя второй и третий варианты предсказываются только Ансамбль анализ и экспериментально не подтвержден.[7] Только первые два варианта являются транскриптами, кодирующими белок.

Первая расшифровка состоит из 1447 пар оснований, а вторая и третья - 751 пар оснований и 656 пар оснований соответственно.[7] Зрелая мРНК самой длинной изоформы состоит из 6 экзоны.

Варианты соединения для C19orf67.[7]

Протеин

Немодифицированный белок содержит 358 аминокислот, прогнозируемый молекулярный вес 40 кДа, заряд -11 и изоэлектрическая точка из 5.[8][9] 44 пролины были обнаружены вдоль белка, составляя 12,3% от общей аминокислотной последовательности. Было обнаружено, что процентное содержание пролина в UPF0575 выше, чем в 95% сопоставимых белков человека. Однако сумма аспарагин белок менее распространен по сравнению с человеческим протеом.[9]

Домены

Обе изоформы содержать DUF3314. Хотя функция еще недостаточно изучена, сохранение среди множества таксонов указывает на то, что она может иметь важное значение для функции белка.[2][10] Первая изоформа имеет неповторяющийся богатый пролином участок из аминокислот с 12 по 80.[11] Функция этой области не совсем понятна, но она может участвовать в предотвращении образования спиралей из-за жесткой структуры пролина.[12]


Вторичная структура

Межпрограммный консенсус предсказал, что белок C19orf67 UPF0575 образует четыре альфа-спирали и два бета-листа в следующих местах аминокислотной последовательности:[13][14]

Спираль52-6290-108115-125153-180
Простынь193-202210-217

Посттрансляционные модификации

Ацетилирование скорее всего, произойдет на N-конце, тогда как C-конец вряд ли будет модифицирован.[15][16] О-гликозилирование предсказывается, что он встречается в аминокислотах 18 и 67. Несколько возможных фосфорилирование сайты были идентифицированы вместе с соответствующими киназы:[17][18]

Прогнозируемые посттрансляционные модификации и домены UPF0575 C19orf67.
Место расположенияАминокислотаКиназа
67Серинcdk5
127ТреонинPKC
169ТреонинPKC
196Серинcdc2
204СеринPKA
299ТирозинSRC
346СеринPKA / PKG

Субклеточная локализация

Ожидается, что белок C19orf67 UPF0575 будет нацелен на ядро в частности ядрышко.[19][20]

Выражение и регулирование

Обилие C19orf67 в организме человека по сравнению с обилием других белков человека.

Регулирование экспрессии генов

В промоутер регион прогнозируется, что начнется на 1303 б.н. вверх по течению от 5 'UTR и состоят из 1447 п.н., что приводит к перекрытию 144 п.н. с 5 'UTR.[21]

Номер факторы транскрипции Такие как FOXP1, SOX5, SOX6, SOX4, и MZF1 могут связываться с промотором, часто действуя на подавлять транскрипция. Что касается экспрессии других генов, эти факторы транскрипции обычно играют роль в развитии различных тканей, таких как сердце, легкие, а также принимают участие в дифференциация ранних эмбриональных клеток и красных кровяных телец.

Транскрипционная регуляция

Предполагается, что зрелая мРНК C19orf67 образует стержень петля на 3 'UTR который занимает от 1 296 до 1350 пар оснований транскрипта.[22]

Выражение ткани

У людей белок UPF0575 C19orf67 высоко экспрессируется в яичках и ткани груди, хотя он также экспрессируется на низких уровнях в желудке, коре головного мозга, щитовидной железе и слюнной железе.[8][4][5]

Белковый продукт менее распространен, чем большая часть протеома человека во многих тканях.[23]

Гомология

Паралоги

Нет известных паралоги белка UPF0575 C19orf67, а также не обнаружены какие-либо известные паралогичные домены DUF3314.[2][3]

Ортологи

Ортологи белка UPF0575 C19orf67, как было обнаружено, присутствует среди широкого разнообразия млекопитающих, причем он особенно хорошо представлен в родония и приматы. Ортологи также были обнаружены в каждом отряде рептилий, но их было гораздо меньше по сравнению с млекопитающими.[2][3] Большое количество и разнообразие ребристый у рыб были ортологи, в то время как их было меньше хрящевые рыбы обнаружены ортологи; нет рыба без челюсти можно найти с помощью ортологов.[2]

Отсутствуют какие-либо ортологи у птиц или амфибий. У беспозвоночных, грибов, бактерий или низших видов нет известных ортологов.

BLAT и ВЗРЫВ были использованы для создания следующей таблицы в качестве образца пространства ортологов для белка C19orf67 UPF0575.[2][3][24][25] Эта таблица не является полным списком ортологов, она предназначена для отображения диапазона, в котором существуют ортологи, и разнообразия этих видов.

Род и видыРаспространенное имяРегистрационный номерЗаказДивергенция (MYA)Длина последовательностиЛичностьСходство
Homo sapiensЧеловекNP_001264307Примас0358----
Galeopterus variegatusЗондский летающий лемурXP_008564240.1Dermoptera8235885%89%
Miniopterus natalensisЛетучая мышь с длинными пальцамиXP_016077689.1Рукокрылые9435684%89%
Ursus maritimusПолярный медведьXP_008709937.1Хищники9435885%89%
Mus musculusДомовая мышьNP_898920.2Rodentia8830071%74%
Gekko japonicusГеккоXP_015270669.1Squamata32033149%63%
Chelonia mydasЗеленая черепахаXP_007069233.1Testudinata32034549%61%
Аллигатор миссисипиенсисАмериканский аллигаторXP_019353135.1Крокодилы32029745%57%
Latimeria chalumnaeЗападно-индийская целакантXP_005995930.1Целакантообразные44041437%50%
Salmo salarАтлантический лососьXP_013986580.1Лососевые43233635%45%
Данио РериоДаниоNP_001083047.1Карповые43234432%44%
Pygocentrus nattereriКрасная пиранаXP_017554468.1Characiformes43234832%43%

Молекулярная эволюция

Белок C19orf67 UPF0575 состоит из одного семейства, и на протяжении всей эволюции белка C19orf67 UPF0575 не наблюдается явных дупликаций.[2]

Участок гена DUF3314, по-видимому, расходился медленнее по сравнению с остальной частью гена, что указывает на то, что эта область, возможно, подвергалась очищающему отбору, поскольку эта область играла важную роль в белке.[2][24][25]

Клиническое значение

В одном тематическом исследовании C19orf67 был одним из 29 генов на 19 хромосоме, потерянных из-за делеций, вызванных хромосомные перестройки. Перестройки привели к проблемам нервного развития и поведенческим аномалиям, хотя неизвестно, играл ли C19orf67 активную роль в образовавшемся результате. фенотипы.[26] В другом исследовании, когда часть хромосомы 19, которая также включала C19orf67, была удалена, возникли проблемы развития, такие как Ограничение внутриутробного развития, преждевременные роды и мышечная гипотония, произошел.[27]

C19orf67, среди многих других генов, может использоваться в качестве возможного маркера для обнаружения зрелых бета-клеток.[28]

Рекомендации

  1. ^ а б c d «Открытая рамка считывания 67 хромосомы 19 C19orf67 [Homo sapiens (человек)] - Ген - NCBI». www.ncbi.nlm.nih.gov. Получено 2017-03-02.
  2. ^ а б c d е ж грамм час "BLAST: Базовый инструмент поиска местного выравнивания". blast.ncbi.nlm.nih.gov. Получено 2017-03-02.
  3. ^ а б c d "Человеческий поиск BLAT". genome.ucsc.edu. Получено 2017-03-02.
  4. ^ а б github.com/gxa/atlas/graphs/contributors, команда разработчиков EMBL-EBI Expression Atlas. "Атлас выражений . www.ebi.ac.uk. Получено 2017-05-07.
  5. ^ а б "77903326 - Профили GEO - NCBI". www.ncbi.nlm.nih.gov. Получено 7 мая 2017.
  6. ^ Гримвуд Дж., Гордон Л.А., Олсен А., Терри А., Шмутц Дж., Ламердин Дж., Хеллстен Ю., Гудштейн Д., Куронн О., Тран-Гьямфи М., Аэртс А., Альтерр М., Эшворт Л., Баджорек Е., Блэк С., Бранскомб Е. Caenepeel S, Carrano A, Caoile C, Chan YM, Christensen M, Cleland CA, Copeland A, Dalin E, Dehal P, Denys M, Detter JC, Escobar J, Flowers D, Fotopulos D, Garcia C, Georgescu AM, Glavina T. , Gomez M, Gonzales E, Groza M, Hammon N, Hawkins T., Haydu L, Ho I, Huang W., Israni S, Jett J, Kadner K, Kimball H, Kobayashi A, Larionov V, Leem SH, Lopez F, Lou Й, Лоури С., Малфатти С., Мартинес Д., Маккриди П., Медина С., Морган Дж., Нельсон К., Нолан М., Овчаренко И., Питлюк С., Поллард М., Попки А. П., Предки П., Куан Г., Рамирес Л., Раш С., Реттерер Дж., Родригес А., Роджерс С., Саламов А., Салазар А., Ши Икс, Смит Д., Слезак Т., Соловьев В., Тайер Н., Тайс Х, Цай М., Усташевская А., Во Н., Вагнер М., Уиллер Дж., Ву К. , Xie G, Yang J, Dubchak I, Furey TS, DeJong P, Dickson M, Gordon D, Eichler EE, Pennacchio LA, Richardson P, Stubbs L, Rokhsar DS , Майерс Р.М., Рубин Э.М., Лукас С.М. (2004). «Последовательность ДНК и биология хромосомы 19 человека». Природа. 428 (6982): 529–35. Bibcode:2004Натура.428..529G. Дои:10.1038 / природа02399. PMID  15057824.
  7. ^ а б c "Расшифровка: C19orf67-001 (ENST00000548523) - Домены и функции - Homo sapiens - Браузер генома ансамбля 83". dec2015.archive.ensembl.org. Получено 2017-03-02.
  8. ^ а б «Тканевая экспрессия C19orf67 - Резюме - Атлас белков человека». www.proteinatlas.org. Получено 2017-03-02.
  9. ^ а б Brendel, V .; Bucher, P .; Нурбахш, И. Р .; Blaisdell, B.E .; Карлин, С. (1992-03-15). «Методы и алгоритмы статистического анализа белковых последовательностей». Труды Национальной академии наук Соединенных Штатов Америки. 89 (6): 2002–2006. Bibcode:1992PNAS ... 89.2002B. Дои:10.1073 / пнас.89.6.2002. ISSN  0027-8424. ЧВК  48584. PMID  1549558.
  10. ^ "Pfam: Семейство: DUF3314 (PF11771)". pfam.xfam.org. Получено 2017-03-02.
  11. ^ «База данных белковых доменов, семейств и функциональных сайтов». ExPASy. Получено 2017-02-27.
  12. ^ Уильямсон, М. (1994). «Структура и функция богатых пролином областей в белках». Биохимический журнал. 249 (Pt 2): 249–260. Дои:10.1042 / bj2970249. ЧВК  1137821. PMID  8297327.
  13. ^ Альва, Викрам; Нам, Сын-Зин; Сёдинг, Йоханнес; Лупас, Андрей Н. (08.07.2016). «Набор инструментов для биоинформатики MPI как интегративная платформа для расширенного анализа последовательности и структуры белков». Исследования нуклеиновых кислот. 44 (W1): W410 – W415. Дои:10.1093 / нар / gkw348. ISSN  0305-1048. ЧВК  4987908. PMID  27131380.
  14. ^ Чжоу, Питер Y .; Фасман, Джеральд Д. (1974-01-15). «Прогнозирование конформации белков». Биохимия. 13 (2): 222–245. Дои:10.1021 / bi00699a002. ISSN  0006-2960. PMID  4358940.
  15. ^ Шарпильо, Жан-Люк Фальконе и Кристоф. «ТЕРМИНУС - добро пожаловать на конечную станцию». terminus.unige.ch. Получено 2017-04-24.
  16. ^ Фанкхаузер, Никлаус; Мезер, Паскаль (1 мая 2005 г.). «Идентификация сигналов крепления якоря GPI с помощью самоорганизующейся карты Кохонена». Биоинформатика. 21 (9): 1846–1852. Дои:10.1093 / биоинформатика / bti299. ISSN  1367-4803. PMID  15691858.
  17. ^ Blom, N .; Gammeltoft, S .; Брунак, С. (1999-12-17). «Последовательность и предсказание на основе структуры сайтов фосфорилирования эукариотических белков». Журнал молекулярной биологии. 294 (5): 1351–1362. Дои:10.1006 / jmbi.1999.3310. ISSN  0022-2836. PMID  10600390.
  18. ^ Блом, Николай; Зихериц-Понтен, Томас; Гупта, Рамнек; Гаммельтофт, Стин; Брунак, Сорен (01.06.2004). «Прогнозирование посттрансляционного гликозилирования и фосфорилирования белков по аминокислотной последовательности». Протеомика. 4 (6): 1633–1649. Дои:10.1002 / pmic.200300771. ISSN  1615-9853. PMID  15174133.
  19. ^ «Сервер PSORT II - GenScript». www.genscript.com. Получено 2017-04-27.
  20. ^ Шен, Хун-Бин; Чжоу, Куо-Чен (2007-11-01). «Nuc-PLoc: новый веб-сервер для прогнозирования субядерной локализации белка путем слияния композиции PseAA и PsePSSM». Белковая инженерия, дизайн и отбор. 20 (11): 561–567. Дои:10.1093 / белок / gzm057. ISSN  1741-0126. PMID  17993650.
  21. ^ «Genomatix - Анализ данных NGS и персонализированная медицина». www.genomatix.de. Получено 7 мая 2017.
  22. ^ "Веб-сервер Mfold | mfold.rit.albany.edu". unafold.rna.albany.edu. Получено 2017-05-07.
  23. ^ «Изобилие белка C19orf67 в PaxDb». pax-db.org. Получено 2017-04-30.
  24. ^ а б EMBL-EBI. «Игла EMBOSS <Парное выравнивание последовательностей . www.ebi.ac.uk. Получено 2017-03-02.
  25. ^ а б «Дерево времени :: Шкала времени жизни». www.timetree.org. Получено 2 марта 2017.
  26. ^ Маранги, Джузеппе; Ортески, Даниэла; Виджевано, Федерико; Фели, Джиллиан; Уолш, Кристофер А .; Манзини, М. Кьяра; Нери, Джованни (01.04.2012). «Расширение спектра перестроек с участием хромосомы 19: мягкий фенотип, связанный с делецией 19p13.12 – p13.13». Американский журнал медицинской генетики, часть A. 158A (4): 888–893. Дои:10.1002 / ajmg.a.35254. ISSN  1552-4833. ЧВК  3363957. PMID  22419660.
  27. ^ Миллер, Дэвид Т .; Адам, Маргарет П .; Арадхья, Сваруп; Biesecker, Leslie G .; Brothman, Arthur R .; Картер, Найджел П .; Церковь, Дина М .; Crolla, John A .; Эйхлер, Эван Э. (14 мая 2010 г.). «Консенсус: хромосомный микрочип - это клинический диагностический тест первого уровня для людей с пороками развития или врожденными аномалиями». Американский журнал генетики человека. 86 (5): 749–764. Дои:10.1016 / j.ajhg.2010.04.006. ISSN  1537-6605. ЧВК  2869000. PMID  20466091.
  28. ^ [1], Мелтон, Дуглас А. и Синиса Хрватин, «Маркеры для зрелых бета-клеток и методы их использования»