C9orf50 - C9orf50

C9orf50
Идентификаторы
ПсевдонимыC9orf50, хромосома 9 открытая рамка считывания 50
Внешние идентификаторыMGI: 1923631 ГомолоГен: 18859 Генные карты: C9orf50
Расположение гена (человек)
Хромосома 9 (человек)
Chr.Хромосома 9 (человек)[1]
Хромосома 9 (человек)
Геномное расположение C9orf50
Геномное расположение C9orf50
Группа9q34.11Начните129,612,225 бп[1]
Конец129,620,776 бп[1]
Ортологи
ВидыЧеловекМышь
Entrez
Ансамбль
UniProt
RefSeq (мРНК)

NM_199350

NM_198000

RefSeq (белок)

NP_955382

NP_932117

Расположение (UCSC)Chr 9: 129.61 - 129.62 МбChr 2: 30,79 - 30,8 Мб
PubMed поиск[3][4]
Викиданные
Просмотр / редактирование человекаПросмотр / редактирование мыши

Открытая рамка считывания хромосомы 9 50 это белок что у людей кодируется C9orf50 ген.[5] У C9orf50 есть еще один известный псевдоним - FLJ35803.[6] У человека длина кодирующей последовательности гена составляет 10 051 пару оснований, транскрибирующая мРНК из 1624 оснований, которая кодирует белок из 431 аминокислоты.

Ген

Расположение

У человека ген расположен на отрицательной цепи 9q34.11, а длина кодирующей последовательности составляет 8,552 пары оснований.[7] На хромосома человека 9, ген охватывает базы chr9: 132 374 504–132 383 055[8] Рядом с C9orf50 находится ASB6 который является геном непосредственно перед C9orf50 на отрицательной цепи, а на положительной цепи - НТМТ1 что более чем вдвое превышает размер C9orf50.[1][2]


[1] ASB6 https://www.ncbi.nlm.nih.gov/gene/140459

[2] NTMT1 https://www.ncbi.nlm.nih.gov/gene/28989

.[9]

Протеин

Схематическое изображение C9orf50 с использованием Dog2.0. 431 аминокислота отображается желтым, полиамфолит - красным, а DUF4685 - бирюзовым. Другие мотивы показаны и помечены в правильном положении AA. Розовые кружки представляют участки ацетилирования, бирюзовый цвет представляет гликирование, а синий - сумоилирование.

Белок C9orf50 имеет молекулярную массу 47 639 кДа и состоит из 431 кДа. аминокислоты с предсказанным изоэлектрическая точка из 10,38 [7] Белок C9orf50 содержит консервативный домен в pfam15737-DUF4685, функция которого недостаточно изучена и консервативна у позвоночных. Белок состоит из 7 экзонов.

Изоформы

C9orf50 имеет 9 различных изоформ сплайсинга (SI) и 11 различных вариантов транскриптов (TV), наиболее распространенными являются изоформа 1 и вариант транскрипта 1.[10]

Таблица C9orf50 Isoform. Автор Ханна Берхоу
Изоформы и варианты транскриптов C9orf50

Домены

Белок может быть проанализирован в целом, а также разделен на 3 части, включая N-концевой домен из 193 остатков, DUF4685 из 103 остатков и C-концевой домен из 135 остатков. Полный белок pI аналогичен среднему значению pI NTD, DUF4685 и CTD. Из этих участков NTD имеет самые высокие pI и mW, но также имеет наибольшее количество остатков на уровне 193 из 431.[11][12]

C9orf50ПимВт кДОстатки
Человеческий цельный белок10.3847.6431
NTD11.1421.1193
DUF468510.811.8103
CTD9.4714.7135

Сочинение

Анализ состава белка C9orf50 показывает низкие количества I, M, Y и FIKMNY по сравнению с людьми и высокие количества R и KR-ED. Нет данных для кластеров зарядов, заряженных или незаряженных сегментов с высокими оценками, прогонов заряда, паттернов, гидрофобных или трансмембранных сегментов с высокими оценками. Три различных уникальных интервала C были обнаружены в положениях 161, 190 и 342. Также обнаружено, что C9orf50 имеет 3 повторяющиеся структуры, первая последовательность PRLP_KLT начинается в положении 30 и затем повторяется в положении 78. Другой повторяющейся структурой является SLLP в позиции 99 и 398. Последняя структура повторения на 250 и 303 изготовлена ​​из KAAL.[13]

Третичная структура

Структуры третичного белка C9orf50 можно найти с помощью И-Тассер[постоянная мертвая ссылка ]. Этот инструмент дает 5 визуализированных структур, две из которых имеют наивысшие оценки C -3,25 и -1,27.

Регулирование уровня генов

Промоутер

Область промотора для C9orf50 была найдена с помощью поисковой машины GenomatixGene2Promoter.[14] В результате было найдено 6 промоторных областей. Только 2 из них были поддержаны стенограммами и бирками клеток. Наиболее поддерживаемая область промотора охватывает 1962 основания и консервативна в 6 из 8 ортологичных локусов с 945 клеточными тегами. Было установлено, что сайт начала транскрипции расположен в 1 503 от транскрипта с 7 экзонами, поддерживаемыми 118 клеточными тегами.[14]

Сайты связывания факторов транскрипции

Предполагается, что существуют сотни факторов транскрипции, которые связываются с промоторной областью. В таблице факторов транскрипции промоторной области выделено 20 из них.

Регулирование уровня стенограммы

C9orf50 5 'UTR межмолекулярная парная структура с наибольшей дельта G составляет -323,4 ккал / моль. Это самая низкая энергетическая структура, предсказанная для области 5'UTR.[15] Для 3 'UTR самый высокий dG составляет -127,5 ккал / моль, что указывает на то, что он не так стабилен, как 5' UTR.

Конструкции петли стержня UTR 3 'C9orf50
C9orf50 5 'Петлевые конструкции стержня UTR

Выражение ткани

РНК-последовательность Данные C9orf50 обнаружили низкий уровень экспрессии, 25-50 процентилей, в большинстве тканей человека по сравнению со всеми белками человека.[16] Однако наиболее сильно он выражен в яичках, головном мозге и желчном пузыре.[10] Экспрессия белка C9orf50 выше, чем экспрессия РНК C9orf50.[17] При изучении данных гибридизации in situ, ортолог мыши C9orf50, символ 1700001O22Rik, был использован для сравнения экспрессии белка с Бета-актин который экспрессируется повсеместно, и анализ показывает аналогичные паттерны экспрессии в мозге мышей.[18] Во время развития белок можно обнаружить на стадии плода.[19]

Субклеточная экспрессия

Белок локализован в основном в ядре и реже в митохондриях и цитозоле.[20]

Факторы транскрипции области промотора C9orf50

Ортологи

Нет известных паралоги из C9orf50. ортологи C9orf50 были обнаружены консервативными у большинства подклассов млекопитающих с самым дальним опоссумом инфракласса. марсупиалия, разошлись 159 миллионов лет назад.[21] Этот ген не обнаружен у рептилий, земноводных, птиц или любых других организмов, развившихся до млекопитающих. Список млекопитающих, у которых сохраняется C9orf50, показан ниже.

C9orf50 Ортологи
Распространенное имяТаксономическая группаДивергенция от людей (MYA)Номер регистрации NCBIДлина белка (AA)Идентичность последовательности для людей%
ЧеловекГоминини0NP_955382.3431100
ШимпанзеПриматы6.65XP_016817319.143197.22
ГориллаПриматы9.06XP_018889539.143593.17
Олень мышьRodentia90XP_006983488.139146.14
Степная полевкаRodentia90XP_005346778.137045.18
Американская пищухаЗайцеобразные90XP_004593748.157938.11
Узкоребристая беспернистая морская свиньяКитообразные96XP_024617982.147356.71
КосаткаКитообразные96XP_012388229.134359.34
АльпакаПарнокопытные96XP_006205645.139953.83
Черная летучая лисицаРукокрылые96XP_015449607.143253.21
Египетская фруктовая летучая мышьРукокрылые96XP_015989428.143153.01
КозелПарнокопытные96XP_017910228.143852.4
Северный морской котикХищник96XP_025744313.144152.36
Медведь гризлиХищник96XP_026369526.144750.63
Европейский ёжикСорикоморфа96XP_007527129.141951.42
Звездоносый кротХоботок96XP_012576659.138348.68
Южный белый носорогПериссодактиля96XP_014637447.148947.25
Африканский слон-кустарникХоботок105XP_023401069.152749.31
Девятипоясный броненосецCingulata105XP_023443586.147646.72
Серый короткохвостый опоссумДиделпиморфия159XP_007475193.158332.56

Эволюция

C9orf50, по прогнозам, будет эволюционировать быстрее, чем другие распространенные белки, включая цитохром C, гемоглобин бета, и альфа-цепь фибриногена.

Молекулярные часы C9orf50

Консервация аминокислот

Важные аминокислоты характеризуются теми аминокислотами, которые находятся на 100% согласованной линии, созданной в MView строгого ортологичного множественного выравнивания последовательностей.[22] Аминокислоты, выделенные красным, представляют собой консервативные аминокислоты в DUF4685. 14 из 22 высококонсервативных аминокислот находятся в этом домене. Лейцин занимает наиболее консервативные позиции белка C9orf50.

Консервированные аминокислотыC9orf50 AA Позиция
Пролин33,325
Лейцин147, 155, 158, 280, 285, 321, 328
Фенилаланин231, 275
Аргинин272, 286
Валин273, 313
Аланин267
Аспарагиновая кислота277
Глютаминовая кислота278, 289
Треонин279
Тирозин287
Триптофан288

Мутации

Посттрансляционные модификации и вторичная структура C9orf50. PTM для C9orf50 были найдены с помощью инструментов, размещенных на сайте Expasy Protein Modifications. Вторичная структура C9orf50 была предсказана с помощью анализа, проведенного Gor, COILS, CFSSP, JPRED и SOPMA.[1],[2],[3],[4],[5] Спираль, обозначенная зелеными цилиндрами, бета-лист, обозначенная синими стрелками, и структуры поворотов, обозначенные розовыми стрелками, были включены ниже в концептуальный перевод, если у них была высокая оценка прогноза. Также были сохранены все структуры, которые были обнаружены более чем в одном инструменте анализа. Белок не имеет трансмембранных последовательностей.

Общие варианты в C9orf50 были обнаружены с помощью NCBI SNPGeneView.[23]

dbSNP rs # Идентификатор кластераФункцияdbSNP АллельАминокислотная позиция
rs146521610СинонимV → G317
rs566893379СинонимS → T310
rs111868243СинонимS → A258
rs918165МиссенсК → А248
rs141573674МиссенсS → A201
rs759058008Кадровый сдвигУдален L189
rs111606531СинонимА → Т86
rs146618124МиссенсS → C52
rs372378735СинонимG → A45
rs751493011ЕрундаВставить Т11

использованная литература

  1. ^ а б c ГРЧ38: Ансамбль выпуск 89: ENSG00000179058 - Ансамбль, Май 2017
  2. ^ а б c GRCm38: выпуск Ensembl 89: ENSMUSG00000044320 - Ансамбль, Май 2017
  3. ^ "Справочник человека по PubMed:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
  4. ^ «Ссылка на Mouse PubMed:». Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
  5. ^ «неохарактеризованный белок C9orf50 [Homo sapiens] - белок - NCBI». www.ncbi.nlm.nih.gov. Получено 2019-02-25.
  6. ^ «Ген: C9orf50 (ENSG00000179058) - Резюме - Homo sapiens - Браузер генома ансамбля 95». uswest.ensembl.org. Получено 2019-02-25.
  7. ^ а б "C9orf50 Gene". www.genecards.org. Получено 2019-02-25.
  8. ^ «Открытая рамка считывания 50 хромосомы 9 C9orf50 [Homo sapiens (человек)] - Ген - NCBI». www.ncbi.nlm.nih.gov. Получено 2019-02-25.
  9. ^ "Область карты GeneLoc для хромосомы 9 (127 612 225 - 131 622 275 п.н.) вокруг" C9orf50"". GeneLoc.
  10. ^ а б «Открытая рамка считывания 50 хромосомы 9 C9orf50 [Homo sapiens (человек)] - Ген - NCBI».
  11. ^ Ген https://www.ncbi.nlm.nih.gov/gene/375759
  12. ^ «ExPASy - инструмент вычисления pI / Mw».
  13. ^ «Инструменты EBI: Работа недоступна».
  14. ^ а б «Genomatix: страница входа».
  15. ^ "Веб-сервер Mfold | mfold.rit.albany.edu".
  16. ^ "Gds3113 / 115495".
  17. ^ https://www.sigmaaldrich.com/catalog/product/sigma/hpa026743?lang=en®ion=US
  18. ^ "Деталь гена :: Атлас мозга Аллена: Мозг мыши".
  19. ^ «Профиль EST - Hs.124223».
  20. ^ "WoLF PSORT: Advanced Protein Subcellular Localization Prediction Tool - GenScript".
  21. ^ «Protein BLAST: поиск в базах данных белков с помощью белкового запроса». blast.ncbi.nlm.nih.gov. Получено 2019-02-25.
  22. ^ «Инструменты EBI: ошибка».
  23. ^ «SNP, связанный с геном (geneID: 375759) через аннотацию контига».