Метод Чоу – Фасмана - Chou–Fasman method

В Метод Чоу – Фасмана это эмпирический метод для прогноз из третичные структуры в белки, первоначально разработанная в 1970-х годах Питером Ю. Чоу и Джеральдом Д. Фасманом.[1][2][3] Метод основан на анализе относительных частот каждого аминокислота в альфа спирали, бета-листы, и повороты на основе известных белковые структуры решено с Рентгеновская кристаллография. Из этих частот был получен набор параметров вероятности появления каждой аминокислоты в каждом типе вторичной структуры, и эти параметры используются для прогнозирования вероятность что данная последовательность аминокислот может образовывать спираль, бета-цепь или поворот в белке. Точность определения правильных вторичных структур составляет не более 50–60%.[4] что значительно менее точно, чем современные машинное обучение –Основанные методы.[5]

Аминокислотные склонности

Исходные параметры Чоу-Фасмана обнаружили сильную тенденцию среди отдельных аминокислот к предпочтению одного типа вторичной структуры над другими. Аланин, глутамат, лейцин, и метионин были идентифицированы как спиралистообразователи, а пролин и глицин, благодаря уникальным конформационным свойствам их пептидные связи, обычно заканчивают спираль. Исходные параметры Чоу – Фасмана[6] были получены из очень небольшой и нерепрезентативной выборки белковых структур из-за небольшого количества таких структур, которые были известны во время их первоначальной работы. Эти исходные параметры с тех пор оказались ненадежными.[7] и были обновлены из текущего набора данных вместе с модификациями исходного алгоритма.[8]

Метод Чоу – Фасмана учитывает только вероятность того, что каждая отдельная аминокислота появится в спирали, цепи или витке. В отличие от более сложных Метод газового фактора, он не отражает условную вероятность того, что аминокислота образует конкретную вторичную структуру, учитывая, что ее соседи уже обладают этой структурой. Это отсутствие кооперативности увеличивает его вычислительную эффективность, но снижает его точность, поскольку склонности отдельных аминокислот часто недостаточно сильны, чтобы сделать окончательный прогноз.[5]

Алгоритм

Метод Чоу-Фасмана предсказывает спирали и нити аналогичным образом, сначала выполняя линейный поиск в последовательности области «зародышеобразования» с высокой вероятностью спирали или цепи, а затем расширяя область до тех пор, пока последующее окно из четырех остатков не будет иметь вероятность меньше, чем 1. Как первоначально описано, четырех из любых шести смежных аминокислот было достаточно для образования зародышей спирали, а трех из любых смежных пяти было достаточно для листа. Пороги вероятности зарождения спиралей и цепей постоянны, но не обязательно равны; первоначально 1,03 был установлен в качестве отсечки спирали и 1,00 для отсечки прядей.

Повороты также оцениваются в окнах с четырьмя остатками, но рассчитываются с использованием многоступенчатой ​​процедуры, потому что многие области витков содержат аминокислоты, которые также могут появляться в спиральных или листовых областях. Повороты с четырьмя остатками также имеют свои собственные характерные аминокислоты; пролин и глицин оба распространены по очереди. Поворот прогнозируется только в том случае, если вероятность поворота больше, чем вероятности спирали или листа. и значение вероятности, основанное на положениях определенных аминокислот в свою очередь, превышает заданный порог. Вероятность разворота p (t) определяется как:

куда j - положение аминокислоты в окне из четырех остатков. Если p (t) превышает произвольное значение отсечки (первоначально 7,5e – 3), среднее значение p (j) превышает 1, а p (t) превышает вероятности альфа-спирали и бета-листа для этого окна, тогда a очередь предсказана. Если первые два условия выполнены, но вероятность бета-листа p (b) превышает p (t), то вместо этого прогнозируется лист.

Смотрите также

Рекомендации

  1. ^ Чжоу П. Я., Фасман Г. Д. (1974). «Прогнозирование конформации белков». Биохимия. 13 (2): 222–245. Дои:10.1021 / bi00699a002. PMID  4358940.
  2. ^ Чжоу П. Я., Фасман Г. Д. (1978). «Эмпирические предсказания конформации белков». Анну Рев Биохим. 47: 251–276. Дои:10.1146 / annurev.bi.47.070178.001343. PMID  354496.
  3. ^ Чжоу П. Я., Фасман Г. Д. (1978). «Прогнозирование вторичной структуры белков по их аминокислотной последовательности». Достижения в энзимологии и смежных областях молекулярной биологии. Adv Enzymol Relat Areas Mol Biol. Достижения в энзимологии и смежных областях молекулярной биологии. 47. стр.45–148. Дои:10.1002 / 9780470122921.ch2. ISBN  9780470122921. PMID  364941.
  4. ^ Кабш В., Сандер С. (1983). «Насколько хороши прогнозы вторичной структуры белка?». FEBS Lett. 155 (2): 179–82. Дои:10.1016/0014-5793(82)80597-8. PMID  6852232. S2CID  41477827.
  5. ^ а б Mount DM (2004). Биоинформатика: анализ последовательности и генома (2-е изд.). Колд-Спринг-Харбор, Нью-Йорк: Лаборатория Колд-Спринг-Харбор. ISBN  978-0-87969-712-9.
  6. ^ Чжоу П. Я., Фасман Г. Д. (1974). «Конформационные параметры для аминокислот в спиральных, бета-листовых и случайных областях клубка рассчитаны из белков». Биохимия. 13 (2): 211–222. Дои:10.1021 / bi00699a001. PMID  4358939.
  7. ^ Кынгас Дж, Вальякка Дж (1998). «Ненадежность параметров Чоу – Фасмана при прогнозировании вторичной структуры белка». Protein Eng. 11 (5): 345–348. Дои:10.1093 / белок / 11.5.345. PMID  9681866.
  8. ^ Чен Х, Гу Ф, Хуан Зи (2006). «Улучшенный метод Чоу – Фасмана для предсказания вторичной структуры белков». BMC Биоинформатика. 7 (Приложение 4): S14. Дои:10.1186 / 1471-2105-7-S4-S14. ЧВК  1780123. PMID  17217506.

внешняя ссылка