PSIPRED - PSIPRED

PSIPRED
Оригинальный автор (ы)
  • Дэвид Т. Джонс
  • Дэниел Бьюкен
  • Тим Ньюджент
  • Федерико Миннечи
  • Кевин Брайсон
Разработчики)Университетский колледж Лондона, Группа Биоинформатики
изначальный выпуск1999; 21 год назад (1999)
Стабильный выпуск
4.01 / 2 октября 2016; 4 года назад (2016-10-02)
Написано вC
Операционная системаWindows 2000, Unix
Платформаx86, Ява
Размер14 МБ
Доступно ванглийский
ТипБиоинформатика вторичная структура прогноз
ЛицензияПроприетарный бесплатное ПО исходный код
Интернет сайтбиоинф.cs.ucl.ac.Великобритания/ psipred
По состоянию на23 апреля 2017 г.

Прогноз вторичной структуры на основе PSI-взрыва (PSIPRED) - метод, используемый для исследования белок структура. Оно использует искусственная нейронная сеть машинное обучение методы в своем алгоритме.[1][2][3] Это на стороне сервера программа с участием интернет сайт служит в качестве внешнего интерфейса, который может предсказать вторичную структуру белка (бета-листы, альфа-спирали и катушки ) из первичной последовательности.

PSIPRED доступен как веб-сервис и как программное обеспечение. Программное обеспечение распространяется как исходный код, технически лицензированный как проприетарное программное обеспечение. Он позволяет изменять, но требует бесплатное ПО положения, запрещающие коммерческое распространение программного обеспечения и его результатов.

Вторичная структура

Вторичная структура - общая трехмерная форма локальных отрезков биополимеры Такие как белки и нуклеиновые кислоты (ДНК, РНК ). Однако он не описывает конкретные положения атомов в трехмерном пространстве, которые считаются третичная структура. Вторичная структура может быть формально определена водородные связи биополимера, как это наблюдается в структуре с атомным разрешением. В белках вторичная структура определяется паттернами водородной связи между позвоночник амино и карбоксильные группы. И наоборот, для нуклеиновых кислот вторичная структура состоит из водородных связей между азотистые основания. Образцы водородных связей могут быть значительно искажены, что затрудняет автоматическое определение вторичной структуры. Попытки использовать компьютеры для прогнозирования вторичные структуры белков, основываясь только на их данных первичная структура последовательности, продолжаются с 1970-х годов.[4]

Прогнозирование вторичной структуры включает набор методов в биоинформатика которые стремятся предсказать местные второстепенные конструкции белков и последовательностей РНК, основанных только на знании их первичная структурааминокислота или же нуклеотидная последовательность, соответственно. Для белков прогноз состоит в отнесении участков аминокислотной последовательности к наиболее вероятным. альфа-спирали, бета-нити (часто отмечается как расширенный конформации ), или повороты. Успех прогноза определяется путем его сравнения с результатами Алгоритм DSSP применяется к кристаллической структуре белка; для нуклеиновых кислот это можно определить по типу водородных связей. Были разработаны специализированные алгоритмы для обнаружения конкретных четко определенных шаблонов, таких как трансмембранные спирали и спиральные катушки в белках или канонических структурах микро-РНК в РНК.

Основная информация

Идея этого метода состоит в использовании информации об эволюционно связанных белках для предсказания вторичной структуры новой аминокислотной последовательности. PSIВЗРЫВ используется для поиска связанных последовательностей и построения оценочной матрицы для конкретной позиции. Эта матрица обрабатывается искусственная нейронная сеть,[2][5] который был построен и обучен предсказывать вторичная структура входной последовательности;[6] короче говоря, это машинное обучение метод.[7]

Алгоритм прогноза (метод)

Метод или алгоритм прогнозирования разбит на три этапа: создание профиля последовательности, прогнозирование начальной вторичной структуры, и фильтрация предсказанной структуры.[8] PSIPRED работает для нормализации профиля последовательности, созданного PSIBLAST.[2]Затем с помощью нейронной сети прогнозируется начальная вторичная структура. Для каждой аминокислоты в последовательности нейронная сеть получает окно из 15 кислот. Добавленная информация прилагается, указывая, охватывает ли окно N или C конец цепочки. В результате получается последний входной слой из 315 входных единиц, разделенных на 15 групп по 21 единице. Сеть имеет один скрытый слой из 75 единиц и 3 выходных узла (по одному на каждый элемент вторичной структуры: спираль, лист, катушка).[5]

Вторая нейронная сеть используется для фильтрации предсказанной структуры первой сети. Эта сеть также питается окном из 15 позиций. Также передается индикатор возможного положения окна на конце цепочки. В результате получается 60 входных единиц, разделенных на 15 групп по четыре. Сеть имеет один скрытый слой из 60 единиц и приводит к трем выходным узлам (по одному на каждый элемент вторичной структуры: спираль, лист, катушка).[8]

Три конечных узла вывода предоставляют оценку для каждого вторичного элемента структуры для центрального положения окна. Используя вторичную структуру с наивысшим баллом, PSIPRED генерирует прогноз белка.[8] Значение Q3 - это доля остатков, правильно предсказанных в состояниях вторичной структуры, а именно спирали, цепи и клубка.[8]

Смотрите также

Рекомендации

  1. ^ Гаджендра П. С. Рагхава; Харприт Каур. «Прогнозирование типов бета-хода». Получено 5 мая 2014.
  2. ^ а б c И-Пин Фиби Чен (18 января 2005 г.). Биоинформатические технологии. Springer. п. 107. ISBN  978-3-540-20873-0.
  3. ^ Cuff, James A .; Бартон, Джеффри А. (15 августа 2000 г.). «Применение нескольких профилей выравнивания последовательностей для улучшения предсказания вторичной структуры белка». Белки. 40 (3): 502–11. Дои:10.1002 / 1097-0134 (20000815) 40: 3 <502 :: aid-prot170> 3.0.co; 2-кв.. PMID  10861942.
  4. ^ Херинга, Яап (2000). «Вычислительные методы для предсказания вторичной структуры белка с использованием множественного выравнивания последовательностей». Современная наука о белках и пептидах. 1 (3): 273–301(29). CiteSeerX  10.1.1.470.7673. Дои:10.2174/1389203003381324. PMID  12369910.
  5. ^ а б С. К. Растоги; Намитра Мендиратта; Параг Растоги (22 мая 2013 г.). Биоинформатика: методы и приложения: (геномика, протеомика и открытие лекарств). PHI Learning Pvt. Ltd. стр. 302–. ISBN  978-81-203-4785-4.
  6. ^ «ПСИПРЕД | Биоинформатические технологии». 10 апреля 2014 г.. Получено 7 мая 2014.
  7. ^ «Обзор PSIPRED». Получено 7 мая 2014.
  8. ^ а б c d Джонс, Дэвид Т. (17 сентября 1999 г.). «Прогнозирование вторичной структуры белка на основе оценочных матриц для конкретных позиций» (PDF). Журнал молекулярной биологии. 292 (2): 195–202. Дои:10.1006 / jmbi.1999.3091. PMID  10493868. Получено 7 мая 2014.