Банк данных белков (формат файла) - Protein Data Bank (file format)

PDB
Расширение имени файла
.pdb, .ent, .brk
Тип интернет-СМИ
химический / x-pdb
Тип форматаформат химического файла

В Формат файлов Protein Data Bank (pdb) текстовый формат файла, описывающий трехмерные структуры молекул, содержащихся в Банк данных белков. Соответственно, формат pdb обеспечивает описание и аннотацию структур белков и нуклеиновых кислот, включая координаты атомов, назначения вторичных структур, а также связи между атомами. Кроме того, сохраняются экспериментальные метаданные. Формат PDB - это устаревший формат файлов для Банк данных белков который теперь хранит данные о биологических макромолекулах в новых ммCIF формат файла.

История

Формат файла PDB был изобретен в 1976 году как удобочитаемый файл, который позволил исследователям обмениваться координатами белков через систему баз данных. Его формат с фиксированной шириной столбца ограничен 80 столбцами, что было основано на ширине компьютерных перфокарт, которые ранее использовались для обмена координатами.[1] За прошедшие годы формат файла претерпел множество изменений и пересмотров. По состоянию на 13 июля 2011 г., самая последняя версия - 3.30.[2]

Пример

Типичный файл PDB, описывающий белок, состоит из сотен или тысяч строк, подобных приведенному ниже (взятому из файла, описывающего структуру синтетического коллагеноподобный пептид ):

ЗАГОЛОВОК ВНЕКЛЕТОЧНЫЙ МАТРИКС 22-ЯНВ-98 1A3ITLE РЕНТГЕНОВСКОЕ КРИСТАЛЛОГРАФИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ПЕПТИДА КОЛЛАГЕНА ЛИКТИТИТЛА 2 С ПОВТОРЯЮЩЕЙСЯ ПОСЛЕДОВАТЕЛЬНОСТЬЮ (PRO-PRO-GLY) ... EXPDTA X-RAY DIFFRACTION JAVAHORLIAN , R.BERISIO, L.MAZZARELLA, AUTHOR 2 B.BRODSKY, A.ZAGARI, HMBERMAN ... ЗАМЕЧАНИЕ 350 БИОМОЛЕКУЛА: 1 ЗАМЕТКА 350 ПРИМЕНЯЙТЕ СЛЕДУЮЩИЕ К ЦЕПЯМ: A, B, CREMARK 350 BIOMT1 1 1,000000 0,000000 0,000000 0,00000 ЗАМЕЧАНИЕ BIOMT2 1 0.000000 1.000000 0.000000 0.00000 ... SEQRES 1 A 9 PRO PRO GLY PRO PRO GLY PRO PRO GLYSEQRES 1 B 6 PRO PRO GLY PRO PRO GLYSEQRES 1 C 6 PRO PRO GLY PRO PRO GLY ... ATOM 1 N PRO A 1 8,316 21,206 21,530 1,00 17,44 NATOM 2 CA PRO A 1 7,608 20,729 20,336 1,00 17,44 CATOM 3 C PRO A 1 8,487 20,707 19,092 1,00 17,44 CATOM 4 O PRO A 1 9,466 21,457 19,005 1,00 17,44 OATOM 5 CB PRO A 1 6.460 21.723 20.211 1.00 22.26 C ... HETATM 130 C ACY 401 3.682 22.541 11.236 1.00 21.19 CHETATM 131 O ACY 401 2.807 23.097 10.553 1.00 21.19 OHETATM 132 OXT ACY 401 4.306 23.101 12.291 1.00 21.19 O ...
Записи HEADER, TITLE и AUTHOR
предоставить информацию об исследователях, которые определили структуру; доступно множество других типов записей для предоставления других типов информации.
ЗАМЕЧАНИЕ записи
могут содержать аннотации произвольной формы, но они также содержат стандартизованную информацию; например, ЗАМЕЧАНИЕ 350 БИОМТ записи описывают, как вычислить координаты экспериментально наблюдаемого мультимера из координат явно заданных координат одного повторяющегося блока.
SEQRES записи
приведите последовательности трех пептидных цепей (названные A, B и C), которые в этом примере очень короткие, но обычно охватывают несколько строк.
Записи ATOM
описывают координаты атомов, входящих в состав белка. Например, первая строка ATOM выше описывает атом альфа-N первого остатка пептидной цепи A, который является остатком пролина; первые три числа с плавающей запятой являются его координатами x, y и z и выражаются в единицах измерения Ангстремс.[3] Следующие три столбца - это заполняемость, температурный коэффициент и название элемента соответственно.
Записи HETATM
описывают координаты гетероатомов, то есть тех атомов, которые не входят в состав молекулы белка.

Программное обеспечение для молекулярной визуализации, способное отображать файлы PDB

Смотрите также

Рекомендации

  1. ^ Берман, Хелен М. «Банк данных о белках: историческая перспектива». Acta Crystallographica Раздел A 64.1 (2007): 88-95.
  2. ^ "Формат ввода атомарных координат, версия 3.3". wwPDB. Июль 2011 г.
  3. ^ "Формат wwPDB версии 3.3: Координатный раздел". Архивировано из оригинал на 2012-02-28. Получено 2012-03-23.

внешняя ссылка