SMILES произвольная спецификация цели - SMILES arbitrary target specification

SMILES произвольная спецификация цели (SMARTS) - это язык для определения структурных паттернов в молекулы. СМАРТС строчная запись является выразительным и позволяет чрезвычайно точную и прозрачную субструктурную спецификацию и атомную типизацию.

SMARTS относится к Улыбки линейная нотация, которая используется для кодирования молекулярных структур и, как SMILES, была первоначально разработана Дэвидом Вейнингером и его коллегами из Системы дневной химической информации. Наиболее полное описание языка SMARTS можно найти в руководстве по теории SMARTS от Daylight.[1] руководство [2] и примеры.[3] Программное обеспечение OpenEye Scientific разработала собственную версию SMARTS, которая отличается от оригинальной версии Daylight тем, как р дескриптор (см. цикличность ниже).

SMARTS синтаксис

Атомные свойства

Атомы могут быть указаны символом или атомным номером. Алифатический углерод соответствует [C], ароматический углерод [c] и любой углерод [#6] или [C, c]. Символы wild card *, А и а соответствовать любому атому, любому алифатический атом и любой ароматный атом соответственно. Неявные водороды считаются характеристикой атомов, и SMARTS для аминогруппы можно записать как [NH2]. Плата указывается дескрипторами + и - на примере SMARTS [nH +] (протонированный ароматный атом азота) и [O-] C (= O) c (депротонирован ароматный карбоновая кислота ).

Облигации

Можно указать ряд типов облигаций: - (Один), = (двойной), # (тройной), : (ароматный) и ~ (любой).

Связь

В Икс и D дескрипторы используются для указания общего числа соединений (включая неявные атомы водорода) и соединений с явными атомами. Таким образом [CX4] сопоставляет атомы углерода со связями с любыми четырьмя другими атомами, в то время как [CD4] соответствует четвертичному углероду.

Цикличность

Как первоначально определено Daylight, р дескриптор используется для определения членства в кольце. В модели Daylight для циклических систем наименьший набор наименьших колец (СССР)[4] используется как основа для членства в кольце. Например, индол воспринимается как 5-членное кольцо, конденсированное с 6-членным кольцом, а не как 9-членное кольцо. Два атома углерода, составляющие кольцо слияния, будут соответствовать [cR2] и другие атомы углерода будут соответствовать [cR1].

Модель SSSR подверглась критике со стороны OpenEye[5] которые в своей реализации СМАРТС используют р для обозначения количества кольцевых связей для атома. Два атома углерода в кольцевом слиянии совпадают [cR3] и другие угли совпадают [cR2] в реализации OpenEye SMARTS. Используется без номера, р указывает атом в кольце в обеих реализациях, например [CR] (алифатический атом углерода в кольце).

Нижний регистр р определяет размер наименьшего кольца, членом которого является атом. Атомы углерода кольцевого слияния будут соответствовать [cr5]. Облигации можно указать как циклические, например C @ C соответствует непосредственно связанным атомам в кольце.

Логические операторы

Четыре логических оператора позволяют комбинировать дескрипторы атома и связи. Оператор 'и' ; может использоваться для определения протонированного первичного амина как [N; H3; +] [C; X4]. Оператор 'или' , имеет более высокий приоритет, поэтому [c, n; H] определяет (ароматический углерод или ароматический азот) с неявным водородом. Оператор 'и' & имеет более высокий приоритет, чем , так [c, n & H] определяет ароматический углерод или (ароматический азот с неявным водородом).

Оператор not ! может использоваться для определения ненасыщенного алифатического углерода как [C;! X4] и ациклические связи как *-!@*.

Рекурсивные SMARTS

Рекурсивные SMARTS позволяют детально определять окружение атома. Например, более реактивный (по отношению к электрофильное ароматическое замещение ) орто и параграф атомы углерода фенол можно определить как [$ (c1c ([OH]) cccc1), $ (c1ccc ([OH]) cc1)].

Примеры SMARTS

Компания Daylight собрала ряд наглядных примеров SMARTS.

Используемые определения доноров и акцепторов водородных связей Правило пяти Липинского.[6] легко кодируются в СМАРТС. Доноры определяются как атомы азота или кислорода, которые имеют по крайней мере один непосредственно связанный атом водорода:

[N, n, O;! H0] или [# 7, # 8;! H0] (ароматический кислород не может иметь связанный водород)

Акцепторы определяются как азот или кислород:

[N, n, O, o] или [#7,#8]

Простое определение алифатический амины которые могут протонировать при физиологических pH можно записать в виде следующих рекурсивных SMARTS:

[$ ([NH2] [CX4]), $ ([NH] ([CX4]) [CX4]), $ ([NX3] ([CX4]) ([CX4]) [CX4])]

В реальных приложениях CX4 атомы должны быть определены более точно, чтобы предотвратить согласование с электроноакцепторными группами, такими как CF3 что сделало бы амин недостаточно основным для протонирования при физиологических pH.

SMARTS можно использовать для кодирования фармакофор такие элементы, как анионные центры. В следующем примере рекурсивная нотация SMARTS используется для объединения кислого кислорода и тетразольного азота в определении атомов кислорода, которые могут быть анионными при нормальных физиологических условиях.

[$ ([OH] [C, S, P] = O), $ ([nH] 1nnnc1)]

Приведенный выше SMARTS соответствует только кислотному гидроксилу и тетразолу N-H. Когда карбоновая кислота Депротонат отрицательный заряд делокализован по обоим атомам кислорода, и может быть желательно обозначить оба как анионные. Этого можно добиться с помощью следующих SMARTS.

[$ ([OH]) C = O), $ (O = C [OH])]

Приложения SMARTS

Точная и прозрачная спецификация субструктур, которую допускает SMARTS, использовалась во многих приложениях.

Были использованы субструктурные фильтры, определенные в SMARTS. [7] для выявления нежелательных соединений при выполнении стратегического объединения соединений для высокопроизводительного скрининга. РЕОС (быстрое устранение помоев) [8] процедура использует SMARTS для фильтрации реактивных, токсичных и других нежелательных фрагментов из баз данных химических структур.

ПОВТОР [9](Процедура ретросинтетического комбинаторного анализа) использует SMARTS для определения типов облигаций. RECAP - это редактор молекул который генерирует фрагменты структур путем разрыва связей определенных типов, и исходные точки связи в них указываются с помощью изотопных меток. Поиск в базах данных биологически активных соединений на предмет наличия фрагментов позволяет идентифицировать привилегированные структурные мотивы. Молекулярный слайсер [10] аналогичен RECAP и используется для идентификации фрагментов, которые обычно встречаются в продаваемых пероральных препаратах.

Программа Leatherface[11] общего назначения редактор молекул что позволяет автоматически изменять ряд субструктурных характеристик молекул в базах данных, включая состояние протонирования, количество водорода, формальный заряд, изотопный вес и порядок связи. Правила молекулярного редактирования, используемые Leatherface, определены в SMARTS. Кожаное лицо можно использовать для стандартизации таутомерный и ионизационные состояния, а также установить и перечислить их при подготовке баз данных[12] за виртуальный просмотр. Кожаное Лицо использовалось в Анализ согласованных молекулярных пар, что позволяет количественно оценить влияние структурных изменений (например, замещения водорода хлором),[13] по ряду структурных типов.

АЛАДДИН[14] это фармакофор программа сопоставления, которая использует SMARTS для определения точек распознавания (например, нейтральные водородная связь акцептор) фармакофоров. Ключевой проблемой при подборе фармакофоров является то, что функциональные группы, которые могут ионизироваться при физиологических условиях. pH обычно регистрируются в нейтральных формах в структурных базах данных. Программа сопоставления форм ROCS позволяет определять типы атомов с помощью SMARTS.[15]

Примечания и ссылки

  1. ^ Руководство по теории СМАРТС, Daylight Chemical Information Systems, Санта-Фе, Нью-Мексико
  2. ^ SMARTS Учебник, Daylight Chemical Information Systems, Санта-Фе, Нью-Мексико
  3. ^ Примеры SMARTS, Daylight Chemical Information Systems, Санта-Фе, Нью-Мексико.
  4. ^ Даунс, G.M .; Gillet, V.J .; Холлидей, J.D .; Линч, М.Ф. (1989). "Обзор алгоритмов восприятия кольца для химических графов". J. Chem. Инф. Comput. Sci. 29 (3): 172–187. Дои:10.1021 / ci00063a007.
  5. ^ «Наименьший набор самых маленьких колец (СССР) считается вредным». Архивировано 14 октября 2007 года.. Получено 2017-02-08.CS1 maint: BOT: статус исходного URL-адреса неизвестен (ссылка на сайт), OEChem - Руководство по C ++, версия 1.5.1, OpenEye Scientific Software, Санта-Фе, Нью-Мексико
  6. ^ Липинский, Кристофер А .; Ломбардо, Франко; Dominy, Beryl W .; Фини, Пол Дж. (2001). «Экспериментальные и вычислительные подходы к оценке растворимости и проницаемости в условиях открытия и разработки лекарств». Расширенные обзоры доставки лекарств. 46 (1–3): 3–26. Дои:10.1016 / S0169-409X (00) 00129-0. PMID  11259830.
  7. ^ Ханн, Майк; Хадсон, Брайан; Льюэлл, Сяо; Жизнерадостный, Роб; Миллер, Люк; Рамсден, Найджел (1999). «Стратегический пул соединений для высокопроизводительного скрининга». Журнал химической информации и компьютерных наук. 39 (5): 897–902. Дои:10.1021 / ci990423o. PMID  10529988.
  8. ^ Уолтерс, У. Патрик; Мурко, Марк А. (2002). «Прогнозирование сходства с наркотиками»'". Расширенные обзоры доставки лекарств. 54 (3): 255–271. Дои:10.1016 / S0169-409X (02) 00003-0. PMID  11922947.
  9. ^ Льюэлл, Сяо Цин; Джадд, Дункан Б.; Уотсон, Стивен П .; Ханн, Майкл М. (1998). «RECAPRetrosynthetic комбинаторная процедура анализа: новый мощный метод для идентификации привилегированных молекулярных фрагментов с полезными приложениями в комбинаторной химии». Журнал химической информации и компьютерных наук. 38 (3): 511–522. Дои:10.1021 / ci970429i. PMID  9611787.
  10. ^ Вьет, Михал; Сигел, Майлз Дж .; Хиггс, Ричард Э .; Уотсон, Ян А .; Робертсон, Дэниел Х .; Савин, Кеннет А .; Дерст, Грегори Л .; Хипскинд, Филип А. (2004). «Характерные физические свойства и структурные фрагменты продаваемых пероральных препаратов». Журнал медицинской химии. 47: 224–232. Дои:10.1021 / jm030267j. PMID  14695836.
  11. ^ Кенни, Питер В .; Садовски, Йенс (2005). «Модификация структуры в химических базах данных». Хемоинформатика в открытии лекарств. Методы и принципы медицинской химии. стр.271–285. Дои:10.1002 / 3527603743.ch11. ISBN  9783527307531.
  12. ^ Lyne, Paul D .; Кенни, Питер В .; Косгроув, Дэвид А .; Дэн, Чун; Заблудов, Соня; Вендолоски, Джон Дж .; Эшвелл, Сьюзен (2004). «Идентификация соединений с наномолярным сродством связывания для киназы-1 контрольной точки с использованием виртуального скрининга на основе знаний». Журнал медицинской химии. 47 (8): 1962–1968. Дои:10.1021 / jm030504i. PMID  15055996.
  13. ^ Лич, Эндрю G .; Джонс, Хью Д .; Косгроув, Дэвид А .; Кенни, Питер В .; Растон, Линетт; Макфол, Филип; Вуд, Дж. Мэтью; Колклаф, Никола; Закон, Брайан (2006). «Подходящие молекулярные пары в качестве руководства для оптимизации фармацевтических свойств; исследование водной растворимости, связывания с белками плазмы и перорального воздействия». Журнал медицинской химии. 49 (23): 6672–6682. Дои:10.1021 / jm0605233. PMID  17154498.
  14. ^ Ван Дри, Джон Х .; Вейнингер, Дэвид; Мартин, Ивонн С. (1989). «ALADDIN: интегрированный инструмент для компьютерного молекулярного дизайна и распознавания фармакофоров из геометрических, стерических и субструктурных поисков трехмерных молекулярных структур». Журнал компьютерного молекулярного дизайна. 3 (3): 225–251. Дои:10.1007 / BF01533070. PMID  2573695.
  15. ^ Программное обеспечение OpenEye Scientific | ROCS