Строение генератор: Устройство и принцип работы автомобильного генератора

Содержание

Первый ремонтный комплект для 48-вольтового гибридного привода от компании Schaeffler

Ланген | 21 января 2020 | 2020 год является ключевым для разработок автопроизводителей в сфере электротранспорта, а также это год, когда вступят в силу новые ограничения выброса CO2, установленные Европейским Союзом. Для рынка автомобильных запчастей также актуален вопрос о том, какие запасные части понадобятся в будущем и какие услуги можно предложить. Технические сложности, к которым в будущем придется подготовиться СТО, будут многообразными и комплексными, например, гибридные автомобили с приводами P0 оснащены электродвигателем с ременным приводом в дополнение к классическому двигателю внутреннего сгорания. 48-вольтовая технология в легковых гибридах играет основную роль в превращении системы FEAD из потребителя энергии в источник питания: стартерный двигатель и генератор заменены стартер-генератором (сокращенно BAS). При взаимодействии с 48-вольтовой батареей транспортное средство может «двигаться накатом» с полностью выключенным двигателем внутреннего сгорания, что в результате приводит к сокращению выбросов CO2 до семи процентов. После ускорения стартер-генератор (BAS) может также увеличить крутящий момент привода с помощью так называемой «функции подзарядки», увеличивая тем самым как производительность, так и комфортность вождения.

С технологической точки зрения Schaeffler обладает очень прочными позициями на рынке автозапчастей для гибридных автомобилей с учетом опыта компании в области производства оригинального оборудования для силовых передач. В настоящий момент в поставляемом ассортименте уже есть детали для шасси более 85 процентов всех гибридных автомобилей. Это почти аналогично тому же охвату, что и для автомобилей с традиционными двигателями внутреннего сгорания. Решения для ГРМ и привода навесного оборудования переднего расположения разработаны экспертами для более чем половины существующих транспортных средств. Уже сейчас СТО часто устанавливают следующие ремонтные комплекты производства компании Schaeffler: система двигателя — комплект временного привода INA Timing Belt Drive KIT для Audi A3 Sportback 1.

4 TFSI e-tron, VW GOLF VII 1.4 GTE Hybrid и Volvo D5 и D6 Hybrid. Для ремонта ходовой части, например, ремонтный комплект FAG WheelSet устанавливается на Renault Scénic 4 с 1.5 dCi Hybrid Assist, а также на BMW X5 и X6 Hybrid.

Не революция, а эволюция в архитектуре автомобиля

В ближайшем будущем станциям технического обслуживания следует готовиться к переходному периоду, так как внедрение электромобильного транспорта займет не один день. «Мы рассматриваем добавление электропривода в архитектуру автомобиля прежде всего как эволюцию. Процессы диагностики и ремонта могут измениться, но без сомнения независимые СТО также смогут ремонтировать гибридные автомобили и электромобили. Важно, чтобы они приняли изменения на рынке, вложились в будущие технологии и образование», — сообщил Рувен Даниэль, вице-президент подразделения систем трансмиссий и ответственный за электромобильный транспорт в подразделении автозапчастей Schaeffler Automotive Aftermarket.

Вне зависимости от типа трансмиссии, рынок запчастей отстает примерно на пять лет. Это относится как к гибридным, так и к полностью электрическим автомобилям. Для обоих типов транспортных средств Schaeffler видит доли релевантных автомобилей на рынке запасных частей, то есть автомобилей старше пяти лет, которые составляют менее пяти процентов в мировом масштабе в ближайшие годы при одновременном росте глобального парка автомобилей. Сценарий компании Schaeffler «30-40-30» подтверждает это и прогнозирует к 2030 году 30 % полностью электрических автомобилей, 40 % гибридов и 30 % традиционных автомобилей с ДВС. «Поэтому в течение следующих нескольких лет мы ожидаем не революцию, а, скорее, эволюцию. С нашим ассортиментом выпускаемой продукции мы в полной мере готовы к сотрудничеству с нашими клиентами и станциями технического обслуживания», — сообщил Даниэль.

Электрогенератор: предназначение, устройство, принцип действия

Электрогенератор: предназначение, устройство, принцип действия

Основным предназначением автомобильного электрогенератора является подзарядка аккумулятора и питания бортовой системы автомобиля. Учитывая конструктивные особенности, можно выделить два типа генераторов: генераторы традиционной и компактной конструкции.

Генератор, в основе работы которого находится магнитная индукция, предназначен для обеспечения электрическим током потребителей, включенных в систему электрооборудования, а также для зарядки аккумулятора при включенном двигателе автомобиля. Генератор должен иметь соответствующие выходные параметры, чтобы, независимо от режима движения автомобиля, не происходил разряд аккумулятора. Кроме этого, генератор должен обеспечивать стабильное напряжение в бортовой сети автомобиля. Принцип работы генератора, а также конструкция этого механизма приблизительно одинаковы для любого автомобильного генератора, несмотря на то, где и кем он выпущен.


Устройство генератора

Основу работы генератора составляет эффект электромагнитной индукции. Генератор состоит из корпуса, статорной обмотки, ротора, реле-регулятора и выпрямительного моста.

Корпус генератора выступает в качестве основания для статорной обмотки. Обычно производится из легкосплавных металлов, например, из дюралюминия. Для охлаждения во время работы в корпусе предусмотрены специальные «окна». Сзади и спереди корпуса имеются подшипники, на которых крепится ротор. Статорная обмотка производится из медного провода и укладывается в пазах сердечника.

Ротор представляет собой некий электромагнит, который имеет одну обмотку, расположенную на валу ротора. Сверху обмотки находится сердечник, выполненный из ферромагнитного металла.

Реле-регулятор осуществляет функцию контроля и регулирования напряжения на выходе из генератора. Выпрямительный мост с шестью диодами выдает прямой ток более 40 ампер. Диоды, расположенные попарно на плюсовом и минусовом токопроводящих основаниях, соединяются по схеме Ларионова.

  1. передняя крышка;
  2. обмотка статора;
  3. обмотка возбуждения;
  4. задняя крышка;
  5. щеточный узел;
  6. контактные кольца;
  7. выпрямительный блок;
  8. полюсные половины;
  9. крыльчатка вентилятора;
  10. приводной шкив

Конструктивные особенности

Учитывая конструктивное исполнение, можно выделить два типа генераторов: традиционные и компактные. Генераторы традиционной конструкции имеют вентилятор, расположенный у приводного шкива. Вентиляционные окна находятся только в торцевой части.

Генераторы компактной конструкции имеют два вентилятора, расположенные внутри полости генератора. Компактные генераторы часто называют высокоскоростными, так как они оснащены приводом, имеющим повышенное передаточное отношение.


Принцип работы генератора

Работа автомобильного генератора основывается на принципе появления переменного электрического напряжения в обмотке статора, возникающего в результате воздействия постоянного магнитного поля, образующегося вокруг сердечника.

Ротор приводится в действие двигателем через ременную передачу. На обмотку ротора производится подача постоянного электрического напряжения, достаточного для возникновения магнитного потока. Силу магнитного потока регулирует реле-регулятор. Напряжение на выходе генератора находится в пределах между 13,6 вольт летом и 14,2 вольт зимой. Этого напряжения достаточно для того, чтобы аккумулятор находился в нормальном рабочем состоянии, и периодически производилась его подзарядка. Питание бортовой сети, включенной параллельно аккумулятору, происходит от клемм генератора.


Правила эксплуатации генераторов

Среди основных правил можно выделить следующие:

— При эксплуатации генератора важно, чтобы «минус» АКБ всегда подключался к корпусу, а плюс — к плюсу генератора.
— Во время эксплуатации генератора его нельзя отсоединять от АКБ, так как это может привести к неисправностям в бортовой сети машины.
— Нельзя проверять генератор с использованием искры, присоединяя плюс генератора к корпусу. Из-за этого выходят из строя диоды. Для осуществления проверки генератора используют амперметр или вольтметр.
— Если производится ремонт генератора, не стоит проверять сопротивление изоляции обмотки статора высоким напряжением тока. Подобные действия могут осуществляться только на специальном стенде при условии отсоединения диодов выпрямителя.


— Если производится проверка электропроводки автомобиля, генератор необходимо отсоединить.
— При проведении кузовного ремонта автомобиля, особенно с осуществлением сварочных работ, генератор обязательно отсоединяют.

Важно придерживаться всех вышеперечисленных правил, так как их несоблюдение часто приводит к неисправностям генератора.

Другие статьи

#Бачок ГЦС

Бачок ГЦС: надежная работа гидропривода сцепления

14.10.2020 | Статьи о запасных частях

Многие современные автомобили, особенно грузовые, оснащаются гидравлическим приводом выключения сцепления. Достаточный запас жидкости для работы главного цилиндра сцепления хранится в специальном бачке. Все о бачках ГЦС, их типах и конструкции, а также о выборе и замене этих деталей читайте в статье.

Строение и принцип работы диодного моста генератора

 

«Автомобильные генераторы бывают двух видов: постоянного и переменного тока», — такую фразу можно прочитать в академических изданиях. В реальности автомобиль с генератором постоянного тока сегодня можно встретить разве что на выставке ретро-техники.

С 60-х годов прошлого века в автомобили устанавливают генераторы переменного тока. Узел выпрямления нужен, чтобы преобразовывать переменный ток в постоянный для питания автомобильных электроприборов. Зачем нужно было так заморачиваться и какие весомые преимущества есть у генераторов переменного тока — тема для отдельной статьи.

Что такое диодный мост и как он работает

Автомобильный генератор вырабатывает трехфазный переменный по величине и знаку ток (напряжение). Чтобы получить постоянную величину тока, в генераторах используют реле-регуляторы.

А чтобы получить ток, постоянный по полярности (+/-), используют диодные мосты, которые подключаются к обмоткам статора и преобразуют переменный ток в постоянный.

Т.е. диодный мост — это узел из выпрямительных полупроводниковых диодов, который выпрямляет переменный ток, вырабатываемый генератором.

Обмотка генератора вырабатывает три фазы тока, каждая из которых имеет форму синусоиды (волны). Часть полуволн заряжена положительно, вторая часть — отрицательно.

Полупроводниковые диоды имеют свойства пропускать ток только в одном направлении. Например, открываются на положительных полупериодах и закрываются на отрицательных.

 

Движение тока в генераторе

 

Как это работает в диодном мосте:

  • переменный ток из обмоток периодически меняет направление движения в цепи;
  • диоды пропускают его только в одном направлении;
  • чтобы не было скачков, на каждую фазу устанавливается по два диода (силовое плечо), работающих в разных направлениях.

Поэтому в стандартной, «базовой» комплектации диодного моста всегда не меньше 6 диодов (по два на каждую фазу). И независимо от полярности тока в обмотках генератора на выходе всегда будет плюс, необходимый для работы электроприборов.

С диодного моста ток поступает в аккумулятор, а оттуда ко всем электроприборам.

Принципиальная конструкция и особенности диодного моста

Диодный мост представляет собой две алюминиевые пластины (плюсовая и минусовая), соединенные изоляционными втулками. На пластинах расположены разъемы для проводов, подключающихся к обмоткам статора и регулятору напряжения.

В каждую пластину запрессованы по три или четыре крупногабаритных диода — это силовой мост.

Чтобы генератор работал более стабильно и эффективно, к 6 (8) основным диодам, которые “выпрямляют” ток,  можно подключить 3 дополнительных слаботочных — они подают питание на реле-регулятор и обмотку возбуждения.

 

 

 

Схема диодного моста генератора

Виды диодных мостов

На современных автомобилях используют диодные мосты на 6 или 8 диодов.

Шестидиодный мост используют в генераторах с любым способом подключения обмоток статора — треугольником или звездой.

 

Подключение обмотки к диодному мосту треугольником

 

Восьмидиодные мосты используются только при обмотке статора звездой, т.к. дополнительное силовое плечо здесь подключено к нулевой точке статора.

Подключение обмотки к диодному мосту звездой

 

Это более мощные мосты: дополнительное силовое плечо повышает мощность генератора на 5-15%, зависит от оборотов двигателя.

И шести-, и восьмидиодные мосты могут быть:

  • только с выпрямительными диодами. Здесь обмотка возбуждения питается от напряжения, которое снято с силовых выпрямителей;
  • с 3-мя дополнительными диодами (9-ти или 11-ти диодные мосты). В этом случае питание регулятора и обмотки идет с вспомогательных диодов.

 

Схема на 8 диодов

 

Кроме того, диодные мосты отличаются по конструкции, способу крепления диодов, бывают разборными и неразборными. В диодных мостах используются полупроводниковые выпрямители, лавинные диоды или диоды Шоттки.

Как проверить и отремонтировать диодный мост

Неисправный генератор заявляет о себе недвусмысленно:

  • Полностью заряженный с вечера аккумулятор на утро разрядился. Если его зарядить снова и завести двигатель, он разрядится через несколько минут.
  • Генератор воет во время движения. ТОнальность воя меняется в зависимости от оборотов.
  • Электроприборы сбоят.

Чтобы убедиться, что неисправен именно диодный мост, измерьте напряжение на выходе генератора — оно должно быть больше 13,5В и прозвоните генератор: если проблема в диодном мосте, “плюс” будет звенеть вместе с обмоткой.

Чтобы окончательно подтвердить предположения, езжайте на хорошее СТО — там мастера работают со спецоборудованием, которое позволяет найти обрывы, пробои, определить тип диодов, обнаружить их деградацию, напряжение обратного пробоя в лавинных диодах.  Такая подробная диагностика позволяет мастеру понять, какой диод нужен на замену, обнаружить деградирующие диоды и качественно отремонтировать генератор.

Если диодный мост разборной, специалисты заменят диоды, пришедшие в негодность. Если нет, придется полностью менять весь блок.

Генератор Технеция-99m ГТ-2м – Росатом

Генератор технеция-99m ГТ-2м в стандартном и новом упаковочных транспортных комплектах, медицинский защитный контейнер, набор флаконов для элюирования и сохранения стерильности.

Генератор технеция-99m ГТ-2м (99Mo/99mTc генератор, далее генератор) предназначен для многократного получения элюата – стерильного апирогенного раствора пертехнетата натрия (Na99mTcO4) в изотоническом  растворе хлорида натрия (0,9 % раствор NaCl).

Патент на изобретение №2153357.pdf(6,2 Mb)

Регистрационное удостоверение № ФСР 2008/03978.pdf(7,5 Mb)

Элюат генератора, содержащий радионуклид технеция-99m, используют в медицине для диагностических целей:

  • для функциональной диагностики щитовидной железы, слюнных желез, желудка, мозга посредством процедуры сцинтиграфии после внутривенного введения препарата в организм;
  • при приготовлении различных радиофармпрепаратов на основе наборов соответствующих реагентов, применяемых в радионуклидной диагностике новообразований, заболеваний сердечно-сосудистой, кроветворной и центральной нервной системы.

В России, на сегодняшний день, производят 12 «холодных наборов» для получения РФП, меченных 99mTc (ООО «Диамед» и ЗАО «Фарм-синтез»).

Качество элюата соответствует требованиям Российской Фармакопеи ФСП 42-02254528-03.

Выпуск генераторов осуществляется согласно требованиям системы обеспечения качества – стандартам серии ГОСТ ISO-9001-2011.

Упаковка генератора технеция-99m ГТ-2м отвечает требованиям, предъявляемым к упаковочным транспортным комплектам типа А.

Технические характеристики генератора Техеция-99m ГТ-2м:
Элюатпрозрачный бесцветный стерильный апирогенный раствор
Химическая формаNa99mTcO4
Радиохимическая чистота, %, не менее99,0
Тип распадабета, гамма
рН4,0 – 7,5
Номинальная активность по 99mTc наустановленную дату поставки, ГБк (Ки), не более37,0 (1,0)
Содержание радионуклидных примесей, % от активности 99mTc, не более:
99Mo
другие гамма-излучающие, в сумме

2×10-2
1×10-3
Содержание неактивных примесей, мкг/мл, не более
Al
Mn
другие примеси

2,0
5,0
в соответствии с ФСП 42-02254528-03
Мощность экспозиционной дозы на поверхности генератора в зависимости от номинала, мкЗв/(чхГБк)60,0
Вес, кг15,0
Назначенный срок службы с установленной даты поставки (калибровки), сут.15

АО «ГНЦ РФ — ФЭИ им. А.И. Лейпунского»
Тел.: +7 (484) 399-80-76
Факс: +7 (484) 396-80-08
Сайт: www.ippe.ru
Нерозин Николай Александрович – зам. директора ОФХТ, начальник НПК ИиРФП
E-mail: [email protected]

Автомобильный генератор.

Устройство и принцип работы генератора

Если сравнить по аналогии с человеческим организмом автомобиль то двигатель внутреннего сгорания станет сердцем, ну а роль нервной системы достанется генератору вкупе с бортовой проводкой. Будет ли двигаться автомобиль без генератора? Будет, но не долго, ровно до тех пор, пока не разрядится аккумуляторная батарея. Вот именно для зарядки аккумулятора и поддержания рабочего напряжения в бортовой сети и служит автомобильный генератор.

 

Устройство генератора автомобиля

 

Строение генератора автомобиля представляет собой совокупность отдельных элементов собранных в одном корпусе.

  1. Корпус генератора является одновременно и основанием для статорной обмотки. Выполнен из легко сплавных металлов (чаще дюралюминий), и имеет «окна» для лучшего охлаждения во время работы. В задней и передней частях корпуса расположены подшипники для крепления на них ротора.
  2. Статорная обмотка генератора выполнена из медного провода и уложена в пазах сердечника. Сердечник выполнен в виде круга и изготавливается из металла с улучшенными магнитными характеристиками (трансформаторное железо). Поскольку генератор автомобиля является трехфазным производителем энергии, поэтому статор имеет три обмотки, соединенные между собой треугольником. В местах соединения фазных обмоток к ним подключается выпрямительный мост. Провод для изготовления фазных обмоток имеет двойную термоустойчивую изоляцию, чаще всего применяется специальный лак.
  3. Ротор представляет собой электромагнит и имеет одну обмотку. Обмотка располагается на валу ротора. Сверху обмотки ротора расположен сердечник из ферро магнитного материала. Диаметр сердечника на 1,5-2 мм меньше диаметра статора. Для подачи напряжения управления с реле-регулятора на обмотки ротора, применяются медные кольца, которые располагаются на валу и соединены с обмоткой ротора посредством графитовых щеток.
  4. Реле-регулятор, выполняет функцию контроля и регулировки напряжения на выходе генератора. Выполнен в виде электронной схемы и имеющий выходы к щеткам. Реле-регулятор может устанавливаться как непосредственно в корпусе генератора, в этом случае регулятор выполняется в одном корпусе со щетками. Или отдельно от генератора, тогда щетки устанавливаются на щеткодержатель.
  5. Выпрямительный мост имеет шесть диодов с прямым током более 40 Ампер. Диоды располагаются на токопроводящих основаниях (плюсовом и минусовом), попарно и соединены по схеме Ларионова. Соединение по этой схеме позволяет на выходе получить постоянное напряжение из трёхфазного переменного. В народе выпрямительный мост именуется «подковой», потому, что токопроводящие основания диодов для удобного расположения в корпусе, имеют вид подковы.

 

Принцип работы автомобильного генератора

В основу работы автомобильного генератора положен принцип порождения переменного электрического напряжения в обмотках статора под воздействием постоянного магнитного поля, которое образуется вокруг сердечника ротора.

Двигатель приводит в действие ротор генератора при помощи ременной передачи. На обмотку возбуждения (ротора) подается постоянное электрическое напряжение, достаточное для образования магнитного потока. При вращении сердечника вдоль обмоток статора, в последних наводится ЭДС. Сила магнитного потока регулируется реле-регулятором, увеличением или уменьшением подаваемого напряжения на щетки, и зависит от нагрузки, снимаемой с плюсовой клеммы генератора. Напряжение на выходе генератора колеблется в пределах 13,6 в летнее время и 14,2 в зимний период (для реле-регуляторов у которых имеется встроенный контроль температуры окружающего воздуха). Такого напряжения достаточно для дозаряда аккумулятора и поддержания его в заряженном состоянии. Бортовая сеть так же питается от клеммы генератора автомобиля и включена параллельно аккумулятору.

 

РЕКОМЕНДУЕМ ТАКЖЕ ПРОЧИТАТЬ:

 

Эксплуатация генератора в зимних условиях!

Отключения электричества в загородных поселках после ледяных дождей или сильных снегопадов в последние годы стали чаще. Не оказаться в отчаянном положении без минимальных жизненных благ поможет бензиновый генератор. Как его выбрать и что нужно знать о зимнем запуске?


Отключения электричества в загородных поселках после ледяных дождей или сильных снегопадов в последние годы стали чаще. Не оказаться в отчаянном положении без минимальных жизненных благ поможет бензиновый генератор. Как его выбрать и что нужно знать о зимнем запуске?

Оптимальными для эксплуатации генератора считаются температуры в пределах +5…+40°С. Для работы при минусовых температурах обычно требуется дополнительное оборудование, адаптирующее генератор к сильным морозам, но та кая доработка портативного генератора может повысить его стоимость в 2 раза. Есть, конечно, вариант встроить генератор в теплое помещение с возможностью отвода выхлопных газов, но это тоже требует затрат. Однако специалисты знают способ, как обойтись без этого. Первый способ очень прост: хотя бы за час до включения занести генера тор в помещение с температурой выше +10°С и запустить его сразу после выноса на улицу – это будет практически равнозначно запуску в теплое время.

Если нет возможности выдержать генератор в тепле, применяется второй способ:

Подготовка к запуску

Поменяйте масло на зимнее. Для работы при низких температурах требуется специальное масло с пометкой W (winter) в маркировке; точные показатели вязкости масла, необходимые вашему генератору, должны быть указаны в инструкции по эксплуатации.

Выкрутите и проверьте свечу зажигания. Если на ней есть небольшой нагар, удалите его мелкой наждачной бумагой. Снимать нагар металлическими предметами нельзя. Сильный нагар – повод поменять свечу. Проверить, рабочая ли свеча, можно следующим образом: вставьте ее обратно в гнездо, прижмите контакт к металлическому корпусу двигателя и дерните стартер. Если между свечой и металлом появится искра – свеча исправна.

Залейте свежее топливо. Оно тоже портится: при хранении в течение нескольких месяцев происходят химические процессы, которые ухудшают свойства бензина. Эти ухудшения не критичны, но могут вызвать проблемы при зимнем запуске. Очень полезно использовать присадки для топлива, облегчающие запуск при низких температурах.

По возможности воспользуйтесь аэрозолем, который в народе называют «карбюраторкой». Им нужно брызнуть в систему забора воздуха. Перед этим обязательно снимите крышку фильтра и выньте сам фильтр – он может испортиться из-за ацетона, содержащегося в аэрозоле.

При очень сильных морозах непосредственно перед запуском с ручного стартера проверьте, не замерзла ли смазка в механизме стартера. При выключенном зажигании потяните несколько раз за шнур и убедитесь, что после этого он сматывается обратно на катушку.

При зимнем старте может понадобиться много раз дернуть ручку стартера, особенно если вы перезаливали топливо.

При сильных морозах нельзя нагружать генератор сразу после запуска – дайте ему прогреться хотя бы 10 минут.

При температурах ниже — 30 °С возможны проблемы с карбюратором, резиновыми уплотнителями и амортизаторами. Если генератор работает на улице, единственный способ решения проблемы – огородить его металлическими листами на расстоянии 20-30 см. Это будет удерживать разогретый воздух рядом с генератором и поднимет температуру до приемлемого уровня.

Что делать после выключения генератора

При работе генератор нагревается, и после его остановки из-за перепада температур внутри устройства образуется большое количество конденсата. Он оседает на внутренних элементах и при «холодном» хранении превращается в лед, который приводит к проблемам в эксплуатации. Чтобы этого не случилось, рекомендуется после выключения заносить генератор в тепло и выдерживать как минимум час. Но что делать, если такой возможности нет?

Перед глушением двигателя отключите нагрузку и дайте генератору проработать 15 минут на холостом ходу.

После глушения двигателя потяните за ручку стартера, постарайтесь поймать точку максимального сопротивления, при максимальном сопротивлении клапана закрыты. Это уменьшит циркуляцию теплого воздуха внутри крышки клапанов и, соответственно, вероятность обледенения.

Минут через 30, когда генератор остынет, рекомендуется накрыть его, максимально ограничив попадание внешнего воздуха.

Еще один совет

Промерзший Сапун (клапан, который служит для сброса давления картерных газов) может стать причиной серьезных поломок. Он находится под крышкой клапанов (на ней написано OHV). Самая большая опасность заключается в том, что критический уровень давления картерных газов достигается при зимнем запуске раньше, чем клапан оттаивает и сбрасывает давление. При этом, как правило, портятся сальники подшипников коленчатого вала (их выдавливает). Чтобы сбросить давление, во время прогрева на 10-15 минут нужно приоткрыть крышку маслоналивной горловины (не выкручивать, а просто открутить на пол оборота). Пока не прогреется сапун, давление будет сбрасываться через эту крышку. Затем ее нужно плотно закрутить.

Анатомия ГЭС | ТГК-1

Силу водного потока человечество научилось использовать сотни лет назад: в средние века река вращала рабочее колесо мельницы, а в XIX столетии появились первые гидростанции, на которых энергия водного потока преобразуется в электрическую.

И хотя каждый из нас представляет себе в общих чертах устройство этих сооружений, редко кому удается заглянуть внутрь.

Гидроагрегат электростанции похож на айсберг – большая часть расположена в воде, а сверху в машинном зале мы видим только своеобразную «масленку» — верхнюю часть работающей машины.

Огромный масштаб основного оборудования, благодаря которому энергия водного потока превращается в электричество, можно оценить только во время большого капитального ремонта — сосредоточения усилий десятков людей.

Капитальный ремонт редко продолжается меньше пары месяцев. Сначала приступают к демонтажу генератора. Он закреплен на массивной крестовине, которая принимает на себя вес всего оборудования.

Под крышкой крестовины находится огромный ротор. Именно здесь рождается электричество: ротор вращается в магнитном поле статора, возникает электродвижущая сила, которая вызывает электрический ток.

Ротор снимают и отправляют на специальную ремонтную площадку, расположенную в машинном зале, для проверки и обслуживания.

Затем происходит выемка рабочего колеса. Этот огромный «вентилятор» принимает на себя всю силу реки.

Под действием напора рабочее колесо вращает вал, на котором закреплен ротор генератора – это и есть принципиальная схема работы ГЭС.

Вес ротора может достигать нескольких десятков тонн, так что без крана при установке ротора не обойтись.

Любая сборка и разборка гидроагрегата – это множество слесарной работы.

Мелочей не бывает: каждый болт должен соответствовать нормативам и допускам. Поэтому на ГЭС есть слесарный участок, где работают, что называется, «на качество».

Кстати, турбины тоже бывают разные. Для рек с небольшим перепадом высот и, соответственно, напоров, применяют поворотно-лопастные турбины (турбины Каплана) – похожие на гребной винт корабля. Как следует из названия, их лопасти могут поворачиваться, что и обеспечивает изменение рабочего диапазона.

Второй распространенный тип – радиально-осевые турбины. Они применяются на реках с высоким напором, позволяют получить больше мощности, но могут работать в более узком диапазоне режимов.

Рабочее колесо весит несколько десятков тонн и может служить десятилетиями. Например, турбина Волховской ГЭС отработала около 90 лет и теперь стала памятником около гидроэлектростанции.

Чтобы ГЭС эффективно работала, мало просто поместить турбину в реку — воду нужно подводить специальным образом – через подводящий канал и спиральную камеру. Это нужно для того, чтобы вода равномерно поступала на лопасти рабочего колеса.

Увидеть спиральную камеру можно только во время строительства гидроэлектростанции, так как она находится в основании ГЭС. Но иногда, во время капитального ремонта, спиральную камеру осушают и туда можно зайти, чтобы провести инспекцию и выполнить регламентные работы.

Здесь есть еще один важный элемент: направляющий аппарат. Это система неподвижных и подвижных лопаток на пути воды к турбине.

Статичные пластины ламининиризируют, то есть «успокаивают» поток, чтобы он не повредил рабочее колесо, а подвижные открывают и закрывают входные окна, тем самым регулируют количество поступающей воды на турбину. Задача управления простая: нужно добиться оптимальных соотношений между открытиями направляющего аппарата и углами разворота лопастей.

Последние два десятилетия круто изменили практику эксплуатации этих потрясающих машин. На смену аналоговым устройствам пришли цифровые компьютерные технологии, которые стали неотъемлемой частью управления электростанцией.

Сегодня многие ГЭС даже могут работать в автономном режиме – один человек отдает команды целому каскаду гидроэлектростанций, и все действия по управлению оборудованием выполняет автоматика. Она же следит за параметрами: как только что-то выходит за рамки допустимых значений, система подает сигнал или включает защиту.

Вся телемеханика и автоматика помещается в нескольких шкафах.

Работа с современным цифровым оснащением предъявляет особые требования к персоналу. Это инженеры с высшим образованием и высочайшей квалификацией. Каждый из них сдал несколько экзаменов, прежде чем получил допуск к работе!

Любая гидроэлектростанция – это комплекс искусственных сооружений, с помощью которых человек надежно установил контроль над стихией реки. Благодаря регулированию на многих реках удалось прекратить разрушительные паводки, а с помощью шлюзов даже обеспечить судоходство.

Многим ГЭС на Северо-Западе России (первенцам ленинского плана электрификации страны) уже 80-90 лет, что зачастую означает, что их проект не предусматривал развития современных технологий. Например, вряд ли отцы-энергетики могли предположить, что по плотинам ГЭС будет перемещаться огромный поток автомобилей.

Именно в таких случаях возникает потребность модернизировать конструкцию. Специфика работы на гидросооружениях заключается в невозможности вывести объект из эксплуатации. Водосброс нельзя «выключить», осушить и спокойно перестроить. Каждое действие должно быть выполнено строго в соответствии с проектом. Демонтаж старых конструкций происходит с хирургической точностью и аккуратностью.

Новые стальные балки смогут выдержать необходимые нагрузки.

Кроме того, обновленный водосброс будет иметь собственный кран для ремонтных работ.

Река несет в себе немало посторонних предметов, которые засоряют сороудерживающие решетки. Сама по себе вода — это агрессивная среда и необходимо постоянно контролировать состояние бетона плотины и подводящего канала. Как тут без водолазов?

В последние годы гидроэнергетики применяют инновационное оборудование: вместо водолазов погружается самый настоящий робот!

Оператор с берега управляет его движением, а камеры в реальном времени передают картинку на терминал.

В считанные минуты можно осмотреть приемные решетки или подводную камеру.

Двигатели на электрическом приводе позволяют маневрировать во всех направлениях и противостоять течению реки. Будущее уже здесь!

Время от времени перед гидроэнергетиками встают вызовы, с которыми не справится никакой робот. Что делать, если на горизонте в верхнем течении реки показался… остров? И он стремительно приближается!

Оказывается, что плавучие острова – это не такое уж редкое явление. В верховьях рек бывают обширные заболоченные участки. Годами на поверхности воды нарастает ковер травы и даже укореняются деревца. В многоводные годы после сильных дождей или таяния снегов уровень воды в реке поднимается, участки болота всплывают и уходят вниз по течению.

Острова бывают довольно обширные, даже со случайными пассажирами: земноводными и мелкими грызунами. Не стоит и говорить, что такие «сюрпризы» доставляют энергетикам немало хлопот.

На помощь приходит штатный катер, который позволяет отвести остров в сторону и приступить к его ликвидации.

За несколько часов труда энергетикам удается разделить его на части. Дальше куски острова нужно направить точно в открытое окно водосброса.

Главная задача гидроэнергетиков – безопасная эксплуатация гидротехнических сооружений и оборудования. Вся эта сложная система работает благодаря трудам выдающихся инженеров прошлого и грамотным инженерам, оперативникам и ремонтникам сегодня.

Когда закончен масштабный ремонт, турбина на месте, а генератор готов запустить поток электронов в сеть, остался один простой тест.

На крышку работающего гидрогенератора нужно поставить монету на ребро – если колоссальная сила реки вращает многотонный ротор с такой легкостью и нежностью, что монета не падает – значит работа выполнена качественно.

Как и принято у энергетиков.

OMG: Генератор открытых молекул | Journal of Cheminformatics

Химические элементы и типы атомов

Мы хотели бы описать некоторые концепции, связанные с атомами, которые необходимы для понимания теории и алгоритма OMG и использования CDK для обработки химии.

В природе атомы различных химических элементов (углерода, азота, кислорода и других) связаны друг с другом связями, чтобы образовать молекулы. Валентность этих химических элементов, которую мы также будем называть степенью, определяет, сколько связей может иметь каждый элемент.Углерод имеет валентность 4, кислород 2, азот 3 или 5, сера 2,4 или 6, люминофор 3 или 5. Таким образом, атом углерода становится насыщенным, когда он имеет 4 связи, где одинарная связь считается за единицу. связь, двойная, как две связи, и тройная, как три связи. Что касается молекул, мы считаем молекулу насыщенной, когда все ее атомы насыщены. В некоторых особых случаях атомы заряжены, что придает им другую валентность. В случае OMG мы используем только нейтральные атомы, и, как следствие, производятся только нейтральные молекулы, поэтому все готовые молекулы будут содержать атомы с валентностями, упомянутыми ранее.

Химический элемент может иметь несколько типов атомов, в том числе с одинаковой валентностью элемента, как определено в словаре типов атомов в CDK. Этот словарь определяет для каждого атома количество соседей, пи-связей, зарядов, неподеленных электронных пар и гибридизаций, чтобы приспособиться к различным состояниям, которые химический элемент может иметь из-за различных связей, количества соседних атомов, зарядов и гибридизаций. Эти типы атомов основаны на химических элементах, которые наблюдались в природе для насыщенных молекул.Вот почему мы используем словарь атомов CDK для проверки атомов наших готовых молекул.

OMG будет выводить только насыщенные молекулы, содержащие атомы, указанные в элементном составе. Помимо готовых молекул, OMG должен представлять в процессе генерации промежуточные химические структуры, которые еще не завершены. Они могут содержать разъединенные фрагменты и ненасыщенные атомы. Типы атомов CDK не предназначены для представления типов атомов ненасыщенных химических элементов; поэтому мы выбрали простой атомный словарь.Этот словарь определяет для каждого химического элемента его валентность, другими словами, максимальную степень. Следовательно, для промежуточных химических структур мы проверяем только то, что текущая степень каждого атома не превышает максимальной степени.

MOLGEN также может производить молекулы с несколькими валентностями, но обрабатывает их по-другому. В то время как с OMG необходимо обеспечить только элементный состав для генерации молекул с множественными валентностями, MOLGEN требует априори знать, какую из этих множественных валентностей следует использовать. По умолчанию он использует самую низкую валентность, то есть N-валентность 3, P-валентность 3 и S-валентность 2, если не указана другая валентность. В таблице 1 представлены типы атомов, производимые OMG и MOLGEN для валентностей, отличных от значений по умолчанию. Используя в качестве примера серу, OMG будет выводить молекулы с валентностью серы 2, 4 и 6. Для того же химического элемента MOLGEN по умолчанию будет производить молекулы с валентностью 2 серы. Если установить валентность серы равной 6, он будет только производят серу с валентностью 6, а не с валентностью 2 и валентностью 4.MOLGEN не может генерировать молекулы с атомами разной валентности для одного и того же химического элемента, то есть, если в молекуле два атома серы, один не будет иметь валентность 4, а другой — валентность 6, оба будут иметь валентность 2, 4 или 6.

Таблица 1 Типы атомов, производимые OMG и MOLGEN для нестандартных валентностей N (5), P (5) и S (4 и 6)

Принцип, которого придерживается CDK при построении своего словаря атомов, состоит в том, чтобы разрешить типы атомов с валентностями, для которых существует консенсусное соглашение об их существовании, то есть для которых существуют известные молекулы с такими валентностями.И наоборот, MOLGEN производит все теоретически возможные комбинации порядков связей для данной валентности, как это можно наблюдать в таблице 1. Например, как это можно видеть для P валентности 5, OMG производит только один тип атомов с одной двойной связью и три одинарных. облигации. Для сравнения, MOLGEN производит все комбинации одинарных, двойных и тройных связей, которые в сумме составляют 5. Как следствие, когда желаемая валентность неизвестна, что обычно имеет место при идентификации метаболитов, необходимо генерировать молекулы со всеми возможными валентностями. .В результате количество молекул на выходе обоих генераторов различно для элементных составов, содержащих химические элементы с множеством валентностей. Эта детерминированная генерация валентностей в MOLGEN происходит за счет генерации молекул, имеющих нереалистичную структуру.

Теория графов и химия

Химическая структура молекул может быть представлена ​​в виде графа, где атомы и связи в молекулах соответствуют вершинам и ребрам, соответственно, в графах. В молекулах связи, соединяющие два атома, могут иметь степень в зависимости от количества общих электронов.Такую степень можно также присвоить ребрам графа, который называется мультиграфом. Различные химические элементы, присутствующие в периодической таблице, представлены на графиках в виде цветов, присвоенных вершинам. Мы определяем неориентированный цветной мультиграф G = ( V , E ) как где V — это набор вершин, а E — это мультимножество ребер, где каждое ребро представляет собой неупорядоченную пару вершин. , и функция Col : V цветов .В этом мультиграфе мы говорим, что a , b V являются n-связными , если имеется ровно n ребер ( a , b ) ∈ V . Помимо функции цвета, мультиграф характеризуется функцией d : V × V N , которая возвращает степень ребра, соединяющего каждую пару вершин. Отныне мы будем невнятно обращаться к графам и мультиграфам.

В химии правило валентности определяет максимальное количество связей, которые имеет каждый химический элемент.Чтобы учесть это, определим d v : V N , которая возвращает количество ребер данной вершины, и функция с максимальной степенью md : V M , которая возвращает максимальное количество ребер данной вершины . Мы говорим, что мультиграф недонасыщен, если ∀ v V , d v ( v ) ≤ md ( v ) есть хотя бы одна вершина такая, что d v ( v ) < md ( v ). Мультиграф является насыщенным, если для каждой вершины выполняется равенство dv = md . В химии молекулы соответствуют насыщенным цветным мультиграфам, а максимальная степень зависит от цвета, который является химическим элементом. Например, для углеродного элемента md ( C ) = 4, а для кислородного элемента md ( O ) = 2.

Мы считаем мультиграф связным, если ∀ v , w V , ∃ S { V , W } = { v 1 , ⋯, v m } таким образом, что v , v 1 и v m , w подключены и для каждого i < m , v i подключен к v i + 1 .Другими словами, мультиграф является связным, если для всей пары вершин существует хотя бы один путь S { V , W } , соединяющий обе вершины. Это условие необходимо для химии, поскольку промежуточные химические структуры в процессе генерации могут состоять из разъединенных фрагментов, это гарантирует, что генерируемые молекулы представляют собой одну полностью связанную структуру, а не состоят из разъединенных подструктур. Обратите внимание, что атомы водорода (наиболее часто встречающиеся химические элементы со степенью 1) не учитываются в процессе генерации, поскольку они являются конечными элементами молекулы и не могут соединить два несвязанных элемента молекулы.Атомы водорода используются только для проверки полноты готовых молекул. Атомы галогена, такие как фтор, хлор и йод, также степени 1, учитываются в процессе генерации.

Разметка графиков

Изоморфизм π — это функция, которая для каждой вершины v V , Col ( π ( v )) = Col ( v ) и для каждой пары вершин v V , v V , d ( π ( v ), π ( v )) = d ( v , v ). Функция разметки σ : V → {1, ⋯, n } является биективным отображением вершин цветного мультиграфа в упорядоченный список меток с мощностью, равной количеству вершин. Ставим простой σ, ставим каждой вершине метку. Пусть σ — 1 будет функцией, обратной σ, которая возвращает вершину, соответствующую метке. Мы говорим, что функция маркировки является канонической, если заданы любые два изоморфных цветных мультиграфа: G = ( V , E ) и G = ( V , E ) , биективная функция π : V V , определяемая как π ( a ) = σ — 1 ( σ ( a )), является изоморфизмом В дюйм В .Следовательно, канонически помеченный мультиграф — это мультиграф, вершины которого связаны с упорядоченным списком с помощью канонической функции разметки. Кроме того, канонический хэш разметки является биективной функцией между пространством канонически помеченных мультиграфов и пространством значений, и он представлен как строка целых чисел. Здесь интересно отметить, что два изоморфных графа имеют один и тот же канонический хэш, и этот факт будет использоваться для удаления повторяющихся молекул в процессе генерации.

Использование фрагментов

Фрагмент или субструктура молекулы эквивалентна фрагменту или подграфу графа. Мы определяем фрагмент как подмножество графика, и он характеризуется функцией d f : V × V N , где N — количество ребер, соединяющих каждую пару вершин в подграфе. Такая d f должен соответствовать условию d f ( a , b ) ≤ d ( a , b ), ∀ a , b V и как минимум для одного края d f < d , то есть у фрагмента должно быть меньше ребер, чем у графа.

Каноническое увеличение

Увеличение мультиграфа G = ( V , E ) является мультиграфом G = ( V , E ), определены на одном и том же наборе вершин, так что ∀a, b∈V, dGa, b = dG′a, b, за исключением одной и только одной пары, где d G ( a , б ) = г G ( a , b ) + 1.Пусть e E будет ребром, степень которого увеличена, d ( e ) = d ( e ) + 1.

Пусть e c быть последним краем σ ( G ) и a c , b c V вершины из e c .Рассмотрим σ — 1 ( a c , b c ) = a , b до вершины G , копия G , до которой выполняется уменьшение порядка привязки d ( a ′ ′ , b ′ ′ ) = d ( a ′ ′ , b ′ ′ ) — 1.Полученный мультиграф G ′ ′ после этого уменьшения порядка связывания можно рассматривать как результат канонического удаления на G , операции, обратной каноническому увеличению. В нашем определении канонического увеличения мы рассматриваем мультиграф G = ( V , E ), который канонически расширяется от G = ( V , E ) если это аугментация, и σ ( G ) = σ ( G ).Другими словами, мы рассматриваем G как каноническое увеличение G , если каноническая делеция в G приводит к G .

Описание алгоритма

Генерацию структур можно рассматривать как дерево промежуточных химических структур, которое исследует наш инструмент. В корне дерева мы находим набор полностью изолированных / несвязанных атомов. По одной связи добавляется на каждом уровне дерева, в результате чего образуются полностью связанные / готовые молекулы на листьях.Канонический путь увеличения — это алгоритм поиска с возвратом сначала в глубину, где рекурсивная функция генерирует , описанное в алгоритме 1, реализует добавление одной связи всеми возможными способами для данной промежуточной химической структуры и оценивает для каждой расширенной молекулы, что это расширение было выполнено каноническим способом, как описано ранее. Здесь добавление одной связи означает увеличение степени связи между двумя атомами, следовательно, одинарная связь становится двойной связью, а двойная связь становится тройной связью.Если между двумя атомами нет связи, создается одинарная связь.

Между строками 2 и 9 алгоритма 1 молекула сохраняется, если она завершена, что происходит, когда молекула насыщена и все атомы элементного состава, включая атомы водорода, были использованы, все атомы проверены. словарём атомов CDK и связаны, образуя единую структуру, а не несколько разрозненных фрагментов.

В случае, если молекула не закончена, ее можно расширить всеми возможными способами, добавив одну связь.Если существует связь между парой атомов, функция extension в строке 12 алгоритма 1 увеличит кратность. Генерация новых связей контролируется определениями типа атомов OMG для промежуточных химических структур, которые гарантируют, что степень атомов не превышает максимальной степени, разрешенной для его химического элемента.

Функция канонизирует в строке 15 алгоритма 1, возвращает каноническую версию молекулы. Мы модифицировали канонизатор графов Наути [23, 29], чтобы разрешить использование мультиграфов, а не только простых графов.Существуют и другие канонизаторы для графов, такие как MOLGEN-CID [30] или Signature Canonizer [31], но Наути наиболее широко использовался для графов, а также для задач химии, например, коды InChI [32]. Наути является предпочтительным канонизатором, поскольку он является самым быстрым из всех доступных канонизаторов для графов с ограниченной валентностью с числом вершин менее 100 [33] (молекулы являются примерами этого класса графов). Во-первых, функция canonize переводит молекулу в цветной мультиграф. Во-вторых, он использует Nauty для вычисления канонической разметки мультиграфа.В-третьих, это каноническое маркирование используется для построения канонической версии входной молекулы. Наконец, каноническая хеш-строка каждой расширенной молекулы хранится в хеш-карте, строки 16 и 17, чтобы удалить повторяющиеся расширения на каждом уровне дерева. Каждое уникальное расширение проверяется на каноническое расширение, строка 18, с использованием алгоритма 2 или алгоритма 3, если были предоставлены предписанные подструктуры. Если это расширение выполнено успешно, вызывается функция , сгенерировать , строка 19 алгоритма 1 и молекула, которую мы хотим продолжить, передается в качестве параметра.Когда молекула не может быть расширена дальше, рекурсия прекращается, и программа возвращается в дереве поиска.

Ввод и вывод

Минимальный требуемый ввод — это элементный состав структур, которые необходимо сгенерировать. При желании может быть предоставлен файл структурных данных (SDF), содержащий одну или несколько предписанных подструктур, которые мы хотим, чтобы наши выходные молекулы содержали. Поскольку OMG не принимает во внимание атомы водорода во время генерации промежуточных химических структур, атомы водорода, присутствующие в субструктурах, будут удалены до начала процесса генерации.Эти подструктуры не должны перекрываться, т.е. они не должны иметь общих атомов. Это ограничение связано с тем, что наш алгоритм выращивает молекулы, добавляя связи, и, если бы два атома в разных фрагментах были на самом деле одним и тем же атомом, наш алгоритм создавал бы связи между этими атомами, что явно привело бы к неверным результатам.

На практике может быть доступно несколько подструктур, но пользователь не знает, перекрываются ли они. Это ограничение можно обойти, используя самую большую субструктуру в качестве ограничения для генерации, а остальные субструктуры в качестве апостериорной фильтрации, сохраняя только молекулы с этими субструктурами.

По умолчанию генератор структуры возвращает количество сгенерированных им молекул. При желании он может хранить все молекулы в файле SDF. Если предусмотрены предписанные фрагменты, OMG выводит только молекулы, содержащие такие фрагменты. Мы решили использовать SDF в качестве формата ввода и вывода, но через CDK другие форматы могут быть легко реализованы в OMG.

Данные

Как уже упоминалось во введении, определение химической структуры метаболитов является одним из текущих узких мест метаболомики.В этом смысле генератор структур может способствовать преодолению этого узкого места, поскольку он может предоставить структуры-кандидаты для неизвестного метаболита. Таким образом, метаболиты представляют собой подходящее семейство соединений для тестирования нашего генератора структур. Был выбран список метаболитов и составлен их элементный состав для оценки производительности нашего генератора структур на различных входах. Источником используемых соединений была База данных метаболитов человека (HMDB) [34], которая содержит почти 8000 метаболитов и является наиболее полной базой данных метаболитов человека.Ранее сообщалось об исследовании пространства метаболитов человека и свойств занимающих его метаболитов [28]. Критерии отбора должны были включать циклические и ациклические соединения с разной молекулярной массой и содержащие различные химические элементы, такие как C, O, N, P и S. Первый набор тестов включал метаболиты с C, O и H, химические элементы с одна валентность. Второй набор тестов включал метаболиты с C, O, H, а также химические элементы с множественной валентностью, такие как N, P и S.Кроме того, для некоторых из этих метаболитов было нарисовано несколько подструктур и предоставлено генератору структур в качестве дополнительных входных данных. Эти подструктуры легко идентифицируются экспертом при непосредственном просмотре экспериментальных данных MS 2 или MS n . Целью было оценить важность наличия фрагментарной информации для сокращения списка генерируемых структур.

Границы | СЛАВА: Генератор структур вероятных метаболитов цитохрома P450 на основе прогнозируемых участков метаболизма

Введение

Метаболизм отвечает за создание метаболитов с другими физико-химическими и фармакологическими свойствами по сравнению с исходной родительской молекулой.Метаболизм ксенобиотиков, в частности, имеет прямое отношение к человеку, особенно в том, что касается, например, разработки лекарств, косметики и агрохимикатов. Фактически предполагается, что метаболизм является основным путем выведения подавляющего большинства всех ксенобиотиков (Kirchmair et al., 2015). Однако метаболизм может также приводить к образованию фармакологически активных метаболитов, а также токсичных метаболитов (Testa et al., 2012).

Семейство ферментов цитохрома P450 (CYP) играет важную роль в метаболизме ксенобиотиков, особенно в образовании метаболитов первого поколения, из которых примерно 60% формируются CYP (Testa et al., 2012). Важность CYP для открытия лекарств очевидна из наблюдения, что многие лекарства метаболизируются с помощью CYP; общие оценки варьируются от 50% (Di, 2014) до 80% (Testa et al., 2012). Подробный мета-анализ метаболитов более 1000 различных субстратов ксенобиотиков, проведенный Testa et al., Показал, что 40% всех метаболитов образованы CYP, включая значительную часть всех токсичных или высокореактивных метаболитов (Testa et al. , 2012).

Известно 57 ферментов CYP человека, большинство из которых в основном участвует в эндогенном метаболизме.Подсемейства CYP2 и CYP3 в основном отвечают за метаболизм ксенобиотиков (Testa et al., 2012), а ключевыми изоферментами CYP для метаболизма лекарств являются CYP3A4, 3A5, 2D6, 2C8, 2C9, 2C19, 1A1, 2B6 и 2E1 (Di, 2014). Среди изоферментов CYP, метаболизирующих ксенобиотики, карманы связывания сильно различаются; в некоторых случаях связывающий карман одного изофермента является очень гибким и может вмещать широкий спектр субстратов с широко варьирующимися размерами (Kirchmair et al., 2015).

Вычислительные методы могут внести значительный вклад в прогнозирование метаболизма ксенобиотиков, поскольку их можно использовать для быстрого прогнозирования, которое может сфокусировать экспериментальные аспекты процесса разработки лекарств.Такой эффект фокусировки экономичен и эффективен по времени (Kirchmair et al., 2015).

Одним относительно хорошо разработанным аспектом компьютерного прогнозирования метаболизма ксенобиотиков является идентификация метаболически лабильных положений атомов, также известных как сайты метаболизма (SoMs) (Kirchmair et al., 2012). Возможность предсказать SoM важна, потому что знание положения атома в молекуле, при котором, вероятно, может происходить реакция метаболизма, обычно дает химику хорошее представление о последующей структуре метаболита.Помимо ряда коммерческих предложений, несколько свободно доступных инструментов, таких как SMARTCyp (Olsen et al., 2019), SOMP (Rudik et al., 2015), Xenosite (Zaretzki et al., 2013) и FAME 2 (Šícho et al., al., 2017), могут прогнозировать SoM с высокой точностью (Tyzack, Kirchmair, 2018). FAME 2, который используется в настоящей работе для прогнозирования SoM, представляет собой инструмент на основе машинного обучения, недавно разработанный нашей группой. Модели классификаторов дополнительных деревьев для FAME 2, основанные на наборе двумерных круговых дескрипторов, были разработаны специально для прогнозирования SoM метаболических реакций, катализируемых семейством ферментов CYP у людей.FAME 2 является очень точным, достигая на независимом испытательном наборе коэффициента корреляции Мэтьюза 0,57 и площади под кривой рабочих характеристик приемника (AUC) 0,91.

В отличие от in silico SoM предсказания, вычислительное предсказание структур метаболитов отстает в отношении точности предсказания. В целом в существующих методах прогнозирования структур метаболитов ксенобиотиков преобладают подходы, основанные на правилах. Существует ряд хорошо зарекомендовавших себя коммерческих инструментов для прогнозирования структуры метаболитов, в том числе Meteor Nexus (Lhasa Ltd.), основанное на правилах программное обеспечение для прогнозирования метаболитов (Marchant et al., 2008). Meteor Nexus предлагает три различных метода рассуждения для определения приоритета множества генерируемых метаболитов. Текущий метод рассуждений по умолчанию — это оценка SoM, которая сравнивает SoM, идентифицированную правилом реакции, с экспериментальными данными, чтобы присвоить оценки прогнозируемым метаболитам. Другие основанные на правилах вычислительные инструменты включают TIMES (LMC; Mekenyan et al., 2004), который использует эвристический алгоритм для создания возможных метаболических карт, и MetabolExpert (CompuDrug; Darvas, 1987).

В дополнение к коммерческим инструментам прогнозирования структуры метаболитов, растет число свободно доступных опций. Опять же, многие из доступных вариантов основываются в первую очередь на наборе правил реакции для создания структур возможных метаболитов. Одним из хорошо известных подходов, который существует уже некоторое время, является SyGMa (Ridder and Wagener, 2008), который в этой работе используется в качестве эталонного метода. SyGMa предсказывает метаболиты, используя основанные на знаниях правила реакций, некоторые из которых были получены из общеизвестных знаний о реакциях метаболизма, а некоторые были разработаны с использованием базы данных Metabolite (База данных MDL Metabolite, Elsevier, 2001), всего 144 правила реакции, охватывающие оба фаза I и фаза метаболизма II.Прогнозируемые метаболиты ранжируются по эмпирическим оценкам вероятности, рассчитанным на основе доли предсказанных метаболитов, произведенных конкретным правилом реакции, которые соответствуют зарегистрированным метаболитам в базе данных. Используя все 144 правила реакции фазы I и фазы II в трех последовательных стадиях реакции, SyGMa смог предсказать 68% всех известных метаболитов в тестовой выборке. Что касается ранжирования, SyGMa заняла 45% известных метаболитов в наборе тестов в первой десятке. Авторы дополнительно исследовали потенциальную полезность SyGMa для прогнозирования CYP-опосредованного метаболизма, оценив его эффективность на наборе 127 одноэтапных CYP-опосредованных. реакции.Используя только 118 правил реакции фазы I, которые включают, но не являются специфическими для CYP-опосредованных реакций, SyMGa смог предсказать 84% всех известных метаболитов, образованных CYP, и предсказать 66% известных метаболитов в пределах трех лучших предсказанных метаболитов. . Однако проприетарный характер набора данных, который использовался для получения правил реакции SyGMa и проверки метода, не говоря уже о текущей недоступности набора данных, препятствует воспроизводимости результатов, а также дальнейшему использованию моделей, полученных на основе данных.

Недавнее бесплатное программное обеспечение, предназначенное для прогнозирования метаболитов из нескольких источников и семейств ферментов, — это BioTransformer (Djoumbou-Feunang et al., 2019), которое в этой работе используется в качестве второго эталонного метода. BioTransformer — это комплексный инструмент прогнозирования метаболитов, который содержит модуль прогнозирования метаболитов CYP (в дополнение к четырем другим модулям прогнозирования метаболитов). BioTransformer предсказывает образующиеся CYP метаболиты с использованием подхода, основанного на знаниях, в сочетании со встроенным прогнозированием селективности CYP с помощью CypReact (Tian et al., 2018), инструмент, основанный на машинном обучении, в качестве предшественника прогноза метаболитов. Помимо первоначального прогнозирования специфичности изоформ CYP, в основе модуля прогнозирования метаболитов CYP450 компании BioTransformer лежит метод, основанный на правилах, правила реакции которого частично основаны на метаболических реакциях в MetXBioDB (Djoumbou-Feunang et al., 2019), свободно доступном база данных реакций метаболизма, созданная в рамках разработки Биотрансформатора. В текущей версии BioTransformer прогнозируемые метаболиты не ранжируются.BioTransformer также предлагает возможность определения метаболитов на основе масс-спектрометрических данных. На тестовом наборе данных из 60 исходных молекул с в общей сложности 180 известных метаболитов модуль прогнозирования метаболитов CYP450 компании BioTransformer достиг отзыва 0,90 и точности 0,46.

Другим свободно доступным инструментом прогнозирования метаболитов является MetaTox (Rudik et al., 2017), который охватывает как фазу I, так и фазу II метаболизма и объединяет прогноз класса реакции и реагирующего атома для прогнозирования метаболитов.Кроме того, программное обеспечение с открытым исходным кодом Toxtree (Patlewicz et al., 2008) содержит модуль прогнозирования метаболизма под названием «SMARTCyp — Cytochrome P450-Mediated Drug Metabolism», который прогнозирует SoM с помощью SMARTCyp (Rydberg et al., 2010), а затем применяет небольшой набор правил реакции на предсказанные SoM для предсказания метаболитов.

Общим для всех современных подходов к прогнозированию метаболитов является то, что они по-прежнему сталкиваются с проблемой комбинаторного взрыва прогнозов, в частности, при рассмотрении нескольких поколений метаболитов (Judson, 2014).Для предсказателей структуры метаболитов нет ничего необычного в том, что они создают несколько страниц, полных предсказанных метаболитов, что часто и не без оснований критикуется, особенно специалистами по метаболизму. Ключ к решению этой проблемы заключается в разработке подходов к точному ранжированию метаболитов в соответствии с их актуальностью с точки зрения скорости метаболизма и биологических свойств. Ряд методов пытается справиться с огромным количеством предсказанных метаболитов, ранжируя их предсказания в соответствии с различными подходами.

Другой вариант, который на сегодняшний день в основном реализован в коммерческих инструментах, заключается в использовании прогноза SoM в качестве предварительного шага для уменьшения количества генерируемых метаболитов. Коммерческие инструменты для прогнозирования метаболитов, которые включают прогнозирование SoM, включают ADMET Predictor (SimulationsPlus), который прогнозирует SoM и соответствующие структуры метаболитов для девяти изоформ CYP, и StarDrop (Optibrium; Tyzack et al., 2016), чей модуль «Метаболизм P450» прогнозирует SoMs с использованием квантово-механического моделирования и отображает структуры метаболитов, соответствующие прогнозируемым SoM.Кроме того, META Ultra (MultiCASE Inc .; Klopman et al., 1994) предсказывает SoMs и метаболиты, а MetaSite (Cruciani et al., 2005) был программным обеспечением для предсказания селективности SoM и изоформ CYP, которое теперь также предсказывает структуры метаболитов.

Немногие свободно доступные методы прогнозирования метаболитов сочетают информацию о прогнозируемых SoM с набором правил. MetaTox прогнозирует классы реакций и реагирующие атомы (то есть, в принципе, SoM) отдельно для каждой родительской молекулы, а затем объединяет прогнозы для генерации метаболитов.Вероятность образования метаболита рассчитывается на основе прогнозируемых вероятностей класса реакции и SoM, прогнозируемого с помощью метода SOMP (Rudik et al., 2015). Однако при валидации MetaTox эффективность предсказания класса реакции и предсказания реагирующего атома рассматривается отдельно, без оценки предсказания самих структур метаболита, и неясно, как именно предсказания класса реакции и реагирующего атома объединяются для генерации метаболита. структура (Рудик и др., 2017). С другой стороны, очевидно, что прогнозирование SoM используется непосредственно в качестве предварительного фильтра перед применением правил реакции в модуле SMARTCyp Toxtree. Однако валидация этого метода не была опубликована.

Что касается доступности наборов правил для предсказания структуры метаболитов, существует несколько существующих свободно доступных наборов правил реакций, описанных в легкодоступном, машиночитаемом формате, таком как SMIRKS, язык преобразования реакции в системе Daylight. Одним из источников правил реакции CYP является модуль SMARTCyp Toxtree, который использует 16 правил реакции и делает SMIRKS бесплатно доступными как часть исходного кода. Большой выбор правил реакции предоставляется в свободно доступном пакете SyGMA Python. Правила реакции четко разделены на правила фазы I и фазы II; однако нет никаких указаний на то, какие из 118 правил реакции фазы I конкретно описывают реакции, опосредованные CYP. Кроме того, эти правила были получены из закрытого и больше не распространяемого набора данных.BioTransformer предлагает большое количество правил биотрансформации, специфичных для CYP, в формате SMIRKS, а также дополнительные ограничения для каждого правила как часть своей базы знаний о реакции.

В этой работе мы представляем многосторонний подход к предсказанию метаболитов, образованных семейством ферментов CYP у людей. Применительно к FAME мы называем этот подход GLORY. Одним из фундаментальных аспектов GLORY является новая, легко интерпретируемая база правил для метаболизма CYP, которая была разработана исключительно на основе научной литературы и базовых знаний химии, не полагаясь на какой-либо набор данных о метаболических реакциях.Кроме того, мы исследовали эффект от использования прогноза SoM в качестве предварительного фильтра для позиций, в которых разрешено применять правила реакции, а также как часть нового подхода к ранжированию прогнозируемых метаболитов. Таким образом, GLORY имеет два режима: MaxCoverage, который ориентирован исключительно на отзыв, и MaxEfficiency, который больше ориентирован на точность. Кроме того, мы проверили GLORY на новом высококачественном, вручную подобранном наборе данных, который представлен в дополнительном материале.

Результаты и обсуждение

Два ключевых аспекта лежат в основе GLORY, целью которой является прогнозирование метаболитов в контексте человеческого метаболизма, опосредованного CYP: правила реакции и прогнозируемые SoM.Что касается аспекта, основанного на правилах, GLORY использует правила реакции для преобразования родительских молекул в их возможные метаболиты. С этой целью мы разработали набор правил, полностью основанный на научной литературе, чтобы гарантировать, что набор правил не зависит от какого-либо конкретного набора данных о метаболизме. Информация о CYP-опосредованных реакциях из литературы была объединена с базовыми знаниями химии для разработки SMIRKS для описания каждого типа реакции. В некоторых случаях, например, для О-деарилирования, для одного типа реакции требовалось несколько СМИРК, в результате чего для 61 типа реакции, присутствующего в нашей коллекции, было всего 73 СМИРКа (дополнительная таблица 1).Мы дополнительно используем простое бинарное различие между обычными и необычными типами реакций, которые подробно обсуждались и отличались друг от друга в Guengerich (2001), и это различие мы смогли экстраполировать на CYP-опосредованные реакции, обнаруженные в других местах литературы (см. Методы для подробностей). Мы не используем коэффициенты встречаемости, рассчитанные на основе заданного набора данных, для ранжирования прогнозируемых метаболитов из-за ограниченного размера, качества и доступности существующих наборов данных.Из нашей коллекции 61 типа реакции CYP 22 были определены как общие.

Вторым ключевым аспектом GLORY является использование вероятностей SoM, предсказываемых FAME 2 для каждого тяжелого атома в молекуле, чтобы (i) снизить частоту ложноположительных прогнозов при сохранении приемлемой скорости восстановления и (ii) повысить рейтинг предсказанные метаболиты. Чтобы снизить частоту ложноположительных прогнозов, была исследована возможность использования жесткого отсечения на основе вероятностей SoM.Это ограничение использовалось, чтобы определить, в каких положениях атома разрешалось применять правила. В контексте GLORY мы назвали этот подход, в котором прогнозирование SoM используется в качестве предварительного фильтра, режимом MaxEfficiency. Напротив, мы обозначаем подход, в котором вероятности SoM используются для ранжирования метаболитов, полученных для всех положений в молекуле, независимо от вероятности SoM, режимом MaxCoverage. Разница в рабочем процессе между двумя режимами показана на рисунке 1.

Рисунок 1 .Рабочий процесс для GLORY с указанием разницы между режимом MaxCoverage и режимом MaxEfficiency.

Наборы данных

Чтобы выбрать порог вероятности SoM для режима максимальной эффективности и разработать приоритетную оценку для ранжирования предсказанных метаболитов, был создан большой набор справочных данных путем объединения данных метаболизма CYP, извлеченных из DrugBank (Wishart et al., 2018) и MetXBioDB. MetXBioDB — это недавно опубликованная база данных метаболических реакций, субстраты которой в основном состоят из ксенобиотиков, а также включают несколько липидов стеролов и первичные метаболиты млекопитающих, а данные о реакциях взяты из научной литературы, а также из общедоступных баз данных (Djoumbou-Feunang et al. ., 2019). Кроме того, для проверки GLORY был составлен вручную подобранный высококачественный набор данных из научной литературы. Этот набор тестовых данных содержит 29 исходных молекул и в общей сложности 81 метаболит, что в среднем дает 2,79 метаболитов на родительскую молекулу. Важно отметить, что все родительские соединения, которые есть в наборе тестовых данных, были удалены из эталонного набора данных до проведения какого-либо анализа. В общей сложности базовый набор данных содержит 848 исходных молекул и 1588 метаболитов, в среднем 1.87 метаболитов на родительскую молекулу. Можно было сделать прогнозы для 847 из 848 молекул в наборе справочных данных (одна молекула не может быть успешно обработана с помощью FAME 2; подробности см. В разделе «Методы»).

Режим максимальной эффективности: выбор порогового значения для создания структуры метаболита на основе вероятности SoM

Чтобы определить влияние предварительного фильтра, основанного на прогнозировании SoM, на прогнозирование предпочтительно только наиболее релевантных метаболитов и уменьшение количества ложноположительных прогнозов, мы попробовали несколько различных пороговых значений для вероятности SoM, которая должна быть достигнута хотя бы одним задействованным атомом. в реакции (как определено СМИРКами реакции).Для каждого тяжелого атома в молекуле FAME 2 сообщает вероятность от 0 до 1, соответствующую доле деревьев классификатора дополнительных деревьев, которые предсказывают, что конкретный атом является SoM. Порог принятия решения в FAME 2 относительно того, считается ли атом достаточно вероятным для того, чтобы быть SoM, чтобы быть обозначенным как таковой, было определено обученной моделью как 0,4 (Šícho et al., 2017).

Мы исследовали влияние различных пороговых значений вероятности SoM, используя эталонный набор данных, и выбрали пороговое значение, которое будет использоваться в режиме максимальной эффективности, на основе этих результатов.В частности, мы изучили влияние ограничений вероятности SoM на точность и отзывчивость, которые определяются следующим образом:

Вызов = TP / (TP + FN) Точность = TP / (TP + FP)

, где TP — количество истинно положительных предсказаний, FP — количество (предполагаемых) ложноположительных предсказаний, а FN — количество ложно отрицательных предсказаний. Другими словами, функция отзыва измеряет долю известных метаболитов, которые были воспроизведены данным методом, а прецизионность измеряет долю всех прогнозируемых метаболитов, представленных в наборе данных.

Здесь стоит отметить, что количество ложных срабатываний и обозначение прогноза как ложного срабатывания особенно зависит от набора данных, который используется для сравнения. Многие метаболиты, которые образуются у людей, еще не открыты, или их структура еще не выяснена. Поскольку даже набор данных самого высокого качества ограничен доступными экспериментальными данными, реальность такова, что различие между реальным ложноположительным предсказанием и истинно положительным предсказанием еще неизвестного или несформированного метаболита может быть невозможно.Тем не менее, с этой оговоркой, мы оцениваем наш метод на основе имеющихся данных, включая предполагаемые ложные срабатывания.

Целью режима MaxEfficiency является использование порогового значения вероятности SoM для прогнозирования метаболитов с повышенной точностью по сравнению с отсутствием порогового значения (т. Е. В режиме MaxCoverage). В то же время, однако, мы не хотели слишком сильно жертвовать с точки зрения воспоминаний, поскольку по-прежнему важно предсказать фактические метаболиты молекулы, даже при уменьшении количества предполагаемых ложноположительных прогнозов.

Для целей прогнозирования метаболитов мы обнаружили, что использование порога принятия решения FAME 2, равного 0,4, в качестве порогового значения для вероятности SoM, привело к относительно низкому отзыву, равному 0,65 (особенно по сравнению с отзывом 0,83, достигнутым в режиме MaxCoverage, как будет обсуждаться ниже). позже в этой работе). Следовательно, несмотря на повышенную точность, обеспечиваемую пороговым значением 0,4, было определено, что это пороговое значение слишком сильно снижает достигнутый отзыв. Поэтому мы дополнительно протестировали более низкие пороги вероятности SoM (Таблица 1).Наблюдая за компромиссом между точностью и отзывом с порогами от 0,4 до 0,1 и сравнивая их с режимом MaxCoverage, мы определили, что вероятность отсечения SoM 0,2, что привело к точности 0,19 и все еще высокому отзыву 0,75. лучший компромисс. Таким образом, на основе результатов, показанных в этом разделе, было зафиксировано ограничение вероятности SoM, равное 0,2 для режима максимальной эффективности. Обратите внимание, что хотя все значения точности, показанные в таблице 1, довольно низкие, точность GLORY с использованием порога вероятности SoM сравнима с точностью существующих методов прогнозирования структуры метаболитов (см. Ниже результаты на наборе тестовых данных).

Таблица 1 . Влияние различных пороговых значений вероятности SoM на точность и отзывчивость для всего набора контрольных данных.

Разработка приоритетного балла для ранжирования прогнозируемых метаболитов для режима MaxCoverage

Чтобы ранжировать предсказанные метаболиты для конкретной молекулы, мы разработали рейтинг приоритета для каждого предсказанного метаболита на основе вероятности SoM атомов, участвующих в трансформации, и того, является ли тип реакции обычным или нет. В частности, учитывается вероятность SoM, рассчитанная FAME 2 для всех атомов в исходной молекуле, которые участвуют в реакции, как определено SMIRKS, и максимальная вероятность SoM среди этих атомов затем включается в оценку, как показано на рисунке 2. . Оценка приоритета рассчитывалась по простой формуле:

. прогнозируемый метаболит = P × F

, где P — максимальная вероятность SoM из атомов в исходной молекуле, которые были сопоставлены примененным преобразованием, а F — коэффициент в зависимости от того, был ли тип реакции обозначен как обычный или необычный.В случае, если один и тот же прогнозируемый метаболит получился в результате нескольких преобразований, использовалась оценка максимального приоритета по всем преобразованиям, приводящим к этому прогнозу. Оценка более высокого приоритета предназначена для указания более высокой вероятности того, что предсказание окажется верным. Для всех необычных типов реакций F = 1. Фактор F для общих типов реакций влияет на раннее обогащение прогнозов. В частности, раннее обогащение улучшается, когда обычным типам реакций придается больший вес в баллах, чем необычным типам реакций, т.е.е. F общий > 1 (рисунок 3). На основе анализа кривых рабочих характеристик приемника (ROC) и площади под кривыми ROC (AUC) для изменения F общего , показанного на рисунке 3, с коэффициентом 5, в результате чего AUC составляет 0,90, был выбран. Все последующие результаты, основанные на ранжировании предсказанных метаболитов, поэтому использовали F общий = 5 при вычислении оценки приоритета, и поэтому оценка приоритета может варьироваться от 0 до 5.

Рисунок 2 . Иллюстрация определения максимальной вероятности SoM для всех тяжелых атомов в исходной молекуле, которые соответствуют правилу реакции, на примере правила реакции N-деалкилирования (общий тип реакции; коэффициент F = 5). Эта максимальная вероятность используется для расчета рейтинга приоритета продукта.

Рисунок 3 . Кривые рабочих характеристик приемника (ROC) для всего эталонного набора данных из 848 соединений с 1588 известными метаболитами с различными значениями фактора, используемыми для общих типов реакций при вычислении оценки приоритета для каждого метаболита.Обратите внимание, что коэффициент 1 означает, что только вероятность SoM (то есть максимальная вероятность SoM для всех атомов, которые соответствуют SMIRKS) влияет на оценку приоритета предсказанного метаболита, независимо от типа реакции. Также обратите внимание, что кривую ROC можно рассчитать, несмотря на отсутствие «истинно отрицательных» прогнозов в целом (все предсказанные метаболиты являются «положительными» прогнозами). Чтобы построить кривую ROC, коэффициент ложных срабатываний (FPR) рассчитывается для каждого порогового значения. В каждой точке предсказания с оценками ниже порогового значения считаются «отрицательными» предсказаниями, а предсказания с оценками выше порогового значения считаются «положительными» предсказаниями.Следовательно, количество «истинно отрицательных» прогнозов и, следовательно, FPR можно рассчитать для каждой точки кривой ROC.

Сравнение производительности нового, вручную подобранного тестового набора

Эффективность режимов MaxEfficiency и MaxCoverage программы GLORY оценивалась на специально отобранном тестовом наборе из 29 исходных молекул, всего 81 метаболита. Эта оценка включает сравнение с BioTransformer и SyGMa, а также анализ того, насколько хорошо работают аспекты оценки и ранжирования различных подходов.В частности, мы использовали модуль CYP450 BioTransformer и реакции метаболизма фазы I SyGMa (SyGMa не имеет специального модуля для метаболизма CYP, но метаболизм фазы I в значительной степени осуществляется ферментами CYP) для сравнения.

Анализ режима максимальной эффективности
Режим максимальной эффективности

GLORY был разработан для решения проблемы низкой точности, вызванной большим количеством предполагаемых ложноположительных прогнозов метаболитов. Эта общая проблема избытка прогнозов хорошо задокументирована для инструментов прогнозирования метаболитов (Judson, 2014).Однако, как упоминалось выше, важно отметить, что определение прогнозов как ложноположительных особенно зависит от набора данных.

Как описано ранее, режим максимальной эффективности использует ограничение на основе вероятностей SoM, которые FAME 2 предсказывает для каждого тяжелого атома, чтобы ограничить места в молекуле, в которых разрешено применять правила реакции. Это пороговое значение вероятности SoM было установлено на 0,2 на основе анализа контрольного набора данных; тем не менее, мы также исследуем влияние различных пороговых значений вероятности SoM, используя набор высококачественных тестовых данных, чтобы получить более полную картину того, сколько можно получить с помощью подхода, основанного на отсечении.

Как и ожидалось, использование прогнозов SoM для ограничения применения правил реакции к определенным позициям действительно предполагает компромисс между точностью и отзывом (рис. 4). Отзыв измеряет долю известных метаболитов, которую метод смог воспроизвести, а прецизионный измеряет долю всех предсказанных метаболитов, которые на самом деле являются известными метаболитами (определения см. В предыдущем разделе). Чем больше вероятность SoM должна присутствовать среди атомов, участвующих в преобразовании, тем меньше отклик, но тем выше точность, измеренная по всему набору тестовых данных.Кроме того, чем больше предельное значение вероятности SoM, тем больше родительских молекул, для которых невозможно сделать прогнозы метаболитов. Без какого-либо такого ограничения и даже до порога вероятности SoM, равного 0,2, метаболиты можно предсказать для всех родительских молекул в наборе тестовых данных. Однако при пороговом значении вероятности SoM, равном 0,3, метаболиты для двух исходных молекул не прогнозируются, и это число увеличивается до трех для порогового значения 0,4 (дополнительная таблица 2). В этом случае количество затронутых молекул невелико, но составляет примерно 10% от размера тестового набора данных.В целом, по мере увеличения порогового значения общее количество прогнозируемых метаболитов резко снижается (дополнительная таблица 2).

Рисунок 4 . Точность (часть прогнозов, которые являются истинно положительными) и отзыв (часть прогнозируемых известных метаболитов) варьируются в зависимости от порогового значения для прогнозируемой вероятности SoM FAME 2. Отсечка вероятности SoM, равная 0,4, соответствует порогу принятия решения, используемому в FAME 2. Отсечка вероятности SoM, выбранная для режима максимальной эффективности GLORY, была равна 0.2.

К сожалению, как показано на рис. 4, при использовании пороговых значений вероятности 0,1 или больше при небольшом увеличении точности происходит значительное уменьшение отзыва. При более внимательном рассмотрении скоростей восстановления на одну родительскую молекулу, мы видим, что режим максимальной эффективности GLORY (с использованием выбранного порогового значения 0,2, как описано выше) может предсказать, по крайней мере, половину известных метаболитов для 72% родительских молекул в наборе тестовых данных, поскольку по сравнению с 83% для SyGMa и 79% для BioTransformer (рис. 5).Режим максимальной эффективности GLORY может предсказать все известные метаболиты для 41% исходных молекул в наборе тестовых данных, в отличие от 45% для SyGMa и 38% для BioTransformer. С другой стороны, количество предполагаемых ложноположительных результатов на родительскую молекулу находится в пределах того же диапазона, что и для SyGMa и BioTransformer (рис. 6). Используя режим MaxEfficiency, большинство родительских молекул имеют менее 10 предполагаемых ложных срабатываний, что также относится к BioTransformer, но не совсем к SyGMa (однако, как упоминалось выше, база правил SyGMa также включает правила для фазы I, не опосредованной CYP. реакции).

Рисунок 5 . Гистограммы скорости восстановления известных метаболитов с разбивкой по исходному соединению: (A) GLORY в режиме MaxCoverage, (B) GLORY в режиме MaxEfficiency, (C) SyGMa, (D) BioTransformer. Например, коэффициент восстановления 0,5 означает, что для x% всех исходных молекул была предсказана по крайней мере половина всех зарегистрированных метаболитов из набора тестовых данных.

Рисунок 6 . Гистограммы числа предполагаемых ложноположительных прогнозов: (A) GLORY в режиме MaxCoverage, (B) GLORY в режиме MaxEfficiency, (C) SyGMa, (D) BioTransformer.Эти гистограммы используют интервалы, закрытые вправо.

На основании этих результатов кажется, что использование прогнозируемых вероятностей SoM FAME 2 в качестве жесткого ограничения для прогнозирования метаболитов может оказаться недостаточным для многих случаев использования. Однако прогнозы SoM полезны не только для жесткого ограничения, а именно для ранжирования прогнозируемых метаболитов, как будет показано в следующем разделе.

Сравнение режима MaxCoverage с SyGMa и BioTransformer

Ни SyGMa, ни BioTransformer не используют прогноз региоселективности в качестве предварительного фильтра перед применением правил реакции.То же самое и в режиме MaxCoverage, который использует только прогнозирование SoM для оценки и ранжирования прогнозируемых метаболитов. Поэтому мы сравнили SyGMa и BioTransformer с режимом GLORY MaxCoverage с точки зрения запоминания, точности и способности ранжировать предсказанные метаболиты.

Высокая степень запоминания важна для любого варианта использования предсказателя структуры метаболитов, но тем более для приложений, в которых крайне важно не пропустить какие-либо физически существующие метаболиты, например, при попытке идентифицировать метаболиты на основе Данные МС.Режим GLORY MaxCoverage показывает хорошие результаты с точки зрения отзыва: отзыв составляет 0,83 по сравнению с 0,74 и 0,72 для SyGMa и BioTransformer, соответственно, по всему набору тестовых данных (Таблица 2). Более пристальный взгляд на отзыв с разбивкой на уровень скорости восстановления известных метаболитов для каждой родительской молекулы показывает, что GLORY может предсказать все известные метаболиты для 62% родительских молекул, тогда как SyGMa и BioTransformer достигают только 45% и 38%. , соответственно, в этом плане (рисунок 5). Количество родительских молекул, для которых GLORY может предсказать, по крайней мере, половину известных метаболитов, составляет 90%, по сравнению с 83% для SyGMa и 79% для BioTransformer (рис. 5).

Таблица 2 . Результаты оценки для режимов MaxCoverage и MaxEfficiency SyGMa, BioTransformer и GLORY на отобранном вручную наборе тестовых данных.

Точность может быть полезным показателем для измерения того, насколько хорошо метод может контролировать количество предполагаемых ложноположительных прогнозов. Точность предсказания метаболитов в наборе тестовых данных была низкой по всем направлениям, при этом BioTransformer достиг наивысшей точности из трех инструментов — 0,17. SyGMa была близка к отставанию с 0.15, а режим GLORY MaxCoverage еще больше отставал с точностью всего 0,08 (Таблица 2). Снова разбив это на более подробный обзор, мы видим, что BioTransformer и SyGMa всегда дают менее 25 предполагаемых ложных срабатываний на одну родительскую молекулу и, для большинства родительских молекул, менее 15 предполагаемых ложных срабатываний или даже, в случае BioTransformer менее 10 (рис. 6). С другой стороны, GLORY в режиме MaxCoverage часто дает столько прогнозов на одну родительскую молекулу, что в наборе тестовых данных имеется до 53 предполагаемых ложноположительных результатов на одну родительскую молекулу и в среднем относительно большое количество предполагаемых ложноположительных прогнозов по сравнению с другими. два инструмента (рисунок 6).

В случае низкой точности, наблюдаемой для SyGMa, важно отметить, что набор правил SyGMa не специфичен для CYP-опосредованного метаболизма, а скорее охватывает метаболизм фазы I в целом. Это может указывать на то, что SyGMa могла бы достичь более высокой точности, если бы использовались только правила, специфичные для CYP.

Модуль прогнозирования CYP450

BioTransformer, который имеет наивысшую точность из всех трех методов, использует прогнозирование изоформ в качестве предварительного фильтра. Только соответствующие реакции для предсказанной метаболизирующей изоформы (ов) CYP применяются к родительской молекуле, что может способствовать наблюдаемой точности.

Хотя точность режима MaxCoverage (а также SyGMa и BioTransformer) оказалась низкой, а высокий уровень ложноположительных прогнозов в целом проблематичен, в случае предсказателей структуры метаболитов низкая точность проблематична только в том случае, если нет способа различать истинно положительные и предполагаемые ложноположительные предсказанные метаболиты. Это различие может быть достигнуто с помощью хорошо работающего ранжирования прогнозируемых метаболитов, что позволяет избежать необходимости уменьшать общее количество прогнозируемых метаболитов.Следовательно, важно, чтобы инструмент прогнозирования метаболитов мог ранжировать прогнозируемые метаболиты с точки зрения вероятности появления.

GLORY оценивает свои предсказанные метаболиты частично на основе максимальной вероятности SoM всех атомов, участвующих в реакции, а также принимает во внимание тип реакции (см. Выше для более подробного описания оценки приоритета). SyGMa использует эмпирические оценки вероятности, рассчитанные на основе процента всех прогнозов для каждого правила реакции, найденных в наборе обучающих данных.Таким образом, система подсчета очков SyGMa полностью полагается на прекращенный набор данных Metabolite. Оценки, полученные с помощью GLORY или SyGMa, можно использовать для ранжирования прогнозируемых метаболитов для данного исходного соединения с точки зрения вероятности их появления. Текущая версия BioTransformer, с другой стороны, не оценивает и не ранжирует свои прогнозы.

Мы сравнили возможности ранжирования в режиме MaxCoverage в GLORY и в SyGMa. SyGMa смог предсказать известный метаболит в трех верхних ранжированных позициях для 69% родительских молекул в тестовом наборе данных, тогда как режим GLORY MaxCoverage предсказал известный метаболит в пределах трех верхних прогнозов для 76% родительских молекул (таблица 2). .

Чтобы посмотреть на общее качество оценки, а также ранжирование способности SyGMa по сравнению с GLORY, мы построили кривые ROC для каждого метода, используя оценку каждого предсказанного метаболита, а также ранг каждого предсказанного метаболита для данной молекулы. Ранговый анализ лучше соответствует реальному варианту использования, в котором желательно расставить приоритеты для прогнозируемых метаболитов для конкретной родительской молекулы, а не для всего набора данных [обратите внимание, что SyGMa первоначально оценивалась только с точки зрения ранжирования для каждого родителя молекула (Риддер, Вагенер, 2008)].Однако мы дополнительно использовали основанную на оценках кривую ROC для визуализации эффективности оценки приоритета GLORY по всему набору тестовых данных. Чтобы лучше сравнить кривые ROC, ложноотрицательные результаты были включены в кривые ROC и, таким образом, в рассчитанные AUC путем добавления этих молекул к набору точек данных и искусственного присвоения им балла 0 или ранга 1000, в зависимости от обстоятельств. с целью этой оценки.

Хотя значения AUC низкие, отчасти из-за включения ложноотрицательных точек данных в кривые ROC, кривые ROC показывают гораздо лучшее раннее обогащение для GLORY, чем для SyGMa (Рисунок 7).SyGMa не ставит известный метаболит в лучшую позицию для любой родительской молекулы в наборе тестовых данных (таблица 2), что отражено на кривой ROC. Это приличное раннее обогащение с помощью GLORY, которое подтверждается значением топ-3, является весьма обнадеживающим результатом, указывающим на то, что наиболее вероятные прогнозы ближе к верху ранжированного списка, чем предполагаемые ложноположительные прогнозы.

Рисунок 7 . Кривые ROC для всего набора тестовых данных сравнивают подходы оценки (A), и (B) SyGMa с режимом GLORY MaxCoverage.Для лучшего сравнения двух методов ложноотрицательные результаты были включены в кривую ROC путем присвоения этим точкам данных балла 0 или ранга 1000, в зависимости от обстоятельств.

Одно из возможных объяснений того, почему SyGMa плохо работает с точки зрения оценки, может заключаться в том, что его схема оценки была получена из соотношений встречаемости в базе данных Metabolite и поэтому оптимизирована для прогнозирования метаболитов в этом конкретном наборе данных. Хотя база данных Metabolite была большой, авторы SyGMa сообщают, что база данных, тем не менее, была смещена в сторону соединений с одним известным метаболитом, и постулируют, что многие профили метаболитов были неполными (Ridder and Wagener, 2008).Наш вручную подобранный набор тестовых данных состоит из родительских молекул с метаболитами, которые были опубликованы с 2014 года, в то время как SyGMa была разработана с использованием версии Metabolite 2001 года, поэтому мы предполагаем, что перекрытие, если оно есть, между набором обучающих данных SyGMa и нашим тестовым набором данных невелико. Без доступа к набору данных, который использовался для разработки методологии оценки SyGMa, остается неясным, насколько хорошо типы реакций, которые приводят к метаболитам в тестовом наборе данных, были представлены в их наборе обучающих данных.В связи с этим, дополнительным недостатком подхода SyGMa, основывающего свой подход к оценке на базе данных метаболических реакций, является то, что, поскольку правила реакции могут быть включены только в том случае, если база данных содержит достаточно примеров определенного типа реакции для расчета оценки вероятности, что более необычно. типы реакций или типы реакций, которые по какой-то причине недостаточно хорошо представлены в базе данных, могут отсутствовать в базе правил SyGMa (Ridder and Wagener, 2008).

Есть несколько других различий в методологии между GLORY и SyGMa, которые могут способствовать разнице в производительности.Во-первых, SyGMa не предсказывает конкретно CYP-опосредованный метаболизм, а скорее метаболизм фазы I в целом, что означает, что он может предсказывать другие метаболиты фазы I, которые просто не присутствуют в тестовом наборе данных, потому что они не образуются CYP. Во-вторых, в текущей реализации пакета Python, который использовался для этой проверки, SyGMa, похоже, не требует, чтобы его предсказанные метаболиты имели определенный минимальный размер. В отличие от GLORY, который не выводит потенциальный метаболит, если в нем меньше трех тяжелых атомов, SyGMa предсказывает несколько метаболитов (по всему набору тестовых данных) только с одним или двумя тяжелыми атомами.

Время вычисления

Время работы GLORY было измерено на рабочей станции, оснащенной восемью процессорами Intel (R) Core (TM) i7-4790, 32 ГБ оперативной памяти и операционной системой Linux. Для тестового набора данных общее время выполнения (с использованием восьми ядер) составило 4,6 мин в режиме MaxCoverage и 4,3 мин в режиме MaxEfficiency (усредненное по трем прогонам). В среднем время вычисления на молекулу, необходимое для прогнозирования метаболитов, составляло 10,9 с для режима MaxCoverage и 10,3 с для режима MaxEfficiency (усредненное по трем прогонам).

Методы

Разработка сборника преобразований

Набор преобразований, определенных СМИРКС и представляющих типы реакций, был собран на основе известных CYP-опосредованных реакций, обнаруженных в литературе (подробности см. В дополнительных материалах). SMIRKS были определены как максимально общие, но ограниченные разумной химией реакции, как указано в литературе и общепринятыми химическими знаниями. Следовательно, если реакция была обнаружена в литературе, но было неясно, как эта реакция применима к другим молекулам, помимо предоставленного примера, реакция исключалась из коллекции.Так было для большинства реакций с участием больших кольцевых систем, а также слияния колец и сжатия колец. В частности, из нашей коллекции были исключены следующие типы реакций: реакции, которые оказались одноэлементными, реакции с участием более чем двух конденсированных колец, не являющихся частью основной цепи стероида, слияния колец, сжатия колец, реакции, в которых субстрат или продукт представляет собой радикал, и реакции, конкретно указанные, были обнаружены только в случае изоферментов CYP растений.

Некоторые СМИРКИ, используемые для описания преобразований, были взяты из модуля Toxtree SMARTCyp. Однако большинство СМИРКОВ были недавно разработаны специально для GLORY. При разработке выражений СМИРКС было уделено внимание включению как можно меньшего количества атомов в явное отображение, поскольку вероятности SoM учитывались для всех атомов в отображении.

Каждый тип реакции был обозначен как «обычный» или «необычный». По возможности этот ярлык присваивался в соответствии с классификацией реакций, приведенной Генгерихом в его обзоре реакций, опосредованных CYP (2001 г.) (Guengerich, 2001), который четко разделил реакции на эти две категории.Если тип реакции не был описан в этой публикации, был выбран ярлык «общий» или «необычный» на основе экстраполяции (на основе эмпирического сходства с типами реакций, представленными в публикации).

Наша коллекция правил реакции CYP состоит из 61 типа реакции. В некоторых случаях для описания одного и того же типа реакции требовалось несколько преобразований, что приводило в общей сложности к 73 преобразованиям в наборе определенных реакций. Полный список типов реакций и их СМИРК можно найти в дополнительной таблице 1.

Программа прогнозирования метаболитов

Прогнозирование структуры метаболитов включает применение правил реакции во всех соответствующих положениях. Соответствующие позиции определяются самим правилом реакции и, в случае режима максимальной эффективности, вероятностью SoM, предсказанной для каждого тяжелого атома. В режиме MaxCoverage вероятности SoM также используются для оценки предсказанных метаболитов.

Прогнозирование SoM с FAME 2

Прогнозы SoM были выполнены с использованием программного обеспечения FAME 2 (Šícho et al., 2017), который включал предварительную обработку молекул. Обученная модель circCDK_ATF_6, которая показала лучшую среднюю производительность во время независимой проверки набора тестов в Šícho et al. (2017), использовался для прогнозирования SoM в GLORY.

Применение преобразований

Превращения родительских молекул в предсказанные метаболиты на основе определенных строк SMIRKS были выполнены с использованием Ambit-SMIRKS [Kochev et al., 2018; Библиотека Java Ambit-SMARTS, версия 3.1.0. http: // ambit.sourceforge.net/smirks.html (по состоянию на 4 октября 2017 г.)]. Некоторые преобразования могут привести к созданию нескольких продуктов. Продукты, содержащие менее трех тяжелых атомов, не входят в набор прогнозируемых метаболитов, генерируемых GLORY.

Когда прогнозирование SoM используется в качестве предварительного фильтра, правило преобразования применяется только в определенном месте в родительской молекуле, если один из задействованных тяжелых атомов прогнозируется как SoM с вероятностью, превышающей определенный порог (подробнее см. информацию об этом пороге).

Оценка предсказанных метаболитов

Оценка предсказанных метаболитов была основана на предсказаниях вероятности SoM и на том, был ли тип реакции определен как обычный или необычный. Каждому атому в родительской молекуле была присвоена вероятность того, что он является SoM от FAME 2. При применении преобразований, определенных SMIRKS, Ambit-SMIRKS сопоставляет часть реагента определенного преобразования с любым подходящим набором атомов в родительской молекуле. В рамках этого сопоставления была рассчитана максимальная вероятность SoM и использована для оценки прогнозируемого метаболита, полученного в результате этого конкретного преобразования и сопоставления.

Для каждого прогнозируемого метаболита оценка приоритета рассчитывается путем умножения максимальной вероятности SoM в отображении на коэффициент F в зависимости от того, был ли тип реакции классифицирован как «обычный» или «необычный». Таким образом, оценки приоритета для прогнозируемых метаболитов находятся в диапазоне от 0 до F обычных . Чем выше оценка, тем более вероятным считается предсказанный метаболит. Дополнительные сведения о выборе значений для F см. В разделе «Результаты».

Если несколько преобразований данной исходной молекулы приводят к одной и той же структуре метаболита, оценка приоритета рассчитывается отдельно в каждом случае, и сохраняется наивысшая оценка. Чтобы вычислить максимальные значения k и кривые ROC на основе ранжирования, необходимо было ранжировать предсказанные метаболиты для каждой исходной молекулы на основе их оценок приоритета. Если разные метаболиты одного и того же исходного соединения имеют одинаковую оценку приоритета, то они получают одинаковый рейтинг. В случае ничьей пропускаются одно или несколько номеров рангов в соответствии с количеством связанных прогнозов, следующих за равным рангом.Например, если наивысший балл составляет 2,5 и оба прогнозируемых метаболита имеют этот балл, то обоим из этих метаболитов присваивается ранг 1, ни одному из прогнозируемых метаболитов не присваивается ранг 2, а прогнозируемым (ым) метаболитам (ам) присваивается следующий балл наивысшему баллу присваивается рейтинг 3.

Программный вывод

Прогнозируемые метаболиты предоставляются в виде файла SD со следующей информацией для каждого прогнозируемого метаболита: ранг (из всех прогнозируемых метаболитов для конкретной родительской молекулы), оценка приоритета, название реакции, а также InChI, SMILES и идентификатор родительского молекула.Если несколько преобразований привели к одному и тому же продукту, сообщается оценка наивысшего приоритета и соответствующее название реакции. Если входные данные состоят из нескольких молекул, идентификатор родительской молекулы устанавливается в соответствии с положением молекулы в упорядоченном списке входных молекул (т. Е. Ее положением во входном файле).

Создание эталонного набора данных

Контрольный набор данных был создан путем объединения данных метаболизма CYP из DrugBank и MetXBioDB. Общий размер объединенного набора справочных данных, не включая информацию о метаболизме для любой из родительских молекул, содержащихся в вручную подобранном наборе тестовых данных, составляет 848 родительских молекул и 1588 метаболитов (в среднем 1.87 метаболитов на родительскую молекулу).

Набор данных DrugBank

База данных DrugBank (DrugBank, версия 5.1.2. Https://www.drugbank.ca/ [доступ 14 января 2019 г.]) была загружена с веб-сайта. Помимо базы данных в формате XML, структуры всех молекул, как родительских, так и метаболитов, были загружены в формате SD с веб-сайта (группа препаратов «Все» для родительских молекул).

Любая исходная молекула или молекула метаболита без доступной структуры игнорировалась.Одно исходное соединение (ID банка DrugBank: DB09327) было проигнорировано, поскольку его SMILES содержал два компонента, из которых нельзя было однозначно идентифицировать основной компонент. Учитывались все доступные поколения реакций метаболизма при условии, что реакция была аннотирована как опосредованная одним или несколькими изоферментами CYP. Ферменты для реакций, перечисленные в DrugBank, не имеют какой-либо очевидной информации о видах, поэтому все они были предположительно человеческими и, следовательно, значимыми для этого набора данных.

Для всех реакций, опосредованных CYP, реагент считался родительской молекулой, а продукт считался метаболитом первого поколения этой конкретной родительской молекулы.Любой метаболит с тем же InChI, игнорируя информацию о стереохимии, поскольку его родительская молекула была удалена из набора метаболитов для этой родительской молекулы. В окончательный набор данных были включены только те родительские молекулы, которые содержат хотя бы один действующий метаболит.

Наконец, шесть родительских молекул, которые также присутствуют в вручную подобранном наборе тестовых данных, были удалены из набора данных DrugBank перед любой оценкой вместе с соответствующей информацией о метаболизме. Этими исходными соединениями были бупропион, тиклопидин, имипрамин, ифосфамид, бозентан и оланзапин.

После предварительной обработки, включая удаление пересечения с вручную подобранным набором тестовых данных, набор данных DrugBank содержал в общей сложности 364 родительских молекулы и 702 метаболита, в среднем 1,93 метаболита на родительскую молекулу в наборе данных.

Набор данных MetXBioDB

CYP-опосредованные реакции человека были извлечены из набора данных MetXBioDB (MetXBioDB, версия 1.0. Https://bitbucket.org/djoumbou/biotransformerjar/src/master/database/ [доступ 11 января 2019 г.]).Поскольку единственная структурная информация, представленная в MetXBioDB, представлена ​​в форме InChI и InChIKeys, любой субстрат или продукт без указанного InChI не может рассматриваться. Отсутствие InChI характерно только для одной из 1468 CYP-опосредованных реакций человека в MetXBioDB.

Информация о стереохимии была удалена путем создания InChI без слоя стереохимии, что в итоге привело к 751 CYP, исходным соединениям человека. Из них 259 также присутствуют в наборе данных DrugBank. Для этих перекрывающихся родительских соединений 512 из 569 метаболитов DrugBank также находятся в MetXBioDB, а MetXBioDB имеет еще 93 метаболита для этих перекрывающихся родительских соединений.

Восемь исходных соединений (оланзапин, бупропион, метоклопрамид, бозентан, имипрамин, тиклопидин, ифосфамид и атомоксетин) из вручную подобранного набора тестовых данных также присутствовали в наборе данных MetXBioDB, только два из которых (метоклопрамид и атомоксетин) также присутствовали в набор данных DrugBank. Эти исходные соединения и соответствующие данные метаболизма были удалены из набора данных MetXBioDB.

После предварительной обработки, включая удаление пересечения с вручную подобранным набором тестовых данных, набор данных MetXBioDB содержал в общей сложности 743 родительских молекулы и 1385 метаболитов, в среднем 1.86 метаболитов на родительскую молекулу в наборе данных.

Слияние наборов данных DrugBank и MetXBioDB

Набор данных DrugBank и набор данных MetXBioDB были объединены в базовый набор данных путем прямого объединения информации о родителях и метаболитах. Все сравнения молекул проводились с использованием InChI, созданных без информации о стереохимии. Для любой родительской молекулы, которая присутствовала как в наборах данных DrugBank, так и в MetXBioDB, что имело место для 259 родительских молекул, наборы метаболитов из обоих наборов данных были объединены без учета стереохимии, чтобы получить окончательный набор метаболитов для этой родительской молекулы в эталонный набор данных.

Создание настраиваемого вручную набора тестовых данных

Новый набор данных для тестирования GLORY был вручную собран из научной литературы. Данные были взяты из публикаций по метаболизму, которые были найдены в двух журналах: Xenobiotica и Drug Metabolism and Disposition . Рассматриваемые временные рамки: с января 2014 г. по июнь 2018 г. для Xenobiotica и с января 2014 г. по июнь 2017 г. для «Метаболизм и утилизация лекарств» .

Было выбрано

публикаций, и содержащаяся в них информация о метаболизме была включена в набор данных, если выполнялись следующие критерии:

1. Публикация должна содержать рисунок, изображающий схему метаболизма и включающий химические структуры исходного соединения и метаболитов первого поколения.

2. Данные о метаболизме должны быть экспериментально определены на человеческом источнике (например, человек, человеческие клетки или рекомбинантные человеческие ферменты CYP).Если некоторые, но не все данные были получены от людей, любые нечеловеческие метаболиты в схеме метаболизма были исключены из набора данных.

3. По крайней мере, для 75% всех человеческих метаболитов первого поколения, представленных в схеме метаболизма (обратите внимание, что любой метаболит, который изображен как просто промежуточный продукт, не рассматривается), должны выполняться следующие два критерия. Во-первых, необходимо знать тип фермента (ов), ответственного за образование метаболита. Для этого достаточно знать, образуется ли этот метаболит CYP.Во-вторых, должна быть известна точная химическая структура метаболита, включая взаимосвязь всех атомов. Есть одно исключение из этого правила: если известно, что метаболит не образует CYP, то точная структура не имеет значения, и метаболит все равно считается.

На основании этих критериев были найдены и включены в набор данных 29 схем метаболизма, содержащих по крайней мере один человеческий CYP-образованный метаболит первого поколения с полностью определенной структурой. Для этих 29 родительских молекул в общей сложности имеется 81 метаболит, которые соответствуют критериям (первое поколение, человеческий, CYP, полностью определенная структура) для включения в набор данных.Обратите внимание, что в набор данных включены только метаболиты первого поколения. Также обратите внимание, что промежуточные продукты, как показано на схеме метаболизма, не включены в набор данных. Вместо этого используется первый метаболит, не являющийся промежуточным звеном пути.

УЛЫБКИ для метаболитов были получены с использованием ChemSpider (ChemSpider. Http://www.chemspider.com/ [доступ 13 февраля 2019 г.]). Согласованность стереохимической информации между родителями и их метаболитами сохранялась.

Проверка предсказателей структуры метаболита

Прогнозируемые метаболиты сравнивались с известными метаболитами из эталонных и тестовых наборов данных с использованием их InChI.InChI, используемые для этого сравнения, были созданы без информации о стереохимии с использованием CDK (Willighagen et al., 2017; Chemistry Development Kit, версия 2.0. Https://cdk.github.io/ [доступ 3 ноября 2017 г.]).

Во время валидации предсказанный метаболит альдегида считался эквивалентным соответствующей карбоновой кислоте, потому что есть свидетельства того, что некоторый процент метаболита альдегида действует как промежуточное соединение, которое далее окисляется до карбоновой кислоты, не покидая активного центра фермента CYP (Bell -Парих и Генгерих, 1999).

В случае одной родительской молекулы в наборе справочных данных невозможно сделать никаких прогнозов, поскольку родительская молекула содержит бор. FAME 2 не может делать прогнозы для молекул, содержащих бор, потому что борсодержащие молекулы не присутствовали в наборе данных, используемом для обучения модели.

Прогнозы SyGMa выполнялись на Python с использованием пакета SyGMa Python (SyGMa, версия 1.1.0) и RDKit (RDKit: Open-Source Cheminformatics, версия 2017_03_01, 2017). Использовали только набор правил реакции фазы I и применяли один цикл реакции.

Прогнозы BioTransformer были выполнены с использованием режима CYP450 программы BioTransformer (BioTransformer, версия 1.0.8. Https://bitbucket.org/djoumbou/biotransformerjar/src/master/ [по состоянию на 5 февраля 2019 г.]). BioTransformer запускался индивидуально для каждого исходного соединения с использованием одного ввода SMILES.

Кривые ROC были построены с использованием пакета ROCR R (Sing et al., 2005; ROCR, версия 1.0-7, 2015). Когда к кривой добавлялись ложноотрицательные точки данных, этим точкам данных присваивался балл 0 или ранг 1000, соответственно, в зависимости от того, представляла ли кривая ROC баллы или ранги.

Выводы

Мы разработали GLORY, новый инструмент для прогнозирования структур человеческих метаболитов, образованных CYP. GLORY включает в себя две ключевые идеи: основанный на литературе сборник правил CYP-опосредованных реакций и предсказание SoM, которое особенно успешно использовалось для разработки нового подхода к оценке предсказанных метаболитов.

Для GLORY мы разработали новую коллекцию из 73 правил реакции, описывающих 61 тип реакции для CYP-опосредованного метаболизма. При разработке этой коллекции мы уделяли приоритетное внимание воспроизводимости нашего набора правил и поэтому основывали правила на научной литературе, а не на каком-либо наборе данных.Помимо самих правил, каждый тип реакции был обозначен как обычный или необычный, опять же на основании научной литературы, а не набора данных.

Кроме того, мы разработали оценку приоритета для прогнозируемых метаболитов на основе прогнозируемых вероятностей SoM и простого литературного различия между обычными и необычными типами реакций. Следовательно, ни наш набор правил, ни наш подход к оценке не основаны непосредственно на каком-либо наборе данных о метаболических реакциях, что отличает наш подход от других инструментов, например SyGMa, который использует правила реакции и коэффициенты встречаемости, полученные из собственного набора данных, и BioTransformer, правила которого были в некоторой степени на основе свободно доступного набора данных.

GLORY имеет два режима: MaxEfficiency, который использует прогнозирование SoM в качестве предварительного фильтра для позиций в молекуле, в которых разрешены реакции, и MaxCoverage, который не использует предварительный фильтр, а вместо этого фокусируется на высоком уровне отзыва и точном ранжировании предсказанные метаболиты. Использование прогноза SoM в качестве предварительного фильтра, то есть в режиме максимальной эффективности, не работает так хорошо, как можно было бы ожидать, с точки зрения уменьшения количества предполагаемых ложноположительных прогнозов при сохранении высокой скорости восстановления сообщаемых метаболитов.Однако, разрабатывая оценку приоритета для прогнозируемых метаболитов с использованием прогноза SoM в сочетании с простым двоичным различием между обычными и необычными типами реакций, мы можем ранжировать метаболиты, прогнозируемые в режиме MaxCoverage, в той степени, в которой GLORY может предсказать хотя бы один известный метаболит. в трех лучших ранжированных позициях для 76% молекул в независимом тестовом наборе при достижении отзыва 0,83. Режим GLORY MaxCoverage превосходит SyGMa и BioTransformer с точки зрения отзыва и превосходит SyGMa с точки зрения ранжирования (BioTransformer в настоящее время не оценивает свои прогнозы метаболитов).Одним из вариантов использования режима MaxCoverage может быть, например, идентификация метаболитов по данным масс-спектрометрии.

Наряду с набором правил реакции, мы предоставляем новый, вручную подобранный набор тестовых данных для бесплатного использования в качестве набора данных для тестов. Кроме того, GLORY находится в свободном доступе в качестве веб-сервера по адресу https://acm.zbh.uni-hamburg.de/glory/.

Важно отметить, что концепция GLORY такова, что ее можно расширить для прогнозирования метаболитов, образованных ферментами, не принадлежащими к семейству CYP.Ферменты, на которые можно распространить этот подход, в принципе ограничены только объемом доступных данных и охватом соответствующих метаболических реакций инструментами прогнозирования SoM.

Доступность данных

В данном исследовании были проанализированы общедоступные наборы данных. Эти данные можно найти здесь: https://bitbucket.org/djoumbou/biotransformerjar/ и https://www.drugbank.ca/.

Примечание автора

Веб-сервис GLORY доступен по следующему адресу: https: // acm.zbh.uni-hamburg.de/glory/.

Авторские взносы

CdBK и JK: концептуализация; CdBK, CS и JK: методология; CdBK, CS, MŠ, NK и NJ: разработка программного обеспечения; CdBK: проверка; JK и DS: ресурсы; CdBK: курирование данных; все авторы: написание — подготовка оригинального проекта; CdBK: визуализация; DS, NJ и JK: наблюдение; JK: управление проектом; DS и JK: привлечение финансирования.

Финансирование

CS и JK поддерживаются Deutsche Forschungsgemeinschaft (DFG, Немецкий исследовательский фонд) — проект номер KI 2085 / 1-1.DFG — это немецкая организация, финансирующая исследования, поддерживающая научные, инженерные и гуманитарные исследования. JK также поддерживается Бергенским исследовательским фондом (BFS) [BFS2017TMT01]. BFS предоставляет гранты на исследования и поддержку исследовательской деятельности в Университете Бергена (UiB) и Университетской больнице Хаукеланда (HUS), а также в других норвежских исследовательских учреждениях, которые сотрудничают с учреждениями в Бергене. Фонд также предоставляет гранты для поддержки исследований в UiB и HUS на стыке фундаментальных и клинических исследований.MŠ и DS поддерживаются Министерством образования, молодежи и спорта (MEYS) — номера проектов MSMT № 20-SVV / 2017, LM2015063 и RVO: 68378050-KAV-NPUI. MEYS отвечает за государственное управление в сфере образования, за разработку политики в области образования, молодежи и спорта, а также за международное сотрудничество в этих областях. Это также центральный административный офис, отвечающий за исследования и разработки, и один из основных государственных органов по координации и финансированию исследований в Чешской Республике.

Заявление о конфликте интересов

NJ является основателем и совладельцем Ideaconsult Ltd.и является техническим менеджером компании с 2009 года. Н.К. работает в Ideaconsult Ltd. по совместительству.

Остальные авторы заявляют, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могли бы быть истолкованы как потенциальный конфликт интересов.

Благодарности

Мы благодарим Крейга Нокса, Майкла Уилсона и Дэвида Вишарта из Университета Альберты, AB, Канада, и OMx Personal Health Analytics Inc., AB, Канада за отправку нам структур метаболитов в базе данных DrugBank до их бесплатного размещения. доступно онлайн.

Дополнительные материалы

Дополнительные материалы к этой статье можно найти в Интернете по адресу: https://www.frontiersin.org/articles/10.3389/fchem.2019.00402/full#supplementary-material

Дополнительные таблицы. Правила реакции и дополнительные результаты оценки (DOCX).

Дополнительная таблица данных 1. Набор тестовых данных, содержащий SMILES для исходных молекул и метаболитов, а также ссылки на публикации (CSV).

Дополнительный лист данных 2. Контрольный набор данных, содержащий SMILES (с информацией о стереохимии), InChI (без информации о стереохимии), а также идентификаторы DrugBank и MetXBioDB для родительских молекул и метаболитов (JSON).

Сокращения

AUC — площадь под кривой рабочей характеристики приемника; CYP, цитохром P450; ROC, рабочая характеристика приемника; SoM, место метаболизма.

Сноски

Список литературы

Белл-Парих, Л. К., и Генгерих, Ф.П. (1999). Кинетика катализируемого цитохромом P450 2E1 окисления этанола до уксусной кислоты через ацетальдегид. J. Biol. Chem. 274, 23833–23840. DOI: 10.1074 / jbc.274.34.23833

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Cruciani, G., Carosati, E., De Boeck, B., Ethirajulu, K., Mackie, C., Howe, T., et al. (2005). MetaSite: понимание метаболизма в цитохромах человека с точки зрения химика. J. Med. Chem. 48, 6970–6979. DOI: 10.1021 / jm050529c

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Дарвас, Ф. (1987). «Metabolexpert: экспертная система для прогнозирования метаболизма веществ», в QSAR in Environmental Toxicology — II , ed K. L.E. Kaiser, (Dordrecht: Springer), 71–81.

Google Scholar

Джумбу-Феунанг, Ю., Фьямончини, Дж., Хиль-де-ла-Фуэнте, А., Грейнер, Р., Манах, К., и Вишарт, Д. С. (2019). BioTransformer: комплексный вычислительный инструмент для прогнозирования метаболизма малых молекул и идентификации метаболитов. J. Cheminform. 11: 2. DOI: 10.1186 / s13321-018-0324-5

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Джадсон, П. Н. (2014). «Основанные на знаниях подходы для прогнозирования участков и продуктов метаболизма», в Drug Metabolism Prediction , ed J. Kirchmair, Methods and Principles in Medicinal Chemistry (Weinheim: Wiley-VCH), 293–318.

Google Scholar

Кирхмайр, Дж., Геллер, А. Х., Ланг, Д., Кунце, Дж., Теста, Б., и Уилсон, И. Д. (2015). Прогнозирование метаболизма лекарств: эксперимент и / или расчет? Nat. Rev. Drug Disc. 14, 387–404. DOI: 10.1038 / nrd4581

CrossRef Полный текст | Google Scholar

Кирчмайр, Дж., Уильямсон, М. Дж., Тайзак, Дж. Д., Тан, Л., Бонд, П. Дж., Бендер, А. и др. (2012). Вычислительное прогнозирование метаболизма: сайты, продукты, динамика и механизмы фермента S.A.R., P450. J. Chem. Сообщить. Модель. 52, 617–48. DOI: 10.1021 / ci200542m

CrossRef Полный текст | Google Scholar

Клопман, Г., Димаюга, М., и Талафус, Дж. (1994). МЕТА. 1. Программа для оценки метаболического преобразования химических веществ. J. Chem. Сообщить. Комп. Sci. 34, 1320–1325.

PubMed Аннотация | Google Scholar

Кочев, Н., Аврамова, С., Желязкова, Н. (2018). Амбит-СМИРКС: программный модуль для представления реакций, поиска реакций и преобразования структур. J. Cheminform. 10:42. DOI: 10.1186 / s13321-018-0295-6

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Марчант, К.А., Бриггс, К. А., Лонг, А. (2008). In silico инструменты для обмена данными и знаниями о токсичности и метаболизме: Derek для Windows, Meteor и Vitic. Toxicol. Механизмы Методы . 18, 177–187. DOI: 10.1080 / 15376510701857320

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Мекенян, О. Г., Димитров, С. Д., Павлов, Т. С., Вейт, Г. Д. (2004). Системный подход к моделированию метаболизма в вычислительной токсикологии. I. Среда эвристического моделирования TIMES. Curr. Фармацевтический дизайн . 10, 1273–1293. DOI: 10.2174 / 1381612043452596

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Олсен, Л., Монтефиори, М., Тран, К. П. и Йоргенсен, Ф. С. (2019). SMARTCyp 3.0: усовершенствованный сервер прогнозирования места метаболизма цитохрома P450. Биоинформатика . DOI: 10.1093 / биоинформатика / btz037. [Epub перед печатью].

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Патлевич, Г., Jeliazkova, N., Safford, R.J, Worth, A.P, and Alexiev, B. (2008). Оценка реализации схемы классификации Крамера в программном обеспечении Toxtree. SAR QSAR Environ. Res. 19, 495–524. DOI: 10.1080 / 10629360802083871

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Риддер Л. и Вагенер М. (2008). SyGMa: сочетание экспертных знаний и эмпирической оценки в прогнозировании метаболитов. Chem. Med. Chem . 3, 821–832.DOI: 10.1002 / cmdc.200700312

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Рудик А., Дмитриев А., Лагунин А., Филимонов Д., Поройков В. (2015). SOMP: веб-сервер для in silico прогнозирования участков метаболизма для соединений, подобных лекарственным средствам. Биоинформатика 31, 2046–2048. DOI: 10.1093 / биоинформатика / btv087

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Рудик А.В., Беженцев В.М., Дмитриев А.В., Дружиловский Д.С., Лагунин А.А., Филимонов Д.А. и др. (2017). MetaTox: веб-приложение для прогнозирования структуры и токсичности метаболитов ксенобиотиков. J. Chem. Сообщить. Модель. 57, 638–642. DOI: 10.1021 / acs.jcim.6b00662

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Ридберг, П., Глориам, Д. Э., Зарецки, Дж., Бренеман, К., и Олсен, Л. (2010). SMARTCyp: 2D-метод прогнозирования метаболизма лекарств, опосредованного цитохромом p450. ACS Med.Chem. Lett. 1, 96–100. DOI: 10,1021 / мл100016x

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Шихо, М., де Брюн Копс, К., Сторк, К., Свозил, Д., и Кирчмайр, Дж. (2017). FAME 2: простая и эффективная модель машинного обучения региоселективности цитохрома P450. J. Chem. Сообщить. Модель. 57, 1832–1846. DOI: 10.1021 / acs.jcim.7b00250

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Testa, B., Pedretti, A., and Vistoli, G.(2012). Реакции и ферменты метаболизма лекарств и других ксенобиотиков. Диск с наркотиками. Сегодня 17, 549–560. DOI: 10.1016 / j.drudis.2012.01.017

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Тиан С., Джумбу-Фунанг Ю., Грейнер Р. и Вишарт Д. С. (2018). CypReact: программный инструмент для прогнозирования реагентов in silico для ферментов цитохрома P450 человека. J. Chem. Сообщить. Модель. 58, 1282–1291. DOI: 10.1021 / acs.jcim.8b00035

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Тайзак, Дж.Д., Хант П. А., Сегалл М. Д. (2016). Прогнозирование региоселективности и лабильности метаболизма цитохрома p450 с использованием квантово-механического моделирования. J. Chem. Сообщить. Модель. 56, 2180–2193. DOI: 10.1021 / acs.jcim.6b00233

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Тайзак, Дж. Д., и Кирчмайр, Дж. (2018). Вычислительные методы и инструменты для прогнозирования метаболизма цитохрома P450 для открытия лекарств. Chem. Биол. Дизайн лекарств 93, 377–386.DOI: 10.1111 / cbdd.13445

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Willighagen, E. L., Mayfield, J. W., Alvarsson, J., Berg, A., Carlsson, L., Jeliazkova, N., et al. (2017). The Chemistry Development Kit (CDK) v2.0: типирование атомов, описание, молекулярные формулы и поиск субструктур. J. Cheminform. 9:33. DOI: 10.1186 / s13321-017-0220-4

CrossRef Полный текст | Google Scholar

Wishart, D. S., Feunang, Y. D., Guo, A.К., Ло, Э. Дж., Марку, А., Грант, Дж. Р. и др. (2018). DrugBank 5.0: крупное обновление базы данных DrugBank за 2018 год. Nucleic Acids Res. 46, D1074 – D1082. DOI: 10.1093 / nar / gkx1037

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Зарецки Дж., Мэтлок М. и Свамидасс С. Дж. (2013). XenoSite: точное прогнозирование CYP-опосредованных участков метаболизма с помощью нейронных сетей. J. Chem. Сообщить. Модель. 53, 3373–3383. DOI: 10.1021 / ci400518g

PubMed Аннотация | CrossRef Полный текст | Google Scholar

веб-компонентов ChemDoodle | Демонстрации> IUPAC Naming

ChemDoodle ® Конкурент № 1 Конкурент № 2
Бис (2-нафтил) метан динафталин-2-илметан 2- (нафталин-2-илметил) нафталин
2 (10), 3-пинадиен 6,6-диметил-4-метиленбицикло [3.1.1] гепт-2-ен 6,6-диметил-4-метилиденбицикло [3.1.1] гепт-2-ен
2,4-дигидро-1,3-бензодитиин 4H-бензо [d] [1,3] дитиин 2,4-дигидро-1,3-бензодитиин
3,6,8-Триоксабицикло [3.2.2] нонан 3,6,8-триоксабицикло [3.2.2] нонан 3,6,8-триоксабицикло [3.2.2] нонан
2,3-ксиленол 2,3-диметилфенол 2,3-диметилфенол
1- [ p — (3-гидроксипропил) фенил] -1,2-этандиол 1- (4- (3-гидроксипропил) фенил) этан-1,2-диол 1- [4- (3-гидроксипропил) фенил] этан-1,2-диол
Перфтор (1-метилпергидронафталин) 1,1,2,2,3,3,4,4,4a, 5,5,6,6,7,7,8,8a-гептадекафтор-8- (трифторметил) декагидронафталин 1,1,2,2,3,3,4,4,4a, 5,5,6,6,7,7,8,8a-гептадекафтор-8- (трифторметил) нафталин
4- (Изопропилиденгидразоно) -2,5-циклогексадиен-1-карбоновая кислота 4- (пропан-2-илиденгидразоно) циклогекса-2,5-диенкарбоновая кислота 4- [2- (пропан-2-илиден) гидразин-1- илиден] циклогекса-2,5-диен-1-карбоновая кислота
1-Этилиден-5- (2-нафтил) карбоногидразид Невозможно назвать. 3- (этилиденамино) -1- (нафталин-2-иламино) мочевина
(2 S , 5 R , 6 R ) -3,3-Диметил-7-оксо-6- (2-феноксиацетиламино) -4-тиа-1-азабицикло [3.2.0] гептан- 2-карбоновая кислота (2 S , 5 R , 6 R ) -3,3-диметил-7-оксо-6- (2-феноксиацетамидо) -4-тиа-1-азабицикло [3.2.0] гептан- 2-карбоновая кислота (2S, 5R, 6R) -3,3-диметил-7-оксо-6- (2-феноксиацетамидо) -4-тиа-1-азабицикло [3.2.0] гептан-2-карбоновая кислота
Пентацикло [13.7.4.3 3,8 .0 18,20 .1 13,28 ] триаконтан Невозможно назвать. пентацикло [13.7.4.3³, .0¹⁸, ²⁰.1¹³, ²⁸] триаконтан
6 -Тиатриспиро [2.1.1.2 7 .1 5 .2 5 .2 3 ] тетрадекан Невозможно назвать. 5λ⁶ ‐ тиатриспиро [2.1.1.2⁷.1⁵.2⁵.2³] тетрадекан
Триспиро [циклопентан-1,5 ‘- [1λ 4 ,4] дитиан-2′, 2 » — индан-1 ‘, 1’ » — тиофен] Невозможно назвать. 1 », 3 » — дигидро ‐ 1’λ⁴ ‐ триспиро [циклопентан ‐ 1,5 ‘- [1,4] дитиан ‐ 2’, 2 » — инден ‐ 1 ‘, 1’ » — тиофен]
Тетрастанноксан тетрастанноксан тетрастанноксан
2-борилтриборан (5) Невозможно назвать. триборилборана
Бутил Невозможно назвать. монобутил
2,4-хинолдиил Невозможно назвать. Невозможно назвать.

Газогенератор для надувания конструкций в космическом пространстве

В отчете предлагается система, которая будет подавать газ для надувания одной или нескольких надувных конструкций в космическом пространстве. Система будет включать небольшой резервуар с гелием для начального надувания, а также каталитический газогенератор гидразина, который будет обеспечивать подпиточный газ в течение длительного времени. После первоначального надувания, когда требовался подпиточный газ, жидкий гидразин из резервуара должен проходить через каталитический слой, где он разлагается на смесь N 2 , H 2 и небольшого количества NH. 3 .Эта газовая смесь будет составлять подпиточный газ и будет храниться в резервуаре, который ранее содержал гелий. Подпиточный газ будет выпускаться из резервуара в конструкцию (конструкции) по мере необходимости. По сравнению с системой надувания, основанной только на сжатом газе, хранящемся в резервуарах, предлагаемая система надувания будет предлагать преимущество более низкой массы: около 25 процентов масс представительных ранее предполагаемых больших надувных космических конструкций содержалось бы в их надувании. системы.Напротив, масса предлагаемой инфляционной системы оценивается всего в 13 процентов от общей массы репрезентативной конструкции.

Эта работа была выполнена Ларри Роу из Калифорнийского технологического института для Лаборатории реактивного движения НАСА . Чтобы получить копию отчета «Система первоначального наддува и замены газа для надувных космических конструкций», воспользуйтесь бесплатным пакетом технической поддержки (TSP) на сайте www.nasatech.com/tsp в разделе «Механика и автоматизация». категория.

NPO-20539


Данный информационный бюллетень включает Пакет технической поддержки (TSP).
Газогенератор для надувания конструкций в космическом пространстве

(номер NPO-20539) в настоящее время доступен для загрузки из библиотеки TSP.

ВОЙТИ ДЛЯ ЗАГРУЗКИ

Нет учетной записи? Подпишите здесь.


Разработка термоэлектрического генератора из двухслойных кремниевых нанопроволок с бесполостной структурой

Термоэлектрическое преобразование тепла в электричество играет важную роль в производстве энергии, поскольку появление полупроводниковых материалов позволило создавать практические устройства.Термоэлектрические (ТЭ) генераторы имеют преимущества, например: использование отработанного тепла, отсутствие движущихся частей и полупостоянный срок службы. Генератор TE состоит из набора модулей TE, вставленных между двумя теплообменниками. Каждый ТЕ-модуль состоит из нескольких десятков или сотен пар соединенных вместе ТЕ-пар, которые напрямую преобразуют тепловую энергию в электрическую. 1) Типичные TE-модули имеют ту же структуру, известную как Π-образная, в которой полупроводники n- и p-типа соединены электрически последовательно и термически параллельно.Эффективность преобразования TE-генератора ограничена КПД Карно, уменьшенным на коэффициент, который зависит от термоэлектрической добротности, ZT . Для конкретного материала, работающего при указанной температуре, T , ZT связан с другими его физическими свойствами при этой температуре. ZT определяется как ZT = S 2 σT / κ , где S — коэффициент Зеебека, σ — электропроводность, а κ — теплопроводность. 2,3) Для достижения большей эффективности необходимо уменьшить теплопроводность или увеличить коэффициент мощности ( S 2 σ ) термоэлектрических материалов.

Теллурид висмута (Bi 2 Te 3 ) имеет низкую теплопроводность и высокую электропроводность. Поэтому наиболее широко применяемыми термоэлектрическими материалами являются сплавы на основе системы Bi 2 Te 3 , добротность которых равна 1 ( ZT ~ 1). 4,5) Однако Bi 2 Te 3 непригоден для окружающей среды, и его нелегко ввести в традиционную технологию кремний (Si) металл – оксид – полупроводник (КМОП).

В настоящее время наиболее распространенным и широко используемым полупроводниковым материалом является Si. Объемный Si не подходит в качестве материала TE, поскольку он имеет большую теплопроводность ( κ ~ 150 Вт · м -1 K -1 при комнатной температуре). 6) Нанопроволока Si (Si-NW), которая может быть изготовлена ​​из объемного Si с помощью усовершенствованной технологии сухого травления, используемой в процессе изготовления КМОП, имеет такую ​​же электрическую проводимость и коэффициент Зеебека, что и объемный Si, и резко снижает теплопроводность. 7)

Недавно мы предложили планарный генератор Si-NW TE с архитектурой без резонаторов и продемонстрировали с помощью унифицированной структуры, что он более эффективен, чем обычные генераторы Si TE с архитектурой резонатора. 8–11) В генераторе TE без резонатора плотность мощности TE, генерируемая из единичной площади, увеличивается за счет уменьшения длины Si-NW. Из-за конструкции без резонаторов размеры устройства будут уменьшены, а стоимость TE-генератора будет ниже, чем у обычного TE-генератора.Однако одноступенчатый генератор TE имеет небольшое выходное напряжение, которое не может управлять нагрузочными устройствами. Таким образом, требуется многоступенчатая интеграция для повышения небольшого выходного напряжения. Многоступенчатые генераторы TE делятся на две группы: генераторы unileg- и bileg-TE. Генератор unileg-TE состоит только из полупроводников n- или p-типа, термически соединенных параллельно. Напротив, генератор bileg-TE состоит из полупроводников n- и p-типа, соединенных последовательно электрически и параллельно термически.Генератору unileg-TE требуется электрическая проводка между горячей и холодной сторонами генераторов для последовательного соединения. Из-за неизбежной утечки тепла через электрическую проводку разница температур Δ T между горячей и холодной подушкой уменьшается. Затем производительность генератора unileg-TE также снижается. Напротив, в генераторе bileg-TE электрическая проводка между горячей и холодной стороной не требуется, потому что генератор bileg-TE состоит из проводки, соединяющей горячую сторону и холодную сторону.Генератор билэг-ТЕ имеет идеальную структуру для теплотехники. Тем не менее, в генераторе bileg-TE есть несоответствия электрического сопротивления. В генераторе bileg-TE на основе Si-NW подвижность электронов в ННК n-типа больше, чем подвижность дырок в ННК p-типа. Из-за этого несоответствия электрические потери неизбежны. Следовательно, для создания высокоэффективного генератора bileg-TE необходимо регулировать несоответствие подвижности электронов и дырок Si-полупроводника, изменяя ширину обоих типов Si-ННК.

В этой работе мы численно и экспериментально оценили фундаментальную зависимость характеристик ТЭ от отношения ширины Si-ННК n- и p-типа при определенных условиях дозы. После этого мы провели сравнение с численными значениями модели эквивалентной схемы, чтобы убедиться в достоверности приближенных значений эксперимента.

Кроме того, мы добавили больше деталей о модели эквивалентной схемы, сопротивлении ионной дозе и плотности мощности TE на ионной дозе, чем в нашем предыдущем отчете о конференции по твердотельным устройствам и материалам. 12)

2.1. Изготовление TE-генератора Si-NW

Планарный TE-генератор без резонаторов изготовлен на основе кремния на изоляторе (КНИ). Толщина подложки Si, слоя скрытого оксида (BOX) SiO 2 и верхнего слоя SOI составляла 750 мкм, м, 145 и 50 нм соответственно, как показано на рис. 1 (а). В этом процессе изготовления Si-ННК формируют в подложку КНИ с помощью литографии ArF и методов сухого травления, как показано на рис. 1 (b). Затем ННК подвергали термическому окислению в сухой окружающей среде с образованием пленки SiO 2 (толщиной ~ 6 нм) на поверхности Si-ННК.Ионы фосфора (доза 9,0 × 10 14 ионов см −2 ) были имплантированы с энергией ускорения 20 кэВ для области n-типа. Ионы дифторида бора (доза 8,0 × 10 14 ионов см −2 ) были имплантированы с энергией ускорения 30 кэВ для области p-типа. После имплантации проводился активационный отжиг при 1000 ° C в течение 10 с. Одно устройство представляло собой пучок Si-NW из 100 строк с шагом 500 нм. Оба конца жгута Si-NW были подключены к отдельным площадкам Si.Эти Si-ННК и Si-площадки были обернуты пленкой SiO 2 толщиной 6 нм. Затем этот слой SiO 2 в областях Si-площадки был удален путем влажного травления с использованием буферной плавиковой кислоты. Al / TiN / Ti толщиной 400 нм был нанесен на Si-подушку в качестве электрода, как показано на рис. 1 (c).

Приблизить Уменьшить Сбросить размер изображения

Рис. 1. (Цветной онлайн) Принципиальная схема процесса изготовления генератора bileg-TE.(а) Si-подложка на КНИ, (б) Si-ННК были нанесены по образцу на КНИ, (в) наплавленный металл в качестве электрода, (г) TE-генератор с нагревателем и охладителем.

Загрузить рисунок:

Стандартный образ Изображение высокого разрешения

Горячая и горячая стороны ТЭ генератора n- и p-типа соединялись алюминиевым проводом шириной 5 мкм и шириной м. Эта конструкция устройства называется блоком bileg-TE, который образован путем соединения ТЕ элементов n- и p-типа термически параллельно и электрически последовательно. Микротермостат для нагрева и охладитель Пельтье для охлаждения были размещены соответственно на стороне нагрева и базовой подложке для поддержания разницы температур, как показано на рис.1 (г).

Лист с высокой теплопроводностью помещается между подложкой Si и холодным столиком для повышения стабильности межфазной теплопроводности. Ширина Si-ННК составляет менее 120 нм. Длина и толщина Si-ННК составляют 10 мкм, м и 50 нм соответственно. Оптическое и СЭМ-изображение изготовленного устройства длиной 0,25 мкм м и шириной Si-NW менее 100 нм показано на рис. 2.

Приблизить Уменьшить Сбросить размер изображения

Фиг.2. (Цветной онлайн) Оптическое и СЭМ-изображение изготовленного устройства, длина Si-NW меньше 100 нм, а ширина 0,25 мкм м.

Загрузить рисунок:

Стандартный образ Изображение высокого разрешения

2.2. Измерение термоэлектрических свойств

Для измерения свойств генератора Si-NW TE мы использовали настроенную систему датчиков с микротермостатом, которая показана на рис. 3. Плотность мощности TE измерялась путем внешнего приложения температуры. разница Δ T ext между поверхностью и дном образца.Электрод с горячей стороны нагревали с помощью микротермостата, температура которого поддерживалась на уровне 33 ° C, 38 ° C или 43 ° C. Базовая ступень под подложкой поддерживалась при 23 ° C с помощью холодильника Пельтье. Таким образом, Δ T ext изменяется на 10, 15 и 20 К. Тепловой ток течет перпендикулярно подложке Si и частично выходит в горизонтальном направлении. Истекший тепловой ток образовывал крутой градиент температуры вблизи источника тепла, тем самым индуцируя ТЕ-ток через Si-NW.Этот крутой температурный градиент приводит в действие микрогенератор TE.

Приблизить Уменьшить Сбросить размер изображения

Рис. 3. (Цветной онлайн) Условия измерения генератора bileg-TE. Микро-нагреватель обеспечивает тепло. Электрический зонд измеряет параметры.

Загрузить рисунок:

Стандартный образ Изображение высокого разрешения

Изготовленный ТЭ-генератор имеет три электрода, как показано на рис.1 (г). Левый и средний электроды сформированы на холодной стороне ТЭ генератора n- и p-типа соответственно. Правый электрод подключается к горячей стороне ТЭ генератора n- и p-типа. С помощью этих электродов можно отдельно измерять термоэлектрические параметры блока bileg-TE, ТЭ n- и p-типа.

2.3. Модель эквивалентной схемы

Для получения теоретического значения была разработана модель эквивалентной схемы для этого экспериментального устройства, как показано на рис.4. 9) Эта эквивалентная модель тепловой и электрической цепи хорошо воспроизводит результаты моделирования методом конечных элементов. На рис. 4, θ NW и θ sub — это тепловые сопротивления Si-NW и подложки Si, соответственно. и — вертикальная и горизонтальная составляющие термического сопротивления слоя BOX соответственно. V oc — это измеренное напряжение холостого хода, возникающее от генераторов TE n- и p-типа, а R — измеренное электрическое сопротивление генераторов TE.Предполагаемые параметры теплопроводности κ , удельного электрического сопротивления ρ и коэффициента Зеебека S приведены в таблице I.

Приблизить Уменьшить Сбросить размер изображения

Рис. 4. (Цветной онлайн) Эквивалентная модель схемы для измерения оптимальной ширины Si-NW.

Загрузить рисунок:

Стандартный образ Изображение высокого разрешения

Таблица I. Параметры, используемые в модели эквивалентной схемы.

Параметр Параметр
К NW 16,4 Вт мК -1 K Sub 131 Вт mK −1
К Sio 2 1.4 Вт мК −1
S (тип n) −60 μ VK −1 ρ NW (тип n) 4,2 × 10 −3 Ом · см
S (тип p) 40 μ VK −1 ρ NW (p-тип) 5,5 × 10 −3 Ом · см

Эта модель эквивалентной схемы была создана путем размещения элементов термического сопротивления там, где в устройстве TE возникли большие перепады температур.В подложке Si распределение температуры в горизонтальном направлении практически однородно. Таким образом, подложка Si представляет собой вертикально ориентированный элемент термического сопротивления. Тепловой контур ТЭ n- и p-типа разделен, но электрическая цепь включена последовательно. Используя эту модель эквивалентной схемы, получается оптимальное соотношение ширины Si-NW n-типа и p-типа. Это соотношение существенно улучшит конструкцию интегрированного планарного модуля Si-NW micro TE.

3.1. Зависимость электрического сопротивления от ширины Si-NW и дозы ионов

Подвижность электронов собственного Si составляет 1400 см 2 / (Вс) при N D = 1,75 × 10 16 см −3 и подвижность дырок Si составляет 450 см 2 / (Вс) при N A = 1,48 × 10 15 см −3 . 13) Подвижность Si-NW n-типа в три раза больше, чем Si-NW p-типа. Этот дисбаланс мобильности является препятствием для получения высокой плотности мощности TE.Контроль дозы ионов — активный метод решения этой проблемы. С увеличением дозы концентрация активированной легирующей примеси будет увеличиваться, и, следовательно, сопротивление будет уменьшаться. В этом эксперименте, когда доза увеличивается с 1 × 10 14 см –2 до 1,1 × 10 15 см –2 , активированная концентрация легирующей примеси увеличивается с 4,04 × 10 18 см −3 до 7,21 × 10 19 см −3 и от 2.26 × 10 18 см −3 до 1,08 × 10 20 см −3 для ширины 120 нм Si-NW p- и n-типа соответственно, а сопротивление уменьшается с 600 до 28,5 кОм и от 294 до 3,84 кОм для Si-NW p- и n-типа соответственно, как показано на рис. 5 (a). Следовательно, плотность мощности увеличивается с 2,5 × 10 −5 нВт см −2 до 1 × 10 −3 нВт см −2 и от 1,1 × 10 −4 нВт. см −2 к 1.6 × 10 −3 нВт см −2 для Si-NW p- и n-типа соответственно, как показано на рис. 5 (b). Мы провели этот эксперимент в условиях дозы, когда ширина Si-ННК n-типа и длина Si-ННК n- и p-типа постоянны.

Приблизить Уменьшить Сбросить размер изображения

Рис. 5. (Цветной онлайн) (a) Сопротивление на дозе ионов, (b) плотности мощности TE на дозе ионов. С увеличением дозы сопротивление уменьшается, а плотность мощности TE увеличивается.

Загрузить рисунок:

Стандартный образ Изображение высокого разрешения

Поскольку подвижность Si-NW n-типа больше, чем Si-NW p-типа, сопротивление Si-NW p-типа больше, чем Si-NW n-типа. В этом эксперименте с одинаковой шириной 60 нм Si-NW n- и p-типа сопротивление на провод Si-NW n-типа составляет 84 кОм, а сопротивление на провод NW p-типа составляет 154 кОм, как показано в Таблице II. Напряжение холостого хода ( В, oc) ННК p-типа практически одинаково и составляет около 1 мк В при ширине 60, 80 и 120 нм соответственно. V oc очень незначительно меняется с увеличением ширины NW p-типа. Когда ширина Si-NW p-типа составляет 80 нм, наблюдается сопротивление 80 кОм. Следовательно, с увеличением ширины Si-NW p-типа электрическое сопротивление будет уменьшаться и достигнет баланса с Si-NW n-типа, как показано на рис. 6.

Таблица II. Различные параметры NW n- и p-типа.

Тип NW Ширина (нм) В OC ( μ В) Сопротивление / провод (кОм) Мощность см / провод −2 )
Тип n 60 −0.7 84 0,84
p-образный 60 1,3 154 1,8
p-образный 80 1,2 1,7118

1,715 -тип120 1,1 55 2,2

Приблизить Уменьшить Сбросить размер изображения

Фиг.6. (Цветной онлайн) Сопротивление Si-NW разной ширины. При той же ширине сопротивление Si-NW p-типа больше, чем Si-NW n-типа.

Загрузить рисунок:

Стандартный образ Изображение высокого разрешения

3.2. Коэффициент Зеебека TE-генератора n- и p-типа

Мы измерили электрическое сопротивление, напряжение холостого хода и плотность мощности TE разной ширины Si-ННК при различных температурах. В, oc генератора bileg-TE увеличивается с увеличением разницы внешних температур (Δ T ext ).Напряжение холостого хода равно В oc = S eff ΔT ext , где S eff — эффективный коэффициент Зеебека. Зависимость V oc от Δ T ext стала линейной крутизной в нашем эксперименте, как показано на рис. 7 (а). Линейный наклон пропорционален коэффициенту Зеебека. Удельная мощность генератора bileg-TE также увеличивается с увеличением разницы температур снаружи.

Приблизить Уменьшить Сбросить размер изображения

Рис. 7. (Цветной онлайн) (a) Напряжение холостого хода и (b) плотности мощности при разнице внешних температур для блока bileg-TE.

Загрузить рисунок:

Стандартный образ Изображение высокого разрешения

Плотность мощности TE генератора bileg-TE пропорциональна внешнему Δ T 2 , как показано на рис. 7 (b).Этот результат показывает, что свойство TE измеряется без происшествий. Напряжение холостого хода Si-NW n- и p-типа увеличивается с увеличением Δ T ext . Как показано на фиг. 8 (a) и 8 (b), наклон Si-NW p-типа примерно в два раза больше, чем у n-типа, несмотря на то, что длина Si-NW и шаг между каждым Si-NW фиксированный. Следовательно, ожидается, что эффективный коэффициент Зеебека будет зависеть от полярности Si-NW (n- или p-типа). Мы сообщали, что на коэффициент Зеебека Si-NW влияют заряды в области интерфейса Si-NW / SiO 2 . 14) Больший коэффициент Зеебека Si-NW p-типа будет увеличен из-за наличия заряда, который ухудшит коэффициент заряда Si-NW n-типа.

Приблизить Уменьшить Сбросить размер изображения

Рис. 8. (Цветной онлайн) Напряжение холостого хода при разнице внешних температур для Si-NW n-типа (а) и p-типа в эксперименте. Эффективный коэффициент Зеебека Si-NW p-типа выше, чем Si-NW n-типа.

Загрузить рисунок:

Стандартный образ Изображение высокого разрешения

3.3. Плотность мощности TE генератора bileg-TE

В этом исследовании плотность мощности TE нормирована на общую площадь, занимаемую пучком Si-NW, за исключением области Si-pad. Плотность мощности была рассчитана путем деления плотности мощности на общую площадь Si-NW, которая была определена по следующему уравнению:

, где В OC — напряжение холостого хода, а R bi — внутреннее сопротивление генератора bileg-TE.Площадь провода, A NW , определяется следующим уравнением:

, где L NW — длина Si-NW, N NW — количество Si-NW, а W p и W n — ширина Si-NW p- и n-типа соответственно. При одинаковой ширине Si-NW n- и p-типа напряжение холостого хода, сопротивление на провод и мощность на площадь провода у NW p-типа примерно вдвое больше, чем у Si-NW n-типа.Напряжение холостого хода, сопротивление на провод и мощность на площадь провода различной ширины Si-NW n- и p-типа сведены в Таблицу II, которая оценивается как Δ T ext = 20 K. подвижность Si-NW p-типа меньше, чем у n-типа. Следовательно, сопротивление Si-NW p-типа больше, чем Si-NW n-типа. Однако эффективный коэффициент Зеебека Si-NW p-типа больше, чем у n-типа. Таким образом, плотность мощности TE NW p-типа вдвое больше, чем Si-NW n-типа, как показано на рис.9.

Приблизить Уменьшить Сбросить размер изображения

Рис. 9. (Цветной онлайн) Плотность мощности разной ширины ННК n- и p-типа при Δ T ext = 20 k TE мощность Si-NW p-типа вдвое больше как Si-NW n-типа.

Загрузить рисунок:

Стандартный образ Изображение высокого разрешения

Для высокопроизводительного поколения важен баланс коэффициента Зеебека и электрического сопротивления между Si-NW p- и n-типа.В этом эксперименте ширина Si-ННК n-типа составляет 60 нм, что является постоянным значением. Следовательно, изменяя ширину Si-NW p-типа, можно достичь баланса электрического сопротивления между Si-NW n- и p-типа. Модель эквивалентной схемы показывает, что ширина Si-NW p-типа составляет около 76 нм, когда ширина Si-NW n-типа составляет 60 нм. В эксперименте плотности мощности составляют 1,35, 1,16 и 1,12 нВт · см 90 · 107 −2 90 · 108, когда ширина Si-NW p-типа составляет 60, 80 и 120 нм соответственно, как показано на рис.10, где сплошная кривая — численная оценка модели эквивалентной схемы. Эти значения экспериментального результата могут быть изменены из-за нескольких условий, таких как отклонение каждой ширины ННК и тепловые условия в каждом эксперименте. В экспериментах контактное термическое сопротивление между микротермостатом и электродом на горячей стороне изменяется с каждым циклом из-за шероховатости поверхности термостата. Электрическое сопротивление уменьшается с увеличением ширины ННК p-типа.Однако в эксперименте V OC уменьшается с увеличением ННК p-типа с. Это влияет на удельную мощность генератора bileg-TE. Согласно экспериментальному результату, плотность мощности TE увеличивается с уменьшением ширины Si-ННК p-типа. Баланс электрического сопротивления будет максимальным за счет утончения Si-NW.

Приблизить Уменьшить Сбросить размер изображения

Фиг.10. (Цветной онлайн) Зависимость плотности мощности генератора bileg-TE от ширины Si-NW p-типа. Результат эксперимента согласуется с результатом расчета.

Загрузить рисунок:

Стандартный образ Изображение высокого разрешения

В модели эквивалентной схемы плотности мощности составляют 1,27, 1,27 и 1,19 нв см 90 · 107 −2 90 · 108, когда ширина Si-NW p-типа составляет 60, 80 и 120 нм, соответственно. Чтобы получить соотношение ширины между NW n- и p-типа, мы провели сравнение и выровняли максимальную плотность мощности между теоретическими результатами модели эквивалентной схемы и экспериментальными результатами изготовленного устройства.Плотность мощности составляет приблизительно 1,27 нВт / см 90 · 107 −2 90 · 108 как в эквивалентном, так и в экспериментальном результате, когда ширина Si-NW p-типа составляет около 76 нм. Экспериментальные результаты совпали с теоретической оценкой, и это указывает на то, что ширина ННК p-типа будет меньше 100 нм, когда ширина TE-генератора Si-NW n-типа составляет 60 нм. Таким образом, экспериментальные и численные результаты показывают, что баланс ширины Si-NW p- и n-типа с учетом удельного сопротивления Si-NW максимизирует плотность мощности TE.

Мы продемонстрировали первый прототип планарного генератора Si-NW TE с безрезонаторной архитектурой. Мы исследовали фундаментальную зависимость характеристик ТЭ от отношения ширины Si-ННК n- и p-типа и оптимального баланса ширины Si-ННК n- и p-типа для разработки модуля интегрированного генератора TE.

Двухсторонний генератор Si-NW TE изготовлен с использованием предлагаемой нами бесполостной планарной архитектуры устройства, которая реализована по технологии CMOS. Сопротивление устройства, напряжение холостого хода и мощность генерации Si-NW разной ширины были проанализированы путем применения внешней разности температур.Несбалансированное электрическое сопротивление является недостатком генератора Bileg-TE для получения более высоких плотностей мощности TE. Уравновешивание ширины Si-NW p- и n-типа с учетом удельного сопротивления важно для максимизации плотности мощности TE. Чтобы оценить сбалансированное соотношение ширины между NW p- и n-типа, мы использовали нашу модель эквивалентной схемы и получили оптимальную оценку ширины для проектирования высокопроизводительного микро-TE-генератора. Наилучшая ширина ННК p-типа составляет менее 100 нм, когда ширина ННК n-типа составляет 60 нм.Экспериментальная зависимость плотности мощности от ширины ННК p-типа согласуется с численным результатом. Эти результаты дадут фундаментальное руководство для проектирования мощного интегрированного планарного модуля Si-NW TE в будущем.

Эта работа была поддержана JST-CREST (номера грантов JPMJCR15Q7 и JPMJCR19Q5), NIMS Nanofabrication Platform и AIST-SCR. Мы благодарны г-ну Кавагути из Hamamatsu Photonics K.K. для обеспечения скрытности игры в кости.

TubeGen Online — v3.4

TubeGen Online — версия 3.4
Генератор структуры нанотрубок с веб-доступом

TubeGen был разработан при финансовой поддержке Национального научного фонда и предоставлен Doren Research Group, Департамент химии и биохимии Университета Делавэра.

Если вы используете структуры, созданные на этой странице, в публикациях и / или презентациях, пожалуйста, укажите соответствующую ссылку:
TubeGen 3.4 (веб-интерфейс, http://turin.nss.udel.edu/research/tubegenonline.html), Дж. Т. Фрей и Д. Дж. Дорен, Университет Делавэра, Ньюарк, Делавэр, 2011.

Эта версия TubeGen Online использует версию 3.4 утилиты TubeGen, которая доступна как исходный код; код компилируется на многих разновидностях Linux, операционной системы SGI IRIX, а также Mac OS X (несколько пользователей также заставили его работать под Windows). Если вам нужен исходный код, вы должны написать мне электронное письмо и запросить имя пользователя и пароль для моего репозитория Subversion.
ВНИМАНИЕ!

Вычисления, связанные с созданием этих структур, выполняются на машине, выполняющей множество других задач (включая обслуживание этого веб-сайта). Чтобы машина оставалась отзывчивой и доступной, на значения хиральности и распространения наложены ограничения, как указано.


Хиральность (n, m): (,)
Атомная основа 1 : {,}
Длина соединения 2 : Å
Кристаллическая ячейка 3 : HexagonalCubicPlanar (развернутый)
Желоб для ячеек в направлениях (a1, a2, a3) 4 : ,, Å
Число репликаций клеток в (i, j, k) 5 : ,,
Формат 6 : Гауссовский Гауссовский (с PBC) PDBPDB (с PBC) WIEN2K Базовые декартовы координаты (.xyz) Файл геометрии POV в формате BGF в формате CIF
Квартир: ÅBohr
Отрегулируйте длину соединения свернутых трубок 7 :
Подробный вывод 8 :

  1. В этих полях можно указать химические символы или атомные номера.
  2. Длина связи углерод-углерод по умолчанию (в ангстремах): Дрессельхаус, М. С., Дрессельхаус, Г., Эклунд, П. С. «Наука о фуллеренах и углеродных нанотрубках» Academic Press: Сан-Диего, Калифорния, 1995; С. 760.
  3. Представьте, что эта программа вырезает однослойный кусок конечного размера из листа графена, свернутые решетки представляют собой скатывание этого фрагмента в трубчатую структуру. Плоская решетка подразумевает, что кусок не сворачивается, а выводится в виде листовой структуры (например, полезно для расчетов с плотной привязкой).Два типа свернутых решеток отражают тип используемой кристаллической ячейки: шестиугольная плотноупакованная или объемно-центрированная кубическая ячейка.
  4. «Промежуток ячеек» — это количество свободного места, которое необходимо выделить на каждой стороне атомарной основы. По сути, для свернутых решеток вдвое больше этого расстояния составляет расстояние между трубочками. Каждое направление координат кристаллической ячейки имеет независимую величину заполнения; Говоря физически, вы должны поддерживать одинаковые отступы в направлениях a1 и a2 , не используя желоба в направлении a3 .Значения указаны в Ангстремах; значение по умолчанию отражает стандартное расстояние между слоями графита.
  5. Распространение ячейки используется только при выводе гауссовского com-файла. Ячейка реплицируется i раз в направлении a1 , j раз в направлении a2 и k раз в направлении a3 . Полезно для создания гауссовых входных файлов с пучками ( i , j > 1) нанотрубок или для увеличения длины нанотрубки ( k > 1).
  6. Вывод в файл структуры WIEN всегда в дробных координатах; вывод в файл Gaussian com всегда в декартовых координатах со структурой, центрированной в начале координат. Второй формат файла Gaussian и PDB добавляет информацию о периодическом граничном условии (PBC) в выходной файл (Gaussian ’03 и PDB v2).
  7. Когда TubeGen создает структуру из свернутых нанотрубок, он первоначально обертывал кусок графита вокруг цилиндра фиксированного размера. В процессе связи C-C растягиваются и сжимаются в соответствии с природой используемого алгоритма, в результате чего получается набор длин связей ближайшего соседа, которые в среднем соответствуют данной длине связи C-C, но не имеют всей этой длины.Версия 3.0.6 добавила сегмент кода, который учитывает это расширение / сжатие для получения правильной длины связи C-C в свернутых нанотрубках; для обратной совместимости вы можете вернуться к исходному неисправленному методу, сняв этот флажок.
  8. Поскольку он генерирует атомную основу для кристаллической ячейки, TubeGen может отображать различные структурные параметры (например, радиус канальца, количество гексагональных субячеек, хиральный вектор), которые могут быть полезны.

Авторские права © 2003-2015 | Последнее изменение: 31 мар 2015 г.

Генератор 3D-структур CORINA

Генератор 3D-структур CORINA

Ваша версия ilib разнообразная может быть связана с CORINA, которая это быстрый и эффективный генератор 3D-структур, обеспечивающий высокое качество Трехмерные молекулярные модели.Он был разработан для работы с большими объемами структур, таких как библиотеки комбинаторных соединений.

CORINA (COORDINAtes) автоматически создает трехмерную молекулярную модель из таблицы соединений или линейной строки. Он был разработан для быстрой и эффективно огромные объемы структур, таких как базы данных компании и комбинаторные химические эксперименты. CORINA может применяться в следующих областях:

  • Поиск потенциальных клиентов в фармацевтике и оптимизация потенциальных клиентов
  • количественная структура, соотношение видов деятельности и собственности (QSAR и QSPR)
  • Создание базы данных 3D
  • прогнозирование спектров и выяснение структуры
  • прогноз химической активности

За последние 15 лет CORINA получила ряд версий и теперь используется для создания трехмерных структур во всем мире многими ведущими химическими и фармацевтическими компаниями, а также поставщиками трехмерных баз данных.Более того, CORINA стала отраслевым стандартом для создания высококачественных трехмерных молекулярных моделей.

8.1 Характеристики

Возможности включают:

  • применимо ко всему диапазону органической химии и многих металлоорганических образование соединений низкоэнергетических конформаций
  • рассмотрение стереохимической информации
  • обработка структур с атомами, имеющими до шести соседей
  • нет верхних пределов размера молекул или размера кольцевых систем
  • поколение множественных кольцевых конформаций
  • обработка большого количества разнообразных файловых форматов для получения химической информации (е.грамм. MDL SD / RDFile, SYBYL MOL / MOL2, линейный код SMILES и формат файла PDB) несколько вариантов влияния на процесс 3D-генерации

8.2 Производительность

  • высококачественных молекулярных моделей: самые низкие среднеквадратичные отклонения от опубликованных рентгеновских лучей конструкций среди всех имеющихся в продаже моделей
  • robust: обработка открытой базы данных NCI (250 251 соединение) с коэффициент конверсии 99,5% без вмешательства или сбоя программы
  • fast: преобразование открытой базы данных NCI менее чем за 2 часа в обычную Рабочая станция Linux
  • общее: обработка базы данных с более чем шестью миллионами соединений и коэффициент конверсии более 99%

8.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *