МЕТОД МЕТА-НАВЧАННЯ ДЛЯ ВИЗНАЧЕННЯ МОЛЕКУЛЯРНОЇ СПОРІДНЕНОСТІ
DOI:
https://doi.org/10.31891/2307-5732-2022-307-2-14-24Ключові слова:
мета-навчання, машинне навчання, методи ансамблювання, молекулярна спорідненість, трансформери, бустинг, стекінг, коефіцієнт енгібуванняАнотація
У цій роботі застосований принцип мета-навчання для передбачення молекулярної спорідненості між рецептором (велика біомолекула) та лігандами (малі органічні молекули). Мета-моделі вивчають оптимальну комбінацію окремих базових моделей у двох послідовних ансамблях - класифікаційному та регресійному. Кожен із ансамблів містить по шість моделей машинного навчання, які поєднуються методом стекінгу. Базові моделі включають в себе метод опорних векторів, випадковий ліс, градієнтний бустинг, графові нейронні мережі та нейронні мережі прямого поширення, а також трансформери. Перший ансамбль прогнозує імовірність зв’язування та класифікує усі молекули-кандидати до обраного рецептору на активні та неактивні. Ліганди, які перший ансамбль визнав активними, подаються у другий ансамбль, який передбачає ступінь їхню спорідненості до рецептору у вигляді коефіцієнту енгібіювання (Ki). Особливістю методу є відмова від використання координат атомів окремих молекул та їхніх комплексів - у такий спосіб нівелюються експериментальні похибки під час підготовки зразків та вимірювання координат атомів, а також уможливлюється застосування методу для визначення спорідненості біомолекул із невідомими просторовими конфігураціями. Показано, що мета-навчання збільшує відгук (Recall) класифікаційного ансамблю на 34,9% та коефіцієнт детермінації (R2) регресійного ансамблю на 21% у порівнянні із середніми значеннями. У цій роботі показано, що ансамбль з мета-стекінгом є асимптотично оптимальною системою для навчання. Розглядається особливість Super Learning’у для використання перехресної перевірки (k-fold cross-validation) для формування передбачень «першого рівня», на яких виконується навчання моделей другого рівня - або мета-моделей, - які комбінують моделі першого рівня оптимальним чином. Досліджується здатність передбачати молекулярну спорідненість шести моделей машинного навчання, а також покращення ефективності унаслідок поєднання моделей у ансамблі методом стекінгу. Показані моделі, які поєднані у два послідовні ансамблі.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2022 О. ГУРБИЧ (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.