ПОРІВНЯЛЬНИЙ АНАЛІЗ МОДЕЛЕЙ МАШИННОГО НАВЧАННЯ RANDOM FOREST ТА XGBOOST У ЗАДАЧІ КЛАСИФІКАЦІЇ ІНЦИДЕНТІВ БЕЗПЕКИ

Автор(и)

  • МИКОЛА КОНОТОПЕЦЬ Інститут спеціального зв’язку та захисту інформації Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського» Автор https://orcid.org/0000-0002-6963-1877
  • ОЛЕКСАНДР ТУРОВСЬКИЙ Державний університет інформаційно-комунікаційних технологій Автор https://orcid.org/0000-0002-4961-0876
  • ОЛЕКСАНДР АКСАМИТНИЙ Інститут спеціального зв’язку та захисту інформації Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського» Автор https://orcid.org/0009-0004-4439-6286
  • АЛЕКСАНДРА МАТІЙКО Інститут спеціального зв’язку та захисту інформації Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського» Автор https://orcid.org/0000-0002-6947-5958

DOI:

https://doi.org/10.31891/2307-5732-2025-357-29

Ключові слова:

класифікація інцидентів, інформаційна безпека, машинне навчання, Random Forest, XGBoost, хибнопозитивні спрацювання

Анотація

У статті представлено порівняльне дослідження ефективності моделей машинного навчання Random Forest та XGBoost у задачі багатокласової класифікації інцидентів безпеки в інформаційних системах.  
У процесі дослідження побудовано дві моделі класифікації інцидентів на основі алгоритмів Random Forest та XGBoost. Окрім емпіричної оцінки якості моделей, у роботі описано їх принципи роботи та подано математичне обґрунтування. Для Random Forest сформульовано ймовірнісну модель ансамблю дерев, використано індикаторні функції, проаналізовано функцію відступу та узагальнену помилку моделі. Для XGBoost детально розглянуто процедуру побудови дерева на кожній ітерації, оптимізацію функціоналу втрат з регуляризаційним компонентом, використання градієнтів другого порядку та критерій приросту. Така формалізація забезпечує глибше теоретичне розуміння механізмів роботи алгоритмів і пояснює їх поведінку в реальних умовах. 
Проведено порівняльний аналіз ефективності моделей за ключовими метриками класифікації: точністю (accuracy), повнотою (recall), точністю позитивних прогнозів (precision) та F1-мірою. Визначено, що модель Random Forest показала дещо вищу загальну точність (91.97%) та кращу здатність виявляти хибнопозитивні інциденти, що є важливою перевагою в умовах перевантаження SOC великою кількістю сигналів. У свою чергу, модель XGBoost продемонструвала стабільну класифікацію справжніх загроз (TruePositive), що є критичним для оперативного реагування в системах інформаційної безпеки. 
Результати дослідження можуть бути ефективно використані в інтеграції розроблених моделей у системи SIEM, SOAR та інші платформи інформаційної безпеки для автоматизованої попередньої класифікації подій. 

Завантаження

Опубліковано

03.10.2025

Як цитувати

КОНОТОПЕЦЬ, М., ТУРОВСЬКИЙ, О., АКСАМИТНИЙ, О., & МАТІЙКО, А. (2025). ПОРІВНЯЛЬНИЙ АНАЛІЗ МОДЕЛЕЙ МАШИННОГО НАВЧАННЯ RANDOM FOREST ТА XGBOOST У ЗАДАЧІ КЛАСИФІКАЦІЇ ІНЦИДЕНТІВ БЕЗПЕКИ. Herald of Khmelnytskyi National University. Technical Sciences, 357(5.1), 235-245. https://doi.org/10.31891/2307-5732-2025-357-29