МЕТОД КЛАСИФІКАЦІЇ КОНФІДЕНЦІЙНОЇ ІНФОРМАЦІЇ ІЗ ЗАСТОСУВАННЯМ МАШИННОГО НАВЧАННЯ
DOI:
https://doi.org/10.31891/2307-5732-2025-357-13Ключові слова:
класифікація даних, конфіденційна інформація, машинне навчання, наївний Баєсівський класифікатор, згладжування Лапласа, SVM, інформаційна безпекаАнотація
У статті запропоновано метод класифікації конфіденційної інформації на основі текстового аналізу з використанням машинного навчання. Для моделювання застосовано наївний Баєс із згладжуванням Лапласа та SVM для порівняння. Метод працює з різнорідними даними (реальні, публічні, синтетичні) і досягає високої точності (92%), повноти (90%) та F1-міри (91%), перевершуючи традиційні підходи. Згладжування Лапласа підвищує стійкість моделі, особливо для рідкісних класів. Описано підготовку даних і порівняння алгоритмів за ключовими метриками. Результати підтверджують ефективність методу для автоматизованого захисту чутливої інформації та мають потенціал для впровадження в корпоративні системи безпеки.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2025 БОГДАН ПАЛІЙЧУК, ЕДУАРД МАНЗЮК, ТЕТЯНА СКРИПНИК, ОЛЕКСАНД ПАСІЧНИК (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.