СИСТЕМА АВТОМАТИЧНОГО ВИЯВЛЕННЯ УКРАЇНОМОВНОЇ ДЕЗІНФОРМАЦІЇ НА ОСНОВІ МАШИННОГО НАВЧАННЯ
DOI:
https://doi.org/10.31891/2307-5732-2025-351-34Ключові слова:
джерела дезінформації, інформаційна безпека, аналіз фейків, Машинне навчання, обробка природної мови, точністьАнотація
Розроблення інструментів для ідентифікації та аналізу інформаційних загроз є актуальним завданням, що має важливе значення для забезпечення інформаційної безпеки України, особливо у теперішній час. Дослідження та аналіз методів та комплексних інструментів для ідентифікації фейків і дезінформації, не лише відповідає критичній потребі українського суспільства в надійних засобах верифікації інформації, але й підвищує загальну культуру інформаційного споживання, зміцнюючи інформаційну стійкість нації.
У статті проведено аналіз існуючих підходів та інструментів для ідентифікації, оцінки та протидії дезінформації, фейковим новинам і пропаганді в українському інформаційному просторі. Розроблено прототип системи текстового аналізу, здатної потенційно виявляти дезінформацію з використанням векторизації на основі TF-IDF та мультиноміального наївного класифікатора Байєса. Наукова новизна полягає у застосуванні цих методів машинного навчання до україномовного контенту, а також використання FAISS для швидкого пошуку найближчих сусідів та кластеризації у векторному просторі. Наведено результати порівняння оцінок точності моделі для правдивого та неправдивого контенту. Це дає змогу визначити для якого типу текстів модель працює краще.
Подальше дослідження буде спрямоване на навчання і тренування моделі на нових даних, тестування та оцінювання запропонованої системи, а також використання даної системи для автоматизованого моніторингу новин та у соціальних медіа для ідентифікації потенційно фальсифікованої інформації.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2025 ОЛЬГА ЛОЗИНСЬКА, ВІКТОРІЯ ВИСОЦЬКА, ОКСАНА МАРКІВ, ВІТАЛІЙ ДАНИЛИК, ЮРІЙ КУЛІКОВ (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.