ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ РОЗРОБЛЕННЯ ТА НАПОВНЕННЯ ДАТАСЕТУ ДЕЗІНФОРМАЦІЇ З ВИКОРИСТАННЯМ ІНТЕЛЕКТУАЛЬНОГО ПОШУКУ ДИПФЕЙКІВ ТА КЛІКБЕЙТІВ
DOI:
https://doi.org/10.31891/2307-5732-2024-343-6-24Ключові слова:
статистичні характеристики показників, дезінформація, датасет, інтелектуальний пошук дезінформації, зміна динаміки поведінки учасників чатів, виявлення фейків та пропаганди, точність, влучність, повнота, F1-ScoreАнотація
У роботі розглянуто методику розроблення та наповнення датасету фейків для подальшого навчання моделі та проведення її тестування з метою ідентифікації дезінформації та пропаганди, визначення ознак першоджерел та маршрутів їх розповсюдження, а також знаходження критеріїв та параметрів зміни динаміки поведінки учасників чатів з використанням інструментів інтелектуального пошуку. Описано особливості критеріїв дезінформації на основі Рабатського плану дій в контексті тематики дослідження. Розглянуто існуючі методи інтелектуального пошуку дезінформації та проаналізовано особливості фактчекінгових сайтів та наведено приклади наповнення актуального датасету фейків в період після повномасштабного вторгненняв Україну. Проаналізовано існуючі стратегії плану протидії дезінформації та описано особливості видів фейків, а саме діпфейків та клікбейтів.
Проведено експерименти на розробленому датасеті з використанням моделей машинного навчання, зокрема моделі на основі TF-IDF та моделі на основі BERT. Наведено результати тренування та тестування моделі машинного навчання, використовуючи такі метрики як точність, влучність, повнота та F1-Score. Враховуючи отримані результати можна зробити висновок, що програма загалом працює та виконує своє основне завдання з виявлення дезінформації.