МЕТОД КЛАСИФІКАЦІЇ ТЕКСТІВ ЗА ВМІСТОМ ПРОПАГАНДИ НЕЙРОМЕРЕЖЕВИМИ МОДЕЛЯМИ ГЛИБОКОГО НАВЧАННЯ
DOI:
https://doi.org/10.31891/2307-5732-2024-341-5-51Ключові слова:
нейромережі глибокого навчання, нейромережі-трансформери, пропаганда, аугментаціяАнотація
Запропоновано метод класифікації текстів за вмістом пропаганди нейромережевими моделями глибокого навчання, що ґрунтується на об’єднанні традиційних рекурентних нейромереж з довгостроковою пам’яттю із трансформерами, що може забезпечити більш глибоке розуміння послідовності та контексту в текстовому контенті. Особливістю запропонованого методу є те, що він дозволяє виявляти як явні, так і приховані пропагандистські меседжі, ґрунтуючись на об’єднанні можливостей традиційних рекурентних нейромереж з довгостроковою пам’яттю і нейромереж-трансформерів, а також на використанні механізму аугментації навчальних текстових даних, що дозволяє розширити кількість навчальних зразків.
Для навчання нейромережі було створено набір даних з понад 25 000 записів та розроблене відповідне програмне забезпечення для дослідження ефективності методу. Встановлено, що з застосуванням аугментації кращі показники досягаються при більшій кількості епох, що пояснюється розширенням навчальної вибірки, яке призводить до потреби більшої кількості епох. В той же час, при застосуванні аугментації вдалося досягнути точності 97.83 %, водночас без аугментації цей показник максимально досяг рівня 96.94%. Одержані результати свідчать про спроможність запропонованого методу ефективно класифікувати тексти за вмістом пропаганди нейромережевими моделями глибокого навчання, а застосування додаткової категорії «підозрілий текст» дозволило підняти показники Precision та Recall, що у свою чергу дає можливість автоматизованої модерації текстів на предмет пропаганди з помилками не більше 1.83% для хибного виявлення пропаганди.