МЕТОД ФОРМАЛІЗОВАНОЇ ПРОЦЕДУРИ СИНТЕЗУ ТА ОБЧИСЛЕННЯ ОЗНАК ДЛЯ ВИЯВЛЕННЯ ФЕЙКОВИХ НОВИН
DOI:
https://doi.org/10.31891/2307-5732-2025-355-102Ключові слова:
виявлення фейкових новин, великі мовні моделі, процедура обчислення ознак, обробка природної мови, класифікація текстівАнотація
У роботі запропоновано новий метод, що формалізує процедуру виявлення фейкових новин, яка ґрунтується на можливостях великих мовних моделей (LLM) для синтезу підозрілих текстових атрибутів та їхнього перетворення на числові вектори, що придатні для класифікації. Завдання дослідження полягає в уточненні процесу перетворення текстових сигналів на числові ознаки, що покращує інтеграцію лінгвістичних сигналів з глибокими контекстуальними векторами ознак. Експерименти проводилися за англомовним (FakeNewsNet) та україномовним (Ukrainian news) наборами даних, де запропонований метод перевершив базові підходи, досягнувши точності до 89.6% для англійської та 88.3% для української мови. Ключові результати показують, що поєднання числових індикаторів (наприклад, коефіцієнтів перефразування та тональності) з генерацією за LLM забезпечує вищу повноту виявлення оманливих новинних статей. Запропонована процедура обчислення ознак успішно підвищує точність виявлення, зберігаючи прозорість прийняття рішень моделлю. Дослідження підкреслює важливість систематично розроблених числових ознак, які доповнюють генерації за LLM, пропонуючи шлях до більш надійних, адаптивних та пояснюваних систем виявлення фейкових новин.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2025 АНДРІЙ ШУПТА (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.