ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ РОЗРОБЛЕННЯ ТА НАПОВНЕННЯ ДАТАСЕТУ ДЕЗІНФОРМАЦІЇ З ВИКОРИСТАННЯМ ІНТЕЛЕКТУАЛЬНОГО ПОШУКУ ДИПФЕЙКІВ ТА КЛІКБЕЙТІВ

ОЛЬГА ЛОЗИНСЬКА; ОКСАНА МАРКІВ; ВІКТОРІЯ ВИСОЦЬКА; РОМАН РОМАНЧУК; МАРІЯ НАЗАРКЕВИЧ

doi:10.31891/2307-5732-2024-343-6-24

Автор(и)

ОЛЬГА ЛОЗИНСЬКА Національний університет «Львівська політехніка» Автор https://orcid.org/0000-0002-5079-0544
ОКСАНА МАРКІВ Національний університет «Львівська політехніка» Автор https://orcid.org/0000-0002-1691-1357
ВІКТОРІЯ ВИСОЦЬКА Національний університет «Львівська політехніка» Автор https://orcid.org/0000-0001-6417-3689
РОМАН РОМАНЧУК Національний університет «Львівська політехніка» Автор https://orcid.org/0009-0004-4352-1073
МАРІЯ НАЗАРКЕВИЧ Національний університет «Львівська політехніка» Автор https://orcid.org/0000-0002-6528-9867

DOI:

https://doi.org/10.31891/2307-5732-2024-343-6-24

Ключові слова:

статистичні характеристики показників, дезінформація, датасет, інтелектуальний пошук дезінформації, зміна динаміки поведінки учасників чатів, виявлення фейків та пропаганди, точність, влучність, повнота, F1-Score

Анотація

У роботі розглянуто методику розроблення та наповнення датасету фейків для подальшого навчання моделі та проведення її тестування з метою ідентифікації дезінформації та пропаганди, визначення ознак першоджерел та маршрутів їх розповсюдження, а також знаходження критеріїв та параметрів зміни динаміки поведінки учасників чатів з використанням інструментів інтелектуального пошуку. Описано особливості критеріїв дезінформації на основі Рабатського плану дій в контексті тематики дослідження. Розглянуто існуючі методи інтелектуального пошуку дезінформації та проаналізовано особливості фактчекінгових сайтів та наведено приклади наповнення актуального датасету фейків в період після повномасштабного вторгненняв Україну. Проаналізовано існуючі стратегії плану протидії дезінформації та описано особливості видів фейків, а саме діпфейків та клікбейтів.

Проведено експерименти на розробленому датасеті з використанням моделей машинного навчання, зокрема моделі на основі TF-IDF та моделі на основі BERT. Наведено результати тренування та тестування моделі машинного навчання, використовуючи такі метрики як точність, влучність, повнота та F1-Score. Враховуючи отримані результати можна зробити висновок, що програма загалом працює та виконує своє основне завдання з виявлення дезінформації.

ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ РОЗРОБЛЕННЯ ТА НАПОВНЕННЯ ДАТАСЕТУ ДЕЗІНФОРМАЦІЇ З ВИКОРИСТАННЯМ ІНТЕЛЕКТУАЛЬНОГО ПОШУКУ ДИПФЕЙКІВ ТА КЛІКБЕЙТІВ

Автор(и)

DOI:

Ключові слова:

Анотація

Завантаження

Опубліковано

Номер

Розділ

Як цитувати

Мова

Зробити подання

Індексування

Авторам

Прапор