НАЇВНИЙ МЕТОД ЗАСНОВАНИЙ НА ПРАВИЛАХ ПРИ АНАЛІЗІ НАСТРОЇВ УКРАЇНСЬКОМОВНОГО КОНТЕНТУ

Автор(и)

DOI:

https://doi.org/10.31891/2307-5732-2024-343-6-22

Ключові слова:

аналіз настроїв, наївний підхід на основі правил, українська мова, попередня обробка тексту, виявлення емоцій, лексика настроїв, обробка природної мови (NLP), аналіз даних

Анотація

У цій статті розглядаються труднощі, що виникають при застосуванні алгоритмів на основі наївних правил для аналізу настроїв українськомовного контенту. Аналіз настроїв є корисним для таких видів контенту, як відгуки, відстеження бренду, політичні позиції та психологічний аналіз. Описано етапи обробки тексту, такі як видалення зайвих елементів (емодзі, посилань, хештегів), токенізація і лематизація. Метод наївних правил виділяється простотою та ефективністю, особливо у випадках, коли застосування складніших моделей машинного навчання обмежене через ресурси. Водночас, цей метод має обмеження в обробці складних аспектів мови, таких як сарказм і контекст. Для підвищення точності пропонується розширення емоційного лексикону та використання гібридних методів, що поєднують правила з підходами машинного навчання. Тести на масивах даних показали, що цей підхід може бути ефективним для швидкого і зрозумілого аналізу настроїв, особливо в умовах обмежених ресурсів. Результати дослідження підкреслюють, що метод наївних правил, хоча і не досягає рівня моделей машинного навчання, є досить дієвим для швидкого аналізу текстів у певних умовах. Особливо це стосується ситуацій, коли ресурси для впровадження більш складних моделей обмежені, а також коли важливими є простота налаштування та швидкість виконання. Для подальшого розвитку цього підходу пропонується покращувати лексикон настроїв, включаючи більше емоційних станів, та впроваджування методів, що враховують контекст і складніші мовні структури. Використання гібридних рішень, які поєднують правила з машинним навчанням, відкриває нові можливості для підвищення точності аналізу, дозволяючи обробляти більш складні мовні конструкції та контексти, які не під силу суто правилозалежним методам.

Завантаження

Опубліковано

16.12.2024

Як цитувати

ЛОМОВАЦЬКИЙ, А., & БАСЮК, Т. (2024). НАЇВНИЙ МЕТОД ЗАСНОВАНИЙ НА ПРАВИЛАХ ПРИ АНАЛІЗІ НАСТРОЇВ УКРАЇНСЬКОМОВНОГО КОНТЕНТУ. Herald of Khmelnytskyi National University. Technical Sciences, 343(6(1), 146-151. https://doi.org/10.31891/2307-5732-2024-343-6-22