НАЇВНИЙ МЕТОД ЗАСНОВАНИЙ НА ПРАВИЛАХ ПРИ АНАЛІЗІ НАСТРОЇВ УКРАЇНСЬКОМОВНОГО КОНТЕНТУ
DOI:
https://doi.org/10.31891/2307-5732-2024-343-6-22Ключові слова:
аналіз настроїв, наївний підхід на основі правил, українська мова, попередня обробка тексту, виявлення емоцій, лексика настроїв, обробка природної мови (NLP), аналіз данихАнотація
У цій статті розглядаються труднощі, що виникають при застосуванні алгоритмів на основі наївних правил для аналізу настроїв українськомовного контенту. Аналіз настроїв є корисним для таких видів контенту, як відгуки, відстеження бренду, політичні позиції та психологічний аналіз. Описано етапи обробки тексту, такі як видалення зайвих елементів (емодзі, посилань, хештегів), токенізація і лематизація. Метод наївних правил виділяється простотою та ефективністю, особливо у випадках, коли застосування складніших моделей машинного навчання обмежене через ресурси. Водночас, цей метод має обмеження в обробці складних аспектів мови, таких як сарказм і контекст. Для підвищення точності пропонується розширення емоційного лексикону та використання гібридних методів, що поєднують правила з підходами машинного навчання. Тести на масивах даних показали, що цей підхід може бути ефективним для швидкого і зрозумілого аналізу настроїв, особливо в умовах обмежених ресурсів. Результати дослідження підкреслюють, що метод наївних правил, хоча і не досягає рівня моделей машинного навчання, є досить дієвим для швидкого аналізу текстів у певних умовах. Особливо це стосується ситуацій, коли ресурси для впровадження більш складних моделей обмежені, а також коли важливими є простота налаштування та швидкість виконання. Для подальшого розвитку цього підходу пропонується покращувати лексикон настроїв, включаючи більше емоційних станів, та впроваджування методів, що враховують контекст і складніші мовні структури. Використання гібридних рішень, які поєднують правила з машинним навчанням, відкриває нові можливості для підвищення точності аналізу, дозволяючи обробляти більш складні мовні конструкції та контексти, які не під силу суто правилозалежним методам.