МЕТОД АВТОМАТИЗОВАНОГО ВИЯВЛЕННЯ ТЕРМІНІВ СТАТЕЙЗА ДОПОМОГОЮ ДЕРЕВА ДЛЯ ПРИЙНЯТТЯ РІШЕНЬ
DOI:
https://doi.org/10.31891/2307-5732-2023-319-1-338-343Ключові слова:
віртуальна спільнота, дерево прийняття рішень, ІТ-галузь, обробка великих даних, аналіз вмісту дописівАнотація
З кожним днем все більше зростає кількість користувачів віртуальних спільнот, а отже і даних, що виникають під час комунікації між ними. Розміщені дані можуть містити цінне інформаційне наповнення, адже містять не тільки думку виробника, але і споживацький досвід про певний продукт. Але через те, що віртуальні спільноти мають слабку структурованість щодо подачі інформації, є більш орієнтовані на розважальний контент – можуть містити дані, які не несуть смислового навантаження, а також при розміщенні даних не всі користувачі передбачають техніки, що допоможуть збільшити релевантність пошуку цих даних. Тому пошук цільових даних потребує значних часових витрат. Для покращення пошуку даних у статі запропоновано метод, що дозволяє проаналізувати зміст розміщених дописів та виявити ключові слова з певної предметної області. Даний метод є автоматизованим та працює на основі попередньо розробленого словнику ключових фраз або регулярних виразів з ваговими коефіцієнтами приналежності до того чи іншого терміну. В результаті чого для кожного терміну будується дерево прийняття рішень, що визначає вагу терміну до змісту допису, статті. В роботі представлено обчислення ваги для одного терміну з частини допису спільноти CodeProject.
Посилання
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2023 АННА СИНЬКО, ПАВЛО ЖЕЖНИЧ (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.