МЕТОД АВТОМАТИЗОВАНОГО ВИЯВЛЕННЯ ТЕРМІНІВ СТАТЕЙЗА ДОПОМОГОЮ ДЕРЕВА ДЛЯ ПРИЙНЯТТЯ РІШЕНЬ
DOI:
https://doi.org/10.31891/2307-5732-2023-319-1-338-343Ключові слова:
віртуальна спільнота, дерево прийняття рішень, ІТ-галузь, обробка великих даних, аналіз вмісту дописівАнотація
З кожним днем все більше зростає кількість користувачів віртуальних спільнот, а отже і даних, що виникають під час комунікації між ними. Розміщені дані можуть містити цінне інформаційне наповнення, адже містять не тільки думку виробника, але і споживацький досвід про певний продукт. Але через те, що віртуальні спільноти мають слабку структурованість щодо подачі інформації, є більш орієнтовані на розважальний контент – можуть містити дані, які не несуть смислового навантаження, а також при розміщенні даних не всі користувачі передбачають техніки, що допоможуть збільшити релевантність пошуку цих даних. Тому пошук цільових даних потребує значних часових витрат. Для покращення пошуку даних у статі запропоновано метод, що дозволяє проаналізувати зміст розміщених дописів та виявити ключові слова з певної предметної області. Даний метод є автоматизованим та працює на основі попередньо розробленого словнику ключових фраз або регулярних виразів з ваговими коефіцієнтами приналежності до того чи іншого терміну. В результаті чого для кожного терміну будується дерево прийняття рішень, що визначає вагу терміну до змісту допису, статті. В роботі представлено обчислення ваги для одного терміну з частини допису спільноти CodeProject.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2023 АННА СИНЬКО, ПАВЛО ЖЕЖНИЧ (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.