ГІБРИДНА СИСТЕМА ГЕНЕРАЦІЇ ЛЕКСИЧНИХ ЗАМІН УКРАЇНОМОВНОГО ТЕКСТУ ДЛЯ ПІДВИЩЕННЯ КОГНІТИВНОЇ ДОСТУПНОСТІ
DOI:
https://doi.org/10.31891/2307-5732-2026-363-24Ключові слова:
спрощення тексту, лексична заміна, словник, LLM, когнітивна доступність, українська моваАнотація
У статті розглянуто генерацію замін на основі словника та LLM для спрощення українських текстів із фокусом на підвищенні когнітивної доступності. Запропоновано архітектуру, де словниковий пошук є першим рівнем, а мовні моделі використовуються як наступний рівень пошуку для невідомих або складних одиниць. Результати фільтруються, кешуються та повертаються в текст із морфологічним узгодженням. Описано сценарії використання для освітніх, технічних та інструктивних текстів. Проведено порівняння чотирьох моделей, що використовуються або є цільовими в проєкті: MamayLLM, LapaLLM, Gemma 3 12B і Gemini 1.5 Flash. Оцінювання виконано за чотирма групами метрик, а саме якість замін, швидкодія, покриття та ресурсна вартість. Результати підтверджують доцільність гібридного підходу. Словниковий рівень забезпечує стабільність і швидкість, LLM підвищують семантичну адекватність для складних категорій, а кешування знижує кількість повторних запитів. Сформульовано практичні рекомендації щодо вибору моделей і сценаріїв застосування в системах спрощення українських текстів.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2026 РОМАН САВІЦЬКИЙ, ТЕТЯНА ВАКАЛЮК (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.