ГІБРИДНА СИСТЕМА ГЕНЕРАЦІЇ ЛЕКСИЧНИХ ЗАМІН УКРАЇНОМОВНОГО ТЕКСТУ ДЛЯ ПІДВИЩЕННЯ КОГНІТИВНОЇ ДОСТУПНОСТІ

Автор(и)

DOI:

https://doi.org/10.31891/2307-5732-2026-363-24

Ключові слова:

спрощення тексту, лексична заміна, словник, LLM, когнітивна доступність, українська мова

Анотація

У статті розглянуто генерацію замін на основі словника та LLM для спрощення українських текстів із фокусом на підвищенні когнітивної доступності. Запропоновано архітектуру, де словниковий пошук є першим рівнем, а мовні моделі використовуються як наступний рівень пошуку для невідомих або складних одиниць. Результати фільтруються, кешуються та повертаються в текст із морфологічним узгодженням. Описано сценарії використання для освітніх, технічних та інструктивних текстів. Проведено порівняння чотирьох моделей, що використовуються або є цільовими в проєкті: MamayLLM, LapaLLM, Gemma 3 12B і Gemini 1.5 Flash. Оцінювання виконано за чотирма групами метрик, а саме якість замін, швидкодія, покриття та ресурсна вартість. Результати підтверджують доцільність гібридного підходу. Словниковий рівень забезпечує стабільність і швидкість, LLM підвищують семантичну адекватність для складних категорій, а кешування знижує кількість повторних запитів. Сформульовано практичні рекомендації щодо вибору моделей і сценаріїв застосування в системах спрощення українських текстів.

Завантаження

Опубліковано

26.03.2026

Як цитувати

САВІЦЬКИЙ, Р., & ВАКАЛЮК, Т. (2026). ГІБРИДНА СИСТЕМА ГЕНЕРАЦІЇ ЛЕКСИЧНИХ ЗАМІН УКРАЇНОМОВНОГО ТЕКСТУ ДЛЯ ПІДВИЩЕННЯ КОГНІТИВНОЇ ДОСТУПНОСТІ. Herald of Khmelnytskyi National University. Technical Sciences, 363(2), 182-188. https://doi.org/10.31891/2307-5732-2026-363-24