АВТОМАТИЗОВАНЕ ВІДНОВЛЕННЯ ТРАСУВАЛЬНИХ ЗВ’ЯЗКІВ МІЖ ВИМОГАМИ ТА ПРОГРАМНИМ КОДОМ З ВИКОРИСТАННЯМ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ

Автор(и)

DOI:

https://doi.org/10.31891/2307-5732-2026-361-38

Ключові слова:

трасування вимог, великі мовні моделі, CodeBERT, семантична подібність, програмний код, ембединги, автоматизація

Анотація

Проблема забезпечення узгодженості між вимогами та програмним кодом набуває критичного значення зі зростанням масштабу та складності сучасних програмних систем, адже відсутність надійних трасувальних зв’язків часто призводить до неповної реалізації вимог, ускладнює супровід коду та перевірку коректності роботи системи. Ручне формування трасувальних матриць є трудомістким і схильним до помилок процесом, особливо у великих проєктах. Використання великих мовних моделей відкриває нові можливості для автоматизації цього процесу, оскільки такі моделі здатні відображати глибокі семантичні зв’язки між текстовими вимогами та фрагментами програмного коду.

У статті запропоновано метод виявлення трасувальних зв’язків між вимогами та програмним кодом із використанням трансформерних моделей великих мовних систем. Запропонований підхід ґрунтується на перетворенні текстових артефактів у векторні представлення за допомогою моделей CodeBERT, SBERT та TF-IDF з подальшим обчисленням семантичної подібності для автоматичного визначення потенційних зв’язків. Метод охоплює такі етапи як підготовки даних, генерації ембедингів, пошуку релевантних фрагментів і оцінювання отриманих результатів.

Експерименти проведено на датасеті MSR-2021, що містить реальні трасувальні зв’язки для кількох проєктів. Отримані результати засвідчили перевагу CodeBERT над традиційними підходами (TF-IDF, SBERT): метод забезпечує точність до 0.85 та F1-score до 0.50 (залежно від глибини пошуку), що є високими показниками для задач автоматизованого інформаційного пошуку та ранжування. Додатково підтверджено важливість урахування структурного контексту коду та продемонстровано вплив параметра Top-K на баланс між повнотою та точністю. Результати доводять, що інтеграція моделей на основі LLM істотно підвищує рівень автоматизації, узгодженості та якості трасування вимог у сучасних середовищах розробки програмного забезпечення.

Завантаження

Опубліковано

29.01.2026

Як цитувати

СКРИПНЮК, О., БАГРІЙ, Р., МАНЗЮК, Е., & СКРИПНИК, Т. (2026). АВТОМАТИЗОВАНЕ ВІДНОВЛЕННЯ ТРАСУВАЛЬНИХ ЗВ’ЯЗКІВ МІЖ ВИМОГАМИ ТА ПРОГРАМНИМ КОДОМ З ВИКОРИСТАННЯМ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ. Herald of Khmelnytskyi National University. Technical Sciences, 361(1), 268-275. https://doi.org/10.31891/2307-5732-2026-361-38