ДВОРІВНЕВИЙ МЕТОД РОЗПІЗНАВАННЯ СКЛАДНИХ ЦИФРОВИХ ЗОБРАЖЕНЬ ІЗ ЗАСТОСУВАННЯМ ROI-МАСКУВАННЯ ТА ГІБРИДНОЇ АРХІТЕКТУРИ U-NET 3+ / RESNET-U-NET, НА ПРИКЛАДІ ВИЯВЛЕННЯ КАРІЄСУ ЗА РЕНТГЕНІВСЬКИМ ЗНІМКОМ
DOI:
https://doi.org/10.31891/2307-5732-2026-361-48Ключові слова:
глибоке навчання, сегментація зображень, карієс, ROI-маскування, U-Net 3+, MobileNet, Vision Mamba Layers, ResNet-U-NetАнотація
Задача розпізнавання складних цифрових зображень є важливою і актуальною для багатьох галузей науки і техніки. Особливо вагоме її значення в проведенні медичної діагностики на основі аналізу рентгенологічних цифрових зображень. Застосування систем штучного інтелекту створює основу для успішної автоматизації вирішення цієї задачі. Однак, в ряді випадків, зокрема для раннього виявлення карієсу зубів на основі аналізу рентгенівських стоматологічних зображень стандартні методи розпізнавання цифрових зображень не дозволяють отримати хороші результати. Підвищення точності цієї діагностики потребує поєднання ефективних алгоритмів сегментації цифрових рентгенологічних стоматологічних зображень з адаптивними моделями глибокого навчання, здатними аналізувати лише релевантні ділянки зображення.
У роботі представлено дворівневий метод автоматичного розпізнавання складних цифрових зображень на прикладі вирішення задачі виявлення карієсу на стоматологічних рентгенівських знімках, який поєднує сегментаційний етап і цільову діагностику в межах області інтересу (ROI).
На першому етапі застосовано модифіковану архітектуру U-Net 3+, що інтегрує легковаговий енкодер MobileNet та Vision Mamba Layers у декодері, забезпечуючи високу точність і стабільність сегментації зображення при зниженні обчислювальної складності. Отримана маска зубного ряду використовується для формування ROI, яка обмежує аналіз клінічно значущою ділянкою зображення, виключаючи фон, м’які тканини та артефакти. На другому етапі виконується детекція каріозних уражень за допомогою оптимізованої моделі ResNet-U-Net, що поєднує залишкові блоки з U-подібною структурою для точного відтворення меж патологічних ділянок навіть за умов низького контрасту. Експериментальні дослідження, проведені на наборі даних DENTEX, підтвердили ефективність запропонованого методу: показники Dice = 0.74, Precision = 0.88 і Recall = 0.90 перевищують результати базових моделей U-Net, U-Net 3+ та MobileMamba-U-Net. Аналіз показав, що застосування ROI-маскування суттєво зменшує кількість хибнопозитивних результатів, підвищує стабільність моделі при варіаціях експозиції та скорочує час інференсу приблизно на третину.
Запропонований підхід забезпечує баланс між точністю та швидкодією, створюючи основу для розроблення інтелектуальних інформаційних систем здатних розпізнавати складні цифрові зображення, в тому числі, як показали проведені дослідження, він цілком придатний для створення інтелектуальних систем підтримки діагностичних рішень у стоматології. Метод має потенціал для впровадження у програмне забезпечення або мобільні додатки, спрямовані на автоматизований скринінг стоматологічних знімків, а подальші дослідження можуть бути орієнтовані на розширення навчальної вибірки, мультипатологічне навчання та адаптацію до інших типів рентгенівських даних.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2026 ВОЛОДИМИР РИБАК, ЮРІЙ ШАБАТУРА (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.