СЕГМЕНТАЦІЯ ЗОБРАЖЕНЬ РАН НА ШКІРІ ЛЮДИНИ ЗА ДОПОМОГОЮ ЗГОРТКОВИХ НЕЙРОННИХ МЕРЕЖ
DOI:
https://doi.org/10.31891/2307-5732-2024-339-4-56Ключові слова:
аналіз зображень, глибоке навчання, згорткові нейронні мережі, семантична сегментація, сегментація ран, аналіз медичних зображень, U-Net, DeeplabV3, LRASPP, PyTorchАнотація
Це дослідження спрямоване на підвищення точності та ефективності сегментації зображень ран на шкірі людини за допомогою згорткових нейронних мереж (ЗНМ). Точна сегментація ран є важливою для ефективного лікування та моніторингу в медицині. Ми оцінили та порівняли сучасні архітектури ЗНМ, зосередившись на U-Net та моделях, оптимізованих для використання на мобільних пристроях, таких як DeeplabV3 та LRASPP.
Ми використовували набір даних Foot Ulcer Segmentation Challenge у різних умовах, включаючи попередньо навчені моделі та моделі з випадковими вагами, із різною стандартизацією вхідних даних та без неї. Бібліотека PyTorch та хмарне середовище Google Colaboratory PRO були використані для розробки, навчання, валідацію та тестування моделей.
Результати показали, що U-Net стабільно досягає високих значень індексу Дайса, особливо при використанні попередньо навчених ваг зі стандартизацією даних із найвищим значенням 0,875. LRASPP також показала хороші результати, особливо при використанні попередньо-навчених ваг, але з дещо нижчими оцінками метрики Дайса, ніж U-Net. DeeplabV3 значно відстала від інших моделей за точністю сегментації. Попередньо навчені моделі, стандартизовані на основі середнього значення та стандартного відхилення нового набору даних, показали кращі результати, ніж моделі, стандартизовані на основі статистики попереднього набору даних.
Аналіз кривих функцій втрат при навчанні та валідації виявив потенційне перенавчання моделей U-Net та DeeplabV3, про що свідчать флуктуації функцій втрат на валідаційному наборі даних. Ми пропонуємо інтегрувати методи регуляризації та стратегії доповнення даних для вирішення цієї проблеми та покращення узагальнення. Крім того, налаштування гіперпараметрів моделей та використання шарів BatchNormalization для U-Net може допомогти зменшити перенавчання.
Результати показують, що U-Net є хорошим вибором для задач сегментації ран, особливо за умови попереднього навчання і належної стандартизації вхідних даних. Для застосування на мобільних пристроях LRASPP демонструє значний потенціал. Подальша робота повинна вдосконалити ці моделі для мобільного розгортання, забезпечуючи надійні та ефективні результати.