СЕГМЕНТАЦІЯ ТА КЛАСИФІКАЦІЯ ЗОБРАЖЕНЬ З ВИКОРИСТАННЯМ SLIC SUPERPIXEL У ЛІСОВОМУ СЕРЕДОВИЩІ
DOI:
https://doi.org/10.31891/2307-5732-2024-345-6-9Ключові слова:
безпілотні літальні апарати, згорткові нейронні мережі, сегментація лісових масивів, виявлення об'єктів, семантична сегментаціяАнотація
Безпілотні літальні апарати (БПЛА) стали невід’ємним інструментом для збирання високоточних геопросторових даних завдяки своїй доступності, мобільності та можливості забезпечувати надзвичайно високу деталізацію. На відміну від традиційних систем дистанційного зондування, таких як супутники або авіаційні платформи, БПЛА дозволяють проводити спостереження на локальних територіях із високою частотою повторного збору даних. Це відкриває нові можливості для моніторингу змін у довкіллі, аналізу землекористування та ідентифікації окремих об’єктів, таких як дерева, завдяки надзвичайно високій роздільній здатності отриманих зображень.
Дослідження зосереджене на автоматизованій ідентифікації дерев у межах лісового масиву, представленого у вигляді ортофотоплану, створеного на основі 255 зображень високої роздільної здатності. Основним методом обробки даних є цифрова суперпіксельна сегментація з використанням алгоритму простої лінійної ітеративної кластеризації (SLIC). Цей підхід дозволяє групувати пікселі в компактні регіони (суперпікселі), які характеризуються однорідними текстурними або кольоровими властивостями, що значно спрощує подальшу класифікацію. Для дослідження було обрано три різні конфігурації сегментації: 2000, 3000 і 4000 суперпікселів. Параметри алгоритму, такі як масштаб згладжування σ = 5 та компактність = 10, були підібрані для забезпечення оптимальної якості сегментації.
Класифікація суперпікселів проводилася за допомогою архітектури глибокої згорткової нейронної мережі ResNet-50. Ця модель попередньо навчалася на великому наборі зображень для розпізнавання загальних текстур і форм, після чого її ваги адаптувалися для класифікації дерев і фону на основі нового набору даних суперпіксельних зображень. Такий підхід, який поєднує попереднє навчання моделі та перенесення знань, дозволив значно підвищити точність класифікації.
У ході експериментів було визначено, що найкраща продуктивність досягнута при сегментації 3000 суперпікселів, де точність класифікації становила 87%. Це свідчить про оптимальний баланс між деталізацією сегментації та здатністю моделі точно розпізнавати об’єкти. Застосування меншої кількості суперпікселів призводило до втрати дрібних деталей, тоді як надмірна деталізація збільшувала обчислювальні витрати та погіршувала результати через недостатню чіткість об’єктів.