ПЕРСПЕКТИВИ ВИКОРИСТАННЯ ТА ОЦІНКА ШВИДКОДІЇ БІБЛІОТЕКИ MLPACK В ЗАДАЧАХ ОБРОБКИ ДАНИХ ДИСТАНЦІЙНОГО ЗОНДУВАННЯ ЗЕМЛІ
DOI:
https://doi.org/10.31891/Ключові слова:
mlpack, scikit-learn, Sentinel-2, Random Forest, машинне навчання, класифікація з вчителемАнотація
У статті проводиться огляд реалізації та порівняння швидкодії певних алгоритмів машинного навчання сучасними бібліотеками – mlpack та scikit-learn. Розглянуті алгоритм пошуку k-найближчих сусідів (k-NN) та класифікація з вчителем за алгоритмом випадкового лісу (Random Forest). В якості прикладу датасету для порівняння алгоритму k-NN пошуку обраний датасет Covertype з відомого репозиторію університету Каліфорнії в Ірвайні. Датасет для порівняння швидкодії класифікації на базі алгоритму Random Forest власно створений на основі мультиспектральних даних космозйомки, отриманих з апарату дистанційного зондування Землі Sentinel-2A. Наведені певні особливості використання mlpack та іншої бібліотеки Armadillo, яку використовує mlpack. Зокрема описуються особливості завантаження форматованих даних функціями цієї бібліотеки. В роботі розглянутий процес підготовки датасету для навчання класифікатору. Наведені узагальнені кроки обробки наборів даних для навчання, наведений перелік типів земного покриття території зйомки та пропонуються рішення, щодо покращення розділення даних у просторі ознак. У статті наведена точність класифікації з вчителем алгоритмом Random Forest із певними гіперпараметрами моделі та дана оцінка часу на тренування і класифікацію набору даних для тестування. Дані для тестування склали 20% від загальної кількості даних сформованого за певними ознаками датасету. Результатами дослідження виступає час класифікації у програмах, які створені мовами програмування C++ та Python і які використовують відповідно бібліотеки mlpack та scikit-learn.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2025 ІГОР ГАРКУША, ДЕНИС ІВАНОВ (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.