МЕТОДОЛОГІЯ КЛАСИФІКАЦІЇ ЦИФРОВИХ АУДІО-СИГНАЛІВ НА ОСНОВІ ЗГОРТКОВИХ НЕЙРОННИХ МЕРЕЖ
DOI:
https://doi.org/10.31891/10.31891/2307-5732-2025-359-132Ключові слова:
штучний інтелект, згорткові нейронні мережі, обробка аудіосигналівАнотація
Розвиток засобів телекомунікації, мережі інтернет, соціальних мереж, та поширення різноманітних мобільних пристроїв запису аудіо- та відео-інформації призводить до вибухового зростання кількості мультимедійних даних, зокрема, аудіо-файлів. Прикладом звукових даних є записи звуків різноманітного походження, відео з камер спостереження та відео-реєстраторів, мобільних телефонів тощо. Тому виникає потреба у автоматизації пошуку, розпізнавання, ідентифікації та класифікації аудіо-візуальної інформації.
У даній статті описується методологія ідентифікації та класифікації автомобільних аварій на основі їх аудіо-сигналів та математичного апарату згорткових нейронних мереж. Основною задачею розробленої методології є підвищення точності класифікації аварій, та покращення енерго-ефективності методів та алгоритмів, що для цього використовуються, з метою забезпечення їх роботи у режимі реального часу на мобільних та периферійних пристроях з обмеженими обчислювальними потужностями. Актуальність даної задачі пов’язана з сучасними вимогами до безпеки автомобілів та запровадження країнами Європейського Союзу та США вимог до обладнання усіх нових автомобілів системами автоматичного сповіщення про аварії (ACN ‒ Automatic Crash Notification,). Оскільки реагування екстрених служб на такі повідомлення надзвичайно дорого-вартісне, виникає завдання підвищення точності методик аналізу дорожніх подій.
На сьогоднішній день більшість авто-виробників використовують для цього датчики акселерометрів. Проте, використання виключно даних про прискорення часто призводить до помилкових класифікацій: ями на дорозі визначаються як аварія, тоді як удар ззаду може бути класифікований як нормальне прискорення. В результаті середня точність таких методик не перевищує 85%, що прийнятно, однак вимагає подальшого удосконалення. Останніми роками з’явилася значна кількість сучасних досліджень, котрі пропонують використовувати згорткові нейронні мережі для класифікації аудіо-сигналів аварійних подій. Ефективність таких підходів суттєво вища та знаходиться на рівні 85%-95%. Найкращі результати у 96% було досягнуто авторами [9], котрі використали ансамбль з трьох згорткових нейронних мереж. Проте такий підхід є досить енерго-витратним і не може бути використаний для класифікації аварій у режимі реального часу на периферійних пристроях з обмеженими обчислювальними можливостями.
У даній статті описується методологія класифікації автомобільних аварій на основі використання згорткових нейронних мереж шляхом класифікації аудіо-сигналів, котра забезпечує високу точність класифікації на рівні 98% та є при цьому енерго-ефективною у порівнянні з іншими існуючими підходами.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2025 ДМИТРО МОГИЛЕВИЧ, РОМАН ХМІЛЬ (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.