МЕТОДОЛОГІЯ КЛАСИФІКАЦІЇ ЦИФРОВИХ АУДІО-СИГНАЛІВ НА ОСНОВІ ЗГОРТКОВИХ НЕЙРОННИХ МЕРЕЖ

ДМИТРО МОГИЛЕВИЧ; РОМАН ХМІЛЬ

doi:10.31891/2307-5732-2025-359-132

Автор(и)

ДМИТРО МОГИЛЕВИЧ КПІ ім. Ігоря Сікорського Автор https://orcid.org/0000-0002-4323-0709
РОМАН ХМІЛЬ КПІ ім. Ігоря Сікорського Автор https://orcid.org/0009-0001-6839-4152

DOI:

https://doi.org/10.31891/2307-5732-2025-359-132

Ключові слова:

штучний інтелект, згорткові нейронні мережі, обробка аудіосигналів

Анотація

Розвиток засобів телекомунікації, мережі інтернет, соціальних мереж, та поширення різноманітних мобільних пристроїв запису аудіо- та відео-інформації призводить до вибухового зростання кількості мультимедійних даних, зокрема, аудіо-файлів. Прикладом звукових даних є записи звуків різноманітного походження, відео з камер спостереження та відео-реєстраторів, мобільних телефонів тощо. Тому виникає потреба у автоматизації пошуку, розпізнавання, ідентифікації та класифікації аудіо-візуальної інформації.

У даній статті описується методологія ідентифікації та класифікації автомобільних аварій на основі їх аудіо-сигналів та математичного апарату згорткових нейронних мереж. Основною задачею розробленої методології є підвищення точності класифікації аварій, та покращення енерго-ефективності методів та алгоритмів, що для цього використовуються, з метою забезпечення їх роботи у режимі реального часу на мобільних та периферійних пристроях з обмеженими обчислювальними потужностями. Актуальність даної задачі пов’язана з сучасними вимогами до безпеки автомобілів та запровадження країнами Європейського Союзу та США вимог до обладнання усіх нових автомобілів системами автоматичного сповіщення про аварії (ACN ‒ Automatic Crash Notification,). Оскільки реагування екстрених служб на такі повідомлення надзвичайно дорого-вартісне, виникає завдання підвищення точності методик аналізу дорожніх подій.

На сьогоднішній день більшість авто-виробників використовують для цього датчики акселерометрів. Проте, використання виключно даних про прискорення часто призводить до помилкових класифікацій: ями на дорозі визначаються як аварія, тоді як удар ззаду може бути класифікований як нормальне прискорення. В результаті середня точність таких методик не перевищує 85%, що прийнятно, однак вимагає подальшого удосконалення. Останніми роками з’явилася значна кількість сучасних досліджень, котрі пропонують використовувати згорткові нейронні мережі для класифікації аудіо-сигналів аварійних подій. Ефективність таких підходів суттєво вища та знаходиться на рівні 85%-95%. Найкращі результати у 96% було досягнуто авторами [9], котрі використали ансамбль з трьох згорткових нейронних мереж. Проте такий підхід є досить енерго-витратним і не може бути використаний для класифікації аварій у режимі реального часу на периферійних пристроях з обмеженими обчислювальними можливостями.

У даній статті описується методологія класифікації автомобільних аварій на основі використання згорткових нейронних мереж шляхом класифікації аудіо-сигналів, котра забезпечує високу точність класифікації на рівні 98% та є при цьому енерго-ефективною у порівнянні з іншими існуючими підходами.

МЕТОДОЛОГІЯ КЛАСИФІКАЦІЇ ЦИФРОВИХ АУДІО-СИГНАЛІВ НА ОСНОВІ ЗГОРТКОВИХ НЕЙРОННИХ МЕРЕЖ

Автор(и)

DOI:

Ключові слова:

Анотація

Завантаження

Опубліковано

Номер

Розділ

Ліцензія

Як цитувати

Мова

Зробити подання

Індексування

Авторам

Прапор