МУЛЬТИМОДАЛЬНЕ РОЗПІЗНАВАННЯ МОВЛЕННЯ НА ОСНОВІ ЗВУКОВИХ І ТЕКСТОВИХ ДАНИХ

Автор(и)

DOI:

https://doi.org/10.31891/2307-5732-2022-311-4-22-25

Ключові слова:

машинний переклад, глибоке навчання, рекурентні нейронні мережі, продуктивність, keras, pytorch, sequence-to-sequence

Анотація

Глибоке навчання повністю змінило підхід до машинного перекладу. Дослідники в галузі глибокого навчання створили прості рішення на основі машинного навчання, які перевершують найкращі експертні системи. У цій роботі розглянуто основні особливості машинного перекладу на основі рекурентних нейронних мереж. У статті також висвітлено переваги систем на основі RNN, що використовують модель послідовності до послідовності, порівняно зі статистичними системами трансляції. Дві системи машинного перекладу, засновані на моделі послідовності до послідовності, були створені з використанням бібліотек машинного навчання Keras і PyTorch. На основі отриманих результатів проведено аналіз бібліотек та порівняння їх продуктивності.

Завантаження

Опубліковано

27.10.2022

Як цитувати

БАСИСТЮК, О., & МЕЛЬНИКОВА, Н. (2022). МУЛЬТИМОДАЛЬНЕ РОЗПІЗНАВАННЯ МОВЛЕННЯ НА ОСНОВІ ЗВУКОВИХ І ТЕКСТОВИХ ДАНИХ. Herald of Khmelnytskyi National University. Technical Sciences, 313(5), 22-25. https://doi.org/10.31891/2307-5732-2022-311-4-22-25