СИСТЕМА АВТОМАТИЗОВАНОГО ОЗВУЧУВАННЯ З ЕЛЕМЕНТАМИ ШТУЧНОГО ІНТЕЛЕКТУ
DOI:
https://doi.org/10.31891/2307-5732-2023-321-3-115-119Ключові слова:
ASR, автоматичне розпізнавання мовлення, розпізнавання емоцій, перетворення тексту в мовлення, перетворення мовлення в текст, аналіз голосуАнотація
Автоматичне озвучування текстів вже давно не є новинкою серед користувачів. Проте при автоматизованому озвучуванні художніх текстів або при автоматизованому переозвучуванні аудіо з інших мов втрачається емоційна складова. Емоційне перетворення голосу з урахуванням статі мовця, особливостей мовлення тощо має на меті зберегти мовний зміст та ідентичність мовця. У цій статі запропоновано архітектуру системи автоматизованого переозвучування аудіо та відео з вбудованими класифікаторами визначення тональності тексу, емоційного забарвлення мовця та модуля опрацювання метаданих мовця для збереження його ідентичності. Розроблена архітектура стане основою подальших досліджень за даною тематикою.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2023 АНДРІЙ ДУМИН (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.