Статья 5421
Название статьи |
СПОСОБ СЕГМЕНТАЦИИ РЕЧЬ/ПАУЗА НА ОСНОВЕ ЭНЕРГЕТИЧЕСКОГО ОПЕРАТОРА ТИГЕРА
|
Авторы |
Алан Казанферович Алимурадов, кандидат технических наук, директор студенческого научно-производственного бизнес-инкубатора, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40), E-mail: alansapfir@yandex.ru
|
Индекс УДК |
004.934
|
DOI
|
10.21685/2227-8486-2021-4-5
|
Аннотация |
Актуальность и цели. Сегментация речи на вокализованные, невокализованные участки и паузы является основной задачей практически для всех речевых приложений. Особенно это важно в системах оценки психоэмоционального состояния человека по речи, так как длительности вокализованных, невокализованных участков и пауз являются информативными параметрами, релевантными естественно выраженным эмоциям человека. Материалы и методы. Использовался дифференциальный энергетический оператор Тигера 2-го порядка, обладающий хорошей восприимчивостью к изменению амплитуды и частоты сигнала. Способ реализован посредством программы © Matlab (MathWorks). Результаты. Разработан способ сегментации речь/пауза, суть которого заключается в линейном разделении речевого сигнала на фрагменты, вычислении энергетической характеристики с помощью энергетического оператора Тигера, вычислении значений кратковременной энергии и определении статуса «речь/пауза» фрагментов на основе рассчитанных пороговых значений кратковременной энергии. Проведено исследование разработанного способа, в рамках которого оценивалась эффективность сегментации речь/пауза в сравнении с классическим способом на основе анализа кратковременной энергии. Выводы. В соответствии с полученными результатами исследований отмечается повышение эффективности сегментации речь/пауза на 5,26 % и 5,51 % для ошибок 1-го и 2-го рода соответственно. Предложенный способ сегментации речь/пауза может успешно тестироваться в системах оценки психоэмоционального состояния человека, так как обладает хорошей восприимчивостью к резким изменениям амплитуды и частоты сигнала в условиях нестабильной моторики речевого аппарата.
|
Ключевые слова
|
обработка речевых сигналов, сегментация речи, вокализованная и невокализованная речь, кратковременная энергия, энергетический оператор Тигера
|
 |
Скачать статью в формате PDF
|
Для цитирования |
Алимурадов А. К. Способ сегментации речь/пауза на основе энергетического оператора Тигера // Модели, системы, сети в экономике, технике, природе и обществе. 2021. No 4. С. 52–63. doi:10.21685/2227-8486-2021-4-5
Ссылка для цитирования на английском языке.
|
Дата создания: 16.12.2021 10:33
Дата обновления: 06.04.2022 12:41