Автоматическое распознавание речи
Назад
Материалы за 2023–2024 учебный год
Список вопросов к экзамену:
- Системы АРР. Типология, области применения, основные подходы к построению систем АРР.
- Архитектура системы АРР.
- Обработка речевого сигнала. Методы описания и формы представления речевого сигнала.
- Акустические характеристики речевого сигнала, используемые для АРР. MFCC, PLP, LPC.
- Стохастические модели, используемые в АРР. СММ, конечные преобразователи.
- Скрытые Марковские модели. Оценка, обучение и распознавание.
- Акустическое моделирование. Кластеризация состояний. Гибридные модели.
- Произносительные словари. Автоматическая транскрипция.
- Языковые модели. N-граммы. Проблемы, возникающие при использовании n-грамм, пути решения проблем. Другие методы моделирования языка.
- Алгоритмы поиска правильного решения. Интеграция моделей. Обработка внесловарных слов.
- Нейросетевые методы в распознавании речи. wav2vec, трансформеры.
Список литературы:
- Бондарко Л.В. Осциллографический анализ речи. Изд. ЛГУ, 1965.
- Бондарко Л.В., Вербицкая Л.А., Гордина М.В. Основы общей фонетики. Учебное пособие. СПб., 2004, 160 с.
- Кодзасов С.В., Кривнова О.В. Общая фонетика. М., 2001.
- Ли У. (ред.), Методы автоматического распознавания речи. М. 1983.
- Сергиенко А.Б. Цифровая обработка сигналов. М., 2003.
- Скрелин П.А. Фонетические аспекты речевых технологий. СПб, 1999.
- Тампель И.Б., Карпов А.А. Автоматическое распознавание речи. СПб: Университет ИТМО, 2016
- Фант Г. Акустическая теория речеобразования. Москва, 1964.
- Фант Г. Анализ и синтез речи. Новосибирск, 1970.
- Фланаган Д. Анализ, синтез и восприятие речи. М. 1968 г.
- Якобсон, Г. Фант, М. Халле, Введение в анализ речи // «Новое в лингвистике». II., М., 1962.
- Duda R.O., Hart P.E., Stork D.G., Pattern Classification. 2nd ed., J. Wiley & Sons, New York, NY, 2001.
- Huang X., Acero A., Hon H.-W. Spoken Language Processing: A Guide to Theory, Algorithm, and System Development. : Prentice Hall PTR Upper Saddle River, NJ, USA, 2001.
- Jurafsky D., Martin J.H., Speech and Language Processing. Prentice Hall, 2009.
Подписывайтесь на соцсети нашей кафедры!
t.me/phonetics_spbu
vk.com/phonetics.spbu