Автоматическое распознавание речи

Назад

Материалы за 2023–2024 учебный год

Дата Темы Материалы Задание
Лекции
12.02.2025 Введение Презентация (pdf)
19.02.2025 Акустические признаки Презентация (pdf)
26.02.2024 Акустические модели Презентация (pdf)
05.03.2025 Языковые модели Презентация (pdf)

Список вопросов к экзамену:

  1. Системы АРР. Типология, области применения, основные подходы к построению систем АРР.
  2. Архитектура системы АРР.
  3. Обработка речевого сигнала. Методы описания и формы представления речевого сигнала.
  4. Акустические характеристики речевого сигнала, используемые для АРР. MFCC, PLP, LPC.
  5. Стохастические модели, используемые в АРР. СММ, конечные преобразователи.
  6. Скрытые Марковские модели. Оценка, обучение и распознавание.
  7. Акустическое моделирование. Кластеризация состояний. Гибридные модели.
  8. Произносительные словари. Автоматическая транскрипция.
  9. Языковые модели. N-граммы. Проблемы, возникающие при использовании n-грамм, пути решения проблем. Другие методы моделирования языка.
  10. Алгоритмы поиска правильного решения. Интеграция моделей. Обработка внесловарных слов.
  11. Нейросетевые методы в распознавании речи. wav2vec, трансформеры.

Список литературы:

  1. Бондарко Л.В. Осциллографический анализ речи. Изд. ЛГУ, 1965.
  2. Бондарко Л.В., Вербицкая Л.А., Гордина М.В. Основы общей фонетики. Учебное пособие. СПб., 2004, 160 с.
  3. Кодзасов С.В., Кривнова О.В. Общая фонетика. М., 2001.
  4. Ли У. (ред.), Методы автоматического распознавания речи. М. 1983.
  5. Сергиенко А.Б. Цифровая обработка сигналов. М., 2003.
  6. Скрелин П.А. Фонетические аспекты речевых технологий. СПб, 1999.
  7. Тампель И.Б., Карпов А.А. Автоматическое распознавание речи. СПб: Университет ИТМО, 2016
  8. Фант Г. Акустическая теория речеобразования. Москва, 1964.
  9. Фант Г. Анализ и синтез речи. Новосибирск, 1970.
  10. Фланаган Д. Анализ, синтез и восприятие речи. М. 1968 г.
  11. Якобсон, Г. Фант, М. Халле, Введение в анализ речи // «Но­вое в лингвистике». II., М., 1962.
  12. Duda R.O., Hart P.E., Stork D.G., Pattern Classification. 2nd ed., J. Wiley & Sons, New York, NY, 2001.
  13. Huang X., Acero A., Hon H.-W. Spoken Language Processing: A Guide to Theory, Algorithm, and System Development. : Prentice Hall PTR Upper Saddle River, NJ, USA, 2001.
  14. Jurafsky D., Martin J.H., Speech and Language Processing. Prentice Hall, 2009.

Подписывайтесь на соцсети нашей кафедры!
t.me/phonetics_spbu
vk.com/phonetics.spbu