Речевые технологии

2024

Дата Темы Файлы/ссылки Задание
30.01.2024 Акустическая теория речеобразования Презентация
Скачать Praat
Записи фонетически представительного текста
Интерактивная таблица МФА
Интерактивная таблица МФА с МРТ
Вычислить значения первой и второй формант для ≥3 экземпляров ≥3 разных гласных (всего ≥9), занести в таблицу и построить график (характер графика на ваше усмотрение)
05.02.2024 Методы работы со звуковым сигналом Презентация
Ноутбук
sample.wav
Задание: найти в файлах фонетически представительного текста гласный звук, сонорный согласный звук и шумный согласный звук. Внутри каждого из них выбрать точку, а затем программным образом изобразить спектр для каждого из них и сохранить получившиеся картинки.
Задание со звёздочкой: изобразить LTAS (усреднённый спектр) для одного файла ФПТ, обработав его оконным методом.
13.02.2024 Автоматический синтез речи Презентация
Ноутбук
Сервис G2P онлайн
fpt.txt
fpt_transcription.txt
ru_g2p_ipa_bert_large (ноутбук)

russian_g2p
Russian MFA G2P model
Сгенерировать транскрипцию для фонетически представительного текста двумя способами, определить различия в нескольких предложениях с учётом разницы в используемых символах.
19.02.2024 Архитектуры синтеза: компилятивный и параметрический синтез Презентация
Записи фонетически представительного текста
fpt.txt
fpt_transcription.txt
  1. Взять слово из >= 3 слогов с сочетаниями согласных
  2. Написать транскрипцию
  3. По таблицам определить, какой аллофон какого звука нужно брать
  4. По транскрипции текста найти предложения, в которых есть нужные аллофоны
  5. Вырезать эти аллофоны в отдельные файлы
  6. Собрать из них слово
27.02.2024 Моделирование просодических характеристик Презентация
Ноутбук
fpt37
Пересадка интонационного контура с помощью parselmouth
04.03.2024 Автоматическое распознавание речи. Акустические признаки Презентация
Ноутбук
vowels01.zip
Классификация гласных по акустическим признакам
12.03.2024 Автоматическое распознавание речи. Языковые модели Презентация
opcorpora.txt
Реализация n-граммной языковой модели
18.03.2024 Автоматическое распознавание речи. Акустические модели. Декодер Презентация
Тестирование GMM для акустического моделирования

Список экзаменационных вопросов:

  1. Акустическая теория речеобразования
  2. Аналого-цифровое преобразование. Теорема Котельникова. Аудиоформаты
  3. Частотный анализ речевого сигнала
  4. Автоматический синтез речи - общие принципы. Типология. Оценка качества синтезируемой речи
  5. Предобработка текста для синтеза речи
  6. Компилятивный синтез. Аллофонный, дифонный, макросинтез, unit selection
  7. Параметрический синтез. Вокодер, формантный синтез, Tacotron
  8. Моделирование просодических характеристик для синтеза речи
  9. Автоматическое распознавание речи - общие принципы. Типология. Оценка качества АРР
  10. Акустические признаки для АРР
  11. Языковые модели для АРР и произносительный словарь
  12. Акустические модели для АРР
  13. Декодирование при АРР

Список литературы:

  1. Huang X., Acero A., Hon H.-W. Spoken Language Processing: A Guide to Theory, Algorithm, and System Development. : Prentice Hall PTR Upper Saddle River, NJ, USA, 2001.
  2. Jurafsky D., Martin J.H., Speech and Language Processing. Prentice Hall, 2009.
  3. Бондарко Л.В., Вербицкая Л. А., Гордина М.В. Основы общей фонетики. Учебное пособие. СПб., 2004, 160 с.
  4. Кодзасов С.В., О.В.Кривнова. Общая фонетика. М., 2001.
  5. Лобанов Б.М., Цирульник Л.И. Компьютерный синтез и клонирование речи. Минск, 2008.
  6. Тампель И.Б., Карпов А.А. Автоматическое распознавание речи. СПб: Университет ИТМО, 2016
  7. Фант Г. Акустическая теория речеобразования. Москва, 1964.

Подписывайтесь на соцсети нашей кафедры!
t.me/phonetics_spbu
vk.com/phonetics.spbu