Внимание! Материалы могут быть недоступны или обновлены на текущий учебный год.
| Дата | Темы | Файлы | Задание |
|---|---|---|---|
| Семестр 1 | |||
| 05.10.2022 | Чтение и запись файлов .wav: wav, wavio, scipy.io.wavfile | 🔒n1fpt1.wav | Написать программу, которая считывает файл .wav, делит его пополам и записывает половинки в новый стереофайл, каждую половинку в свой канал. |
| 12.10.2022 | Кодировки текстовых файлов: cp1251, utf-8 | Написать программу, которая изменяет кодировку текстового файла. | |
| 19.10.2022 | Устройство .seg-файла. Работа с файловыми системами: os, glob |
🔒cta_seg.zip | Написать программу, которая обрабатывает все файлы .seg_* в директории и создаёт произносительный словарь. |
| 26.10.2022 | Обработка сигнала окнами. Оконные фукнции. Вычисление спектра сигнала. matplotlib |
Написать программу, которая вычисляет динамическую спектрограмму и выводит её на экран. | |
| 02.11.2022 | Фильтры. Вычисление интенсивности. |
intensity.png | Написать программу, которая вычисляет интенсивность звукового сигнала и выводит на экран график. |
| 09.11.2022 | Аннотация .TextGrid. Работа с метками периодов ОТ. |
🔒cta0001.zip 🔒n1fpt1.wav 🔒n1fpt1.TextGrid 🔒n1fpt1.PointProcess |
Написать программу для преобразования .TextGrid и .PointProcess в .seg и наоборот. Вывести график ЧОТ на экран. |
| 15.11.2022 | Z-нормализация Вычисление длительности сегментов |
🔒cta_seg.zip result_example.png |
Написать программу, которая вычисляет длительности звуков по файлу .seg, проводит z-нормализацию и записывает метки звуков и информацию о нормализованной длительности в файл .TextGrid |
| 22.11.2022 | Детекция пауз | Написать программу, которая определяет паузы в речевом сигнале и отмечает их метками Praat или WaveAssistant | |
| 29.11.2022 | Автокорреляция | Написать программу, которая оценивает ЧОТ в сигнале с помощью функции автокорреляции | |
| Семестр 2 | |||
| 15.02.2023 | Основы matplotlib | d07_s02_maps_tempo.txt | Построить графики на основе данных из таблицы |
| 15.02.2023 | Доп. материал: чтение файлов csv | ||
| 01.03.2023 | Токенизация nltk |
Написать программу, разбивающую текст на предложения и слова | |
| 22.03.2023 | Стемминг Лемматизация |
Написать стеммер для кратких и полных прилагательных | |
| 29.03.2023 | Расстояние Левенштейна | Написать программу для вычисления расстояния Левенштейна | |
| 04.04.2023 | Исправление опечаток | fontanka_freqs.txt | Написать программу для исправления опечаток в слове |
| 05.04.2023 | N-граммы | conference_stud_2015.pkl conference_stud_2016.pkl |
Написать программу классификации текста по N-граммам |
| 12.04.2023 | Наивный Байесовский классификатор | Написать программу классификации текста с помощью НБК | |
| 26.04.2023 | Tf-idf | Написать программу поиска по набору текстов | |
Задания к экзамену
| Задание | Файлы | Подробно | Кто делает |
|---|---|---|---|
| Обработка звука | |||
| Вычисление мелодической деклинации |
cta0003.wav cta0003.seg_B1 cta0003.seg_Y1 cta0003.seg_R2 REAPER |
colab | |
| Вычисление динамической деклинации | colab | Даша | |
| Классификация гласных по спектрограммам | vowels_for_class | colab | |
| Обработка текста | |||
| Определение словосочетаний | colab | Маша | |
| Генерация текста по триграммам | colab | Кристина | |
| Дендрограмма фонемных инвентарей языков | phoible data | colab | |