Внимание! Материалы могут быть недоступны или обновлены на текущий учебный год.
Дата | Темы | Файлы | Задание |
---|---|---|---|
Семестр 1 | |||
05.10.2022 | Чтение и запись файлов .wav: wav, wavio, scipy.io.wavfile | 🔒n1fpt1.wav | Написать программу, которая считывает файл .wav, делит его пополам и записывает половинки в новый стереофайл, каждую половинку в свой канал. |
12.10.2022 | Кодировки текстовых файлов: cp1251, utf-8 | Написать программу, которая изменяет кодировку текстового файла. | |
19.10.2022 | Устройство .seg-файла. Работа с файловыми системами: os, glob |
🔒cta_seg.zip | Написать программу, которая обрабатывает все файлы .seg_* в директории и создаёт произносительный словарь. |
26.10.2022 | Обработка сигнала окнами. Оконные фукнции. Вычисление спектра сигнала. matplotlib |
Написать программу, которая вычисляет динамическую спектрограмму и выводит её на экран. | |
02.11.2022 | Фильтры. Вычисление интенсивности. |
intensity.png | Написать программу, которая вычисляет интенсивность звукового сигнала и выводит на экран график. |
09.11.2022 | Аннотация .TextGrid. Работа с метками периодов ОТ. |
🔒cta0001.zip 🔒n1fpt1.wav 🔒n1fpt1.TextGrid 🔒n1fpt1.PointProcess |
Написать программу для преобразования .TextGrid и .PointProcess в .seg и наоборот. Вывести график ЧОТ на экран. |
15.11.2022 | Z-нормализация Вычисление длительности сегментов |
🔒cta_seg.zip result_example.png |
Написать программу, которая вычисляет длительности звуков по файлу .seg, проводит z-нормализацию и записывает метки звуков и информацию о нормализованной длительности в файл .TextGrid |
22.11.2022 | Детекция пауз | Написать программу, которая определяет паузы в речевом сигнале и отмечает их метками Praat или WaveAssistant | |
29.11.2022 | Автокорреляция | Написать программу, которая оценивает ЧОТ в сигнале с помощью функции автокорреляции | |
Семестр 2 | |||
15.02.2023 | Основы matplotlib | d07_s02_maps_tempo.txt | Построить графики на основе данных из таблицы |
15.02.2023 | Доп. материал: чтение файлов csv | ||
01.03.2023 | Токенизация nltk |
Написать программу, разбивающую текст на предложения и слова | |
22.03.2023 | Стемминг Лемматизация |
Написать стеммер для кратких и полных прилагательных | |
29.03.2023 | Расстояние Левенштейна | Написать программу для вычисления расстояния Левенштейна | |
04.04.2023 | Исправление опечаток | fontanka_freqs.txt | Написать программу для исправления опечаток в слове |
05.04.2023 | N-граммы | conference_stud_2015.pkl conference_stud_2016.pkl |
Написать программу классификации текста по N-граммам |
12.04.2023 | Наивный Байесовский классификатор | Написать программу классификации текста с помощью НБК | |
26.04.2023 | Tf-idf | Написать программу поиска по набору текстов |
Задания к экзамену
Задание | Файлы | Подробно | Кто делает |
---|---|---|---|
Обработка звука | |||
Вычисление мелодической деклинации |
cta0003.wav cta0003.seg_B1 cta0003.seg_Y1 cta0003.seg_R2 REAPER |
colab | |
Вычисление динамической деклинации | colab | Даша | |
Классификация гласных по спектрограммам | vowels_for_class | colab | |
Обработка текста | |||
Определение словосочетаний | colab | Маша | |
Генерация текста по триграммам | colab | Кристина | |
Дендрограмма фонемных инвентарей языков | phoible data | colab |