Программирование лингвистических задач

Назад

2024–2025

Материалы за 2022–2023 учебный год

Материалы за 2023–2024 учебный год

Чтобы посмотреть ноутбук к занятию, перейдите по ссылке в графе "Дата".

Домашние задания сдаются в виде скриптов .py.

Дата Темы Файлы Задание
Семестр 1
01.10.2024 Чтение и запись файлов .wav: wav, wavio, scipy.io.wavfile cta0001.wav
cta0001_stereo.wav
cta0001.sbl
Написать программу, которая:
1 Считывает файл .wav
2. Превращает его в стерео
3. В правый канал кладёт отсчёты левого в обратном порядке
4. Вставляет паузы 200 мс (или любое другое число, но явно прописанное в коде) на 1/4, 1/2 и 3/4 длительности
5. Записывает результат в новый файл.
08.10.2024 Чтение и запись файлов .seg 🔒cta0001.zip
cta0001.seg_B1
syllables_result_example.png
Написать программу, которая обрабатывает файл .seg_B1 (с границами звуков) и генерирует параллельный ему файл .seg_Y3, содержащий границы открытых слогов (по Бондарко)
15.10.2024 Работа с метками основного тона 🔒cta0001.zip
cta0001.pm
Написать программу, которая определяет границы каждого звонкого участка в файле по меткам ОТ и генерирует файл .TextGrid, содержащий интервалы, им соответствующие.
22.10.2024 Обработка сигнала окнами. Оконные фукнции.
Вычисление спектра сигнала. matplotlib
Написать программу, которая вычисляет динамическую спектрограмму и выводит её на экран.
29.10.2024 Фильтры cta0003.wav
cta0003.seg_B1
Написать программу, которая строит спектрограммы для каждого звука в сигнале с применением фильтра и без него.
05.11.2024 Вычисление интенсивности сигнала Написать программу, которая склеивает звуки в порядке убывания интенсивности.
12.11.2024 Библиотека parselmouth Написать программу, которая строит зависимость F2 от F1.
19.11.2024 Библиотека parselmouth II: read(), call() cta0001.wav
cta0001.seg_B1
kta0001.wav
kta0001.seg_B1
Написать программу, которая пересаживает мелодический контур.
26.11.2024 Вычисление частоты основного тона методом автокорреляции cta0001.wav
cta0001.seg_B1

Презентация (pdf)
Статья Praat
Написать программу, которая вычисляет ЧОТ.
10.12.2024 Введение в машинное обучение Реализовать классификатор гласных по формантам.
Семестр 2
12.02.2025 Токенизация
nltk
corpres_sample.txt
sibling_sample.txt
Написать программу, разбивающую текст на предложения и слова
19.02.2025 Стемминг
Лемматизация
Морфологический анализ
Написать стеммер для кратких и полных прилагательных
26.02.2025 Расстояние Левенштейна levenshtein_paper.pdf
fontanka_freqs.txt
Написать программу для вычисления расстояния Левенштейна
05.03.2025 Наивный Байесовский классификатор conference_stud_clean.pkl
conference_march.pkl
Написать программу классификации текста с помощью НБК
12.03.2024 N-граммы Презентация
Speech and Language Processing: N-grams
conference_stud_clean.pkl
conference_march.pkl
Написать программу классификации текста по N-граммам
19.03.2024 Tf-idf
16.04.2024 word2vec Написать программу поиска по набору текстов с помощью word2vec
23.04.2025 Закон Ципфа. Дендрограммы

Другие курсы:

Основы программирования (второй курс)

Разработка и реализация алгоритмов с использованием языка Python (третий курс)

Программирование на языке Python (магистратура)

Полезные ссылки:

Документация к языку Python

Основы программирования на Python (курс НИУ ВШЭ)

Google's Python Class

LeetCode: банк задач по программированию

Среды разработки:

Среда разработки PyCharm

Среда разработки Visual Studio Code

Среда разработки для начинающих Thonny

Jupyter Notebook

Google Colab

Список дополнительной литературы:

  1. Марк Лутц, Программирование на Python, 4-е изд., в 2-х т. Символ-Плюс, 2011
  2. Марк Лутц, Изучаем Python, 4-е изд., Символ-Плюс, 2011
  3. Б. Керниган, Р. Пайк, Практика программирования, Невский диалект, 2001

Подписывайтесь на соцсети нашей кафедры!
t.me/phonetics_spbu
vk.com/phonetics.spbu