Перейти к полному списку специальных курсов кафедры

Полугодовой спецкурс "Математические основы распознавания речи"

Спецкурс адресован студентам, интересующимся практическими приложениями математики в области создания компьютерных систем автоматического анализа звучащей речи и естественно-языковых математических моделей при анализе электронных текстов.

Программа курса:

  1. Акустика звука и речи (распространение звука в воздухе, шумы, помехи, реверберация и т.п.) Речевой и слуховой аппараты человека, математические модели речеобразования и восприятия речи. Основной тон, форманты. Основы цифровой фильтрации.
  2. Речевой сигнал, дискретизация, теорема Котельникова. Спектр сигнала и преобразование Фурье. Параметризация речевого сигнала: типы параметров (БПФ, КЛП, КЕПСТР и т.п.), критерии и методы выбора оптимального набора параметров.
  3. Фонетическая теория речи. Постановка задачи распознавания речи (дискретный и слитный случаи, дикторозависимость, обучение и др.). Структурная схема распознавателя слитной речи.
  4. Задача акустического распознавания речи. Подходы: скрытых марковских моделей (СММ), динамической деформации времени (ДДВ).
  5. Методы СММ и ДДВ. Подробное описание, постановки задач и методы их решения.
  6. Монофоны, трифоны, трифонная транскрипция, внутрисловные и межсловные трифоны, гауссовы смеси. Задачи обучения параметров СММ для трифонов, синтеза СММ для слов и предложений естественного языка. Бинарные деревья решений как инструмент для связывания состояний СММ.
  7. Компьютерные математические пакеты (RPL, SPL, IPPS, HTK) и их применение для построения систем распознавания речи. Задачи оптимизации алгоритмов распознавания (по времени и памяти) на акустическом уровне и подходы к их практическому решению.
  8. Задача подбора фонетического алфавита. Метрика на множестве вероятностных автоматов.
  9. Декодирование дерева гипотез: языковые модели, их применение в системах распознавания. Обучение моделей. Коэффициент неопределенности. Статистическая языковая модель русского языка.
  10. Текстовые и речевые базы данных, задачи их обработки и обучения речевых и языковых моделей на их основе. Фонетически богатые тексты, трифонное покрытие, разметка.
  11. Русский речевой распознаватель и перспективы его создания. Другие практические задачи в области математической теории распознавания речи.

Более подробно о тематике курса можно прочитать в разделе "Распознавание речи"

Наверх