Перейти к полному списку специальных курсов кафедры
Полугодовой спецкурс "Математические основы распознавания речи"
Спецкурс адресован студентам, интересующимся практическими приложениями математики в
области создания компьютерных систем автоматического анализа звучащей речи и
естественно-языковых математических моделей при анализе электронных текстов.
Программа курса:
- Акустика звука и речи (распространение звука в воздухе, шумы, помехи, реверберация и т.п.) Речевой и слуховой аппараты человека, математические модели речеобразования и восприятия речи. Основной тон, форманты. Основы цифровой фильтрации.
- Речевой сигнал, дискретизация, теорема Котельникова. Спектр сигнала и преобразование Фурье. Параметризация речевого сигнала: типы параметров (БПФ, КЛП, КЕПСТР и т.п.), критерии и методы выбора оптимального набора параметров.
- Фонетическая теория речи. Постановка задачи распознавания речи (дискретный и слитный случаи, дикторозависимость, обучение и др.). Структурная схема распознавателя слитной речи.
- Задача акустического распознавания речи. Подходы: скрытых марковских моделей (СММ), динамической деформации времени (ДДВ).
- Методы СММ и ДДВ. Подробное описание, постановки задач и методы их решения.
- Монофоны, трифоны, трифонная транскрипция, внутрисловные и межсловные трифоны, гауссовы смеси. Задачи обучения параметров СММ для трифонов, синтеза СММ для слов и предложений естественного языка. Бинарные деревья решений как инструмент для связывания состояний СММ.
- Компьютерные математические пакеты (RPL, SPL, IPPS, HTK) и их применение для построения систем распознавания речи. Задачи оптимизации алгоритмов распознавания (по времени и памяти) на акустическом уровне и подходы к их практическому решению.
- Задача подбора фонетического алфавита. Метрика на множестве вероятностных автоматов.
- Декодирование дерева гипотез: языковые модели, их применение в системах распознавания. Обучение моделей. Коэффициент неопределенности. Статистическая языковая модель русского языка.
- Текстовые и речевые базы данных, задачи их обработки и обучения речевых и языковых моделей на их основе. Фонетически богатые тексты, трифонное покрытие, разметка.
- Русский речевой распознаватель и перспективы его создания. Другие практические задачи в области математической теории распознавания речи.
Более подробно о тематике курса можно прочитать в разделе "Распознавание речи"
Наверх
|