English version of this page
На главную страницу
Официальный сайт кафедры Математической теории интеллектуальных систем и
лаборатории Проблем теоретической кибернетики
механико-математического факультета МГУ им. М. В. Ломоносова
На первую страницу сайта Новости Кафедра Сотрудники Учеба Наука Исследования Журнал Культура Полнотекстовый поиск по серверу

Сотрудники :: Бабин Дмитрий Николаевич :: Публикации Бабина Д.Н.

Об автоматическом исправлении неправильного произношения иностранных слов

Алисейчик П.А., Бабин Д.Н., Мазуренко И.Л.
Кафедра Математической теории интеллектуальных систем

Вводится постановка задачи об автоматическом исправлении неправильного произношения иностранных слов. Описывается работа автоматической системы по построению упражнений учителем. Приводятся алгоритмы разбиения звуковых данных на фонемы и анализа правильности произношения ученика. Объясняется необходимость настройки на голос учителя и ученика. Приводятся некоторые характеристики обучающей системы.

 

В последнее время появилось большое число систем автоматического обучения иностранным языкам с возможностью демонстрации видео- и аудиоинформации и вводом речи ученика. Узким местом таких обучающих систем является отсутствие в них оценки правильности произношения, а также локализации ошибок произношения. Сложность задачи объясняется большим разнообразием одинаково правильных произношений у разных дикторов, разными условиями записи речи и наличием большого количества типов ошибок произнесения: от неправильного ударения, интонирования до неправильного произнесения отдельных звуков, что обычно вызвано отсутствием большинства звуков иностранного языка в родном языке ученика. Тем самым, решение этой задачи требует работы с речью на уровне, не зависящем от диктора и допускающем неточное произнесение звуковых фраз.

Авторы предлагают работающий вариант системы, позволяющей ученику объективно оценить степень правильности своего произношения, классифицировать ошибки и в режиме диалога прослушать разницу произношений неправильных звуков.

Работа системы происходит следующим образом.

Для обеспечения независимости функционирования алгоритма от голоса учителя и ученика система в естественном режиме речевого диалога на родном для пользователя языке определяет объективные параметры его речи. Эти параметры в дальнейшем используются для преобразования характеристик звукового сигнала к специальному виду, инвариантному относительно типа голоса пользователя.

Подготовка упражнения учителем предполагает специальную обработку звуковых образов слов. Учитель разбивает звуковой сигнал на фрагменты, соответствующие фонемам языка. После расчета системой специальных параметров этих фрагментов (громкость, интонация, темп и правильность произнесения) учитель устанавливает допустимые отклонения всех параметров. Например, установка допустимых отклонений всех параметров всех фрагментов, кроме одного, в бесконечность, приведет к тому, что система будет контролировать произношение учеником только одной фонемы в фразе.

Общение системы с учеником происходит в автоматическом режиме. После прослушивания звуковой фразы, записанной учителем, ученик повторяет ее. Система считает специальные инвариантные относительно типа голоса характеристики записанной фразы ученика и автоматически разбивает ее на звуковые фрагменты, соответствующие фонемам иностранного языка, используя известный метод динамического программирования [1]. После этого ученик имеет возможность оценить правильность произношения каждого фрагмента на слух и визуально. Недопустимое отклонение какой-либо кривой ученика, характеризующей громкость, интонацию, темп или правильность произнесения им отдельного звукового фрагмента, от соответствующей кривой учителя означает ошибку произнесения этого фрагмента.

Испытания системы проводились для обучения более чем 10 русских учеников английскому языку на словах и фразах, содержащих английские звуки th(this), th(think), ng(ring), r(rest), h(hello), t(ten), d(desk), w(wall), не имеющих достаточно близких аналогов в русском языке. Вероятность ошибки при разбиении слов ученика на фрагменты составила в среднем 0.05, вероятность определения ложной ошибки при правильном произнесении составила 0.04, вероятность не обнаружения явной ошибки в произнесении составила 0.1.

Работа выполнялась на кафедре Математической теории интеллектуальных систем механико-математического факультета МГУ им.М.В.Ломоносова.

 

Литература.

[1] Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. Киев: Навукова думка, 1987, 264 с. (на русском языке)

Материалы 2-й международной конференции по дистанционному образованию в России "Открытое и дистанционное обучение – стратегия развития. Москва, 1996 г.

Наверх

   © 2001-2015 г. Кафедра Математической теории интеллектуальных систем, лаборатория Проблем теоретической кибернетики Написать вебмастеру   
XWare
 Полнотекстовый поиск
 
Только точная форма слов      Выводить по результатов на странице
Rambler's Top100 Рейтинг@Mail.ru