Skip to Content

УСЛЫШАТЬ ПО-УДМУРТСКИ

Ученые Удмуртского федерального исследовательского центра Уральского отделения Российской академии наук разработли синтезатор удмуртской речи, позволяющий преобразовывать любой печатный текст на удмуртском языке в стандартный звуковой файл, который можно прослушать на компьютере, телефоне, смартфоне или любом другом подобном цифровом устройстве.
Эта работа — итог взаимодействия сотрудников двух научных подразделений УдмФИЦ УрО РАН: лингвистов Удмуртского института истории, языка и литературы и специалистов в области искусственного интеллекта лаборатории машинного обучения и обработки «больших» данных производственных киберсистем. Такой результат стал возможным благодаря созданному учеными УдмФИЦ УрО РАН в 2019 году Национальному корпусу удмуртского языка, позволяющему широко использовать удмуртский в компьютерных технологиях (распознавателях и синтезаторах речи, навигаторах, автоматических переводчиках и т.д.).
Синтезатор удмуртской речи разработан на основе глубокой нейронной сети Tacotron. Для обучения нейросети были задействованы мощные ресурсы вычислительного кластера Института математики и механики УрО РАН (Екатеринбург) и использованы специально подготовленные тексты, озвученные Светланой Пикулевой — профессиональной ведущей радио «Моя Удмуртия». Таким образом, удмуртская речь, сгенерированная синтезатором, воспроизводится сегодня голосом известной радиоведущей.
— Пока мы говорим только о первой версии синтезатора, — рассказывает младший научный сотрудник лаборатории машинного обучения и обработки «больших» данных производственных киберсистем УдмФИЦ УрО РАН Григорий Григорьев. — Данная нейронная сеть проста и хорошо обучаема. Она выдает приемлемый результат, но, возможно, пока еще не такой совершенный и естественный. Например, по синтезированным нейронной сетью предложениям на удмуртском языке можно определить, что говорит не человек, а программа. В дальнейшем мы планируем использовать более совершенную нейронную сеть следующего поколения, которая сможет генерировать искусственный голос, неотличимый от голоса реального человека. В настоящее время ведется работа по интеграции обученной нейронной сети синтезатора удмуртской речи и сайта Национального корпуса удмуртского языка. Уже вскоре синтезатор должен появиться в открытом доступе.
— Мы надеемся, что данная разработка будет полезна и востребована не только в качестве самостоятельного приложения, но и как составная часть автоматических переводчиков с удмуртского языка, навигаторов, обучающих систем, голосовых помощников, — говорит заведующий лабораторией машинного обучения УдмФИЦ УрО РАН, доктор физико-математических наук Виктор Трубицын.
Уже сегодня синтезатор речи может быть полезен для слабовидящих людей, которые благодаря ему смогут слушать книги. Его можно использовать для обучения детей чтению на правильном литературном удмуртском языке.
В планах специалистов УдмФИЦ УрО РАН создание переводчика на основе нейросетей, программы речевого ввода, интеграция Национального корпуса удмуртского языка с интернет-переводчиками.
По словам руководителя Удмуртского института истории, языка и литературы УдмФИЦ УрО РАН Игоря Леонидовича Поздеева, появление синтезатора речи — еще один шаг в развитии Национального корпуса удмуртского языка.
По материалам пресс-службы Удмуртского федерального исследовательского центра УрО РАН
 
Год: 
2021
Месяц: 
декабрь
Номер выпуска: 
24
Абсолютный номер: 
1243
Изменено 22.12.2021 - 17:02


2021 © Российская академия наук Уральское отделение РАН
620049, г. Екатеринбург, ул. Первомайская, 91
document@prm.uran.ru +7(343) 374-07-47