Следите за новостями

Цифра дня

17,8% казахстанцев совершали покупки в интернете

Компьютер понял русский разговорный

Российская компания «Центр речевых технологий» завершила работу над технологией распознавания слитной русской речи.

31 января 2008 10:46, CNews.ru
Рубрики: Соседи

Компания «Центр речевых технологий» завершила работу над технологией распознавания слитной русской речи. Разработку предполагается использовать в call-центрах, электронных переводчиках и промышленности. В планах компании — доводка технологии для голосового управления компьютером, бытовой техникой и транспортом.

Работы над проектом продолжались более 3 лет и потребовали $5 млн. инвестиций. Созданная питерским «Центром речевых технологий» система получила название «Руссограф», она способна распознавать 30 тыс. словоформ.

Специально под этот проект в «Центре речевых технологий» создали научно-исследовательскую группу из специалистов по лингвистике, фонетике, математике, обработке сигналов и программированию. Был использован набор речевых баз данных, в который входят записи более чем 3000 дикторов общей длительностью около 300 часов, собранных с учетом 5 диалектных групп русского языка. Эти базы были использованы для создания акустических моделей звуков русской речи.

«Русский язык принципиально отличается от других языков не только фонетически (например, звуком «ы»), но и свободным порядком слов в предложении, что значительно усложняет математическое моделирование речи. В результате использование западных технологий для качественного распознавания русской речи не представляется возможным», — отмечает генеральный директор ЦРТ Михаил Хитров.

Важной частью проекта стало создание базового речевого декодера, который, используя оригинальные акустические и языковые модели русского языка, преобразовывает речевой сигнал в текст. Точность распознавания цифр в телефонной линии составляет 99,9%, а сложных слов — 90%. Тем временем, западные системы анонсируют 95–99%  правильного распознавания речи. Однако специалист по компьютерной лингвистике Виктор Бочаров рассказал, что на практике это значение может быть ниже и существенно зависит от набора ожидаемых системой фраз, условий и качества канала (например, телефонного).

Сейчас ЦРТ работает над аппаратной реализацией своей технологии. В 2008 г. компания собирается вывести на рынок несколько продуктов, построенных на основе своей разработки, в частности, систему интерактивного голосового управления для контакт-центров и системы управления промышленными объектами. В перспективе планируется создание карманного переводчика устной русской речи. В ЦРТ отмечают, что промышленное внедрение технологии распознавания «Руссограф» также открывает новые возможности голосового управления компьютерной и бытовой техникой, транспортом, обеспечения безопасности объектов, а также систематизации фонограмм и поиска по аудиоархивам.

Комментарии