Компьютер понял русский разговорный
Российская компания «Центр речевых технологий» завершила работу над технологией распознавания слитной русской речи.
Компания «Центр речевых технологий» завершила работу над технологией распознавания слитной русской речи. Разработку предполагается использовать в call-центрах, электронных переводчиках и промышленности. В планах компании — доводка технологии для голосового управления компьютером, бытовой техникой и транспортом.
Работы над проектом продолжались более 3 лет и потребовали $5 млн. инвестиций. Созданная питерским «Центром речевых технологий» система получила название «Руссограф», она способна распознавать 30 тыс. словоформ.
Специально под этот проект в «Центре речевых технологий» создали научно-исследовательскую группу из специалистов по лингвистике, фонетике, математике, обработке сигналов и программированию. Был использован набор речевых баз данных, в который входят записи более чем 3000 дикторов общей длительностью около 300 часов, собранных с учетом 5 диалектных групп русского языка. Эти базы были использованы для создания акустических моделей звуков русской речи.
«Русский язык принципиально отличается от других языков не только фонетически (например, звуком «ы»), но и свободным порядком слов в предложении, что значительно усложняет математическое моделирование речи. В результате использование западных технологий для качественного распознавания русской речи не представляется возможным», — отмечает генеральный директор ЦРТ Михаил Хитров.
Важной частью проекта стало создание базового речевого декодера, который, используя оригинальные акустические и языковые модели русского языка, преобразовывает речевой сигнал в текст. Точность распознавания цифр в телефонной линии составляет 99,9%, а сложных слов — 90%. Тем временем, западные системы анонсируют
Сейчас ЦРТ работает над аппаратной реализацией своей технологии. В 2008 г. компания собирается вывести на рынок несколько продуктов, построенных на основе своей разработки, в частности, систему интерактивного голосового управления для контакт-центров и системы управления промышленными объектами. В перспективе планируется создание карманного переводчика устной русской речи. В ЦРТ отмечают, что промышленное внедрение технологии распознавания «Руссограф» также открывает новые возможности голосового управления компьютерной и бытовой техникой, транспортом, обеспечения безопасности объектов, а также систематизации фонограмм и поиска по аудиоархивам.
Комментарии