В Казахстане разработали технологию автоматизированного распознавания казахской речи

Для реализации проекта ученые собрали самую большую базу голосовых данных.

24 сентября 2020 16:40, Profit.kz

Проект по автоматизированному распознаванию казахской речи запускает Институт умных систем и искусственного интеллекта Назарбаев Университета (ISSAI). С его помощью казахский язык можно будет активно внедрять в глобальное цифровое пространство. Для реализации проекта ученые собрали самую большую базу голосовых данных на казахском языке — 300 часов записанной речи двух тысяч человек. Запуск проекта был приурочен к первой годовщине создания Института умных систем и искусственного интеллекта Назарбаев Университета — 14 сентября ISSAI отметил свой первый день рождения.

Отмечается, что применение новой разработки открывает большие возможности — это распознавание казахской речи виртуальными помощниками, использование во всевозможных программах, а также в технологиях «умного дома». Кроме того, этот проект даст большой толчок развитию инклюзии в Казахстане. Новая технология может применяться в голосовых и текстовых программах, широко использующихся людьми с особыми потребностями.

«До сих пор отсутствие достаточно большой базы данных было препятствием для применения казахского языка в цифровом мире, поэтому мы и инициировали этот проект. Сейчас мы готовы поделиться собранной базой данных казахской речи с открытым исходным кодом со всеми исследователями и цифровыми предпринимателями», — рассказал профессор Атакан Варол, директор ISSAI NU.

Любой желающий может получить доступ к собранной базе данных, а также протестировать технологию распознавания казахской речи.

Подписывайтесь на каналы Profit.kz в Facebook и Telegram.