В Казахстане разработали технологию автоматизированного распознавания казахской речи
Для реализации проекта ученые собрали самую большую базу голосовых данных.
Проект по автоматизированному распознаванию казахской речи запускает Институт умных систем и искусственного интеллекта Назарбаев Университета (ISSAI). С его помощью казахский язык можно будет активно внедрять в глобальное цифровое пространство. Для реализации проекта ученые собрали самую большую базу голосовых данных на казахском языке — 300 часов записанной речи двух тысяч человек. Запуск проекта был приурочен к первой годовщине создания Института умных систем и искусственного интеллекта Назарбаев Университета — 14 сентября ISSAI отметил свой первый день рождения.
Отмечается, что применение новой разработки открывает большие возможности — это распознавание казахской речи виртуальными помощниками, использование во всевозможных программах, а также в технологиях «умного дома». Кроме того, этот проект даст большой толчок развитию инклюзии в Казахстане. Новая технология может применяться в голосовых и текстовых программах, широко использующихся людьми с особыми потребностями.
«До сих пор отсутствие достаточно большой базы данных было препятствием для применения казахского языка в цифровом мире, поэтому мы и инициировали этот проект. Сейчас мы готовы поделиться собранной базой данных казахской речи с открытым исходным кодом со всеми исследователями и цифровыми предпринимателями», — рассказал профессор Атакан Варол, директор ISSAI NU.
Любой желающий может получить доступ к собранной базе данных, а также протестировать технологию распознавания казахской речи.