Следите за новостями

Цифра дня

17,8% казахстанцев совершали покупки в интернете

Электронный секретарь

Интервью с генеральным директором ТОО «Фирма ИЗЕТ» Изетали Тилешевым о программе преобразования казахской и русской устной речи в электронный документ.

6 декабря 2011 11:42, Алан Байтенов, Новое поколение

Отечественные разработчики программного обеспечения трудятся над очень интересным и необходимым продуктом. Рабочее название программы — «Секретарь». С помощью наборов определенных инструкций и баз данных машина сможет понимать казахскую и русскую речь и тут же переводить ее в текст. Зарубежные аналоги этой программы, конечно же, есть, правда, наши языки они не поддерживают. Поэтому и возникла идея создать свое. Сильная сторона «Секретаря» — официальные тексты. Подробнее расскажет Изетали Тилешев, гендиректор ТОО «Фирма ИЗЕТ», которая занимается разработкой отечественного программного обеспечения.

Расскажите об особенностях этого продукта...

Изетали Тилешев, гендиректор ТОО «Фирма ИЗЕТ»— Мы потратили достаточно времени, чтобы определить, в каком направлении двигаться и верно «объяснить» программе, как правильно понимать человеческую речь и тем самым точно преобразовывать ее в печатные слова и предложения. Было множество вариантов, но мы нашли единственно верный способ. Он оказался очень интересным — его придумала сама природа. Возьмем, например, ребенка — с рождения ему начинают объяснять смысл слов. И у него в памяти формируется база данных, в том числе тембров человеческого голоса. И когда это знание достигает определенной «массы», он начинает понимать любого человека. Мы тоже решили пойти по этому пути и создали фонетический алфавит русского и казахского языков. То есть в случае с казахским языком мы взяли 42 буквы алфавита и записали их звучание. Также создали фонетический словарь из 120 тысяч слов. После этого мы начали собирать статистику — даем текст человеку, и он начинает читать его. Таких вот голосов в казахскоязычной версии программы у нас уже более 2500. А в русскоязычной версии примерно 2000 образцов голоса. Для чего это необходимо — программа сначала режет слово на куски, сравнивает с фонетическим алфавитом, потом формирует слово и позже из баз данных выбирает нужный вариант.

Какова точность этой программы?

— В данный момент программа, которая работает с казахской речью, имеет точность на уровне 80 процентов. Русскоязычная пока работает с точностью в 60 процентов. Но когда мы соберем около 10 тысяч образцов голоса, тогда сможем получить точность на уровне 95-98 процентов. И этот результат будет достигнут как в казахскоязычном, так и в русскоязычном варианте программы.

Где вы видите использование своей программы?

— Эта программа будет использоваться журналистами, писателями и на всевозможных заседаниях, где по речи спикеров ведется протокол. Кстати, ей заинтересовались также и спецслужбы — программа может использоваться в целях обеспечения национальной безопасности.

Как быстро происходит обработка информации?

— Все зависит от вычислительной мощности. На обычном персональном компьютере «расшифровка» стандартного предложения занимает примерно 10 секунд. Однако если мы будем использовать многопроцессорные серверы, все это будет происходить практически мгновенно. В то же время есть методы, когда программа быстро пишет, но зато теряет в качестве. А есть методы, когда процесс идет медленно, но зато и точность выше. Мы же избрали в своем продукте, на наш взгляд, самое верное соотношение.

Есть ли аналоги?

— Да, есть. Для английского, французского, итальянского, немецкого и испанского — в общем, для большинства мировых языков. Разработкой этих программ занимались «Майкрософт» и IBM. К слову, для китайского языка программу создали сами китайцы, для японского — сами японцы. Кстати, японская версия программы была первой. Однако нормально работающих программ, которые бы поддерживали наши языки, к сожалению, нет. Поэтому мы и решили взяться за дело.

Когда планируете представить коммерческий вариант программы?

— Думаю, что на следующий год мы сможем уже предоставить что-то, что можно продать. Самое главное, нам необходимо расширить базу голосов. И если мы наберем 8-10 тысяч тембров голоса, то уже сможем говорить о реальной работе этой программы. Однако есть и такой момент — финансирование. Например, мы даем текст человеку, но он не будет читать его бесплатно. Поэтому мы оплачиваем его труд. Вообще, в процессе разработки программы было потрачено около 1 миллиона долларов собственных средств фирмы. Впрочем, государство также оказывало нам финансовую помощь. Например, 17 миллионов тенге выделил Фонд науки. В следующем году мы хотим презентовать эту программу в качестве инвестиционного проекта и, собрав средства, будем двигаться дальше. В то же время частным лицам будем продавать эту программу по цене не более 10 долларов за копию. Между тем не исключена возможность работы программы в режиме онлайн. Сейчас уже ведутся переговоры с АО «Казахтелеком» для того, чтобы программа базировалась на их серверах.

Комментарии