Электронный секретарь
Интервью с генеральным директором ТОО «Фирма ИЗЕТ» Изетали Тилешевым о программе преобразования казахской и русской устной речи в электронный документ.
Отечественные разработчики программного обеспечения трудятся над очень интересным и необходимым продуктом. Рабочее название программы — «Секретарь». С помощью наборов определенных инструкций и баз данных машина сможет понимать казахскую и русскую речь и тут же переводить ее в текст. Зарубежные аналоги этой программы, конечно же, есть, правда, наши языки они не поддерживают. Поэтому и возникла идея создать свое. Сильная сторона «Секретаря» — официальные тексты. Подробнее расскажет Изетали Тилешев, гендиректор ТОО «Фирма ИЗЕТ», которая занимается разработкой отечественного программного обеспечения.
— Расскажите об особенностях этого продукта...
— Мы потратили достаточно времени, чтобы определить, в каком направлении двигаться и верно «объяснить» программе, как правильно понимать человеческую речь и тем самым точно преобразовывать ее в печатные слова и предложения. Было множество вариантов, но мы нашли единственно верный способ. Он оказался очень интересным — его придумала сама природа. Возьмем, например, ребенка — с рождения ему начинают объяснять смысл слов. И у него в памяти формируется база данных, в том числе тембров человеческого голоса. И когда это знание достигает определенной «массы», он начинает понимать любого человека. Мы тоже решили пойти по этому пути и создали фонетический алфавит русского и казахского языков. То есть в случае с казахским языком мы взяли 42 буквы алфавита и записали их звучание. Также создали фонетический словарь из 120 тысяч слов. После этого мы начали собирать статистику — даем текст человеку, и он начинает читать его. Таких вот голосов в казахскоязычной версии программы у нас уже более 2500. А в русскоязычной версии примерно 2000 образцов голоса. Для чего это необходимо — программа сначала режет слово на куски, сравнивает с фонетическим алфавитом, потом формирует слово и позже из баз данных выбирает нужный вариант.
— Какова точность этой программы?
— В данный момент программа, которая работает с казахской речью, имеет точность на уровне 80 процентов. Русскоязычная пока работает с точностью в 60 процентов. Но когда мы соберем около 10 тысяч образцов голоса, тогда сможем получить точность на уровне 95-98 процентов. И этот результат будет достигнут как в казахскоязычном, так и в русскоязычном варианте программы.
— Где вы видите использование своей программы?
— Эта программа будет использоваться журналистами, писателями и на всевозможных заседаниях, где по речи спикеров ведется протокол. Кстати, ей заинтересовались также и спецслужбы — программа может использоваться в целях обеспечения национальной безопасности.
— Как быстро происходит обработка информации?
— Все зависит от вычислительной мощности. На обычном персональном компьютере «расшифровка» стандартного предложения занимает примерно 10 секунд. Однако если мы будем использовать многопроцессорные серверы, все это будет происходить практически мгновенно. В то же время есть методы, когда программа быстро пишет, но зато теряет в качестве. А есть методы, когда процесс идет медленно, но зато и точность выше. Мы же избрали в своем продукте, на наш взгляд, самое верное соотношение.
— Есть ли аналоги?
— Да, есть. Для английского, французского, итальянского, немецкого и испанского — в общем, для большинства мировых языков. Разработкой этих программ занимались «Майкрософт» и IBM. К слову, для китайского языка программу создали сами китайцы, для японского — сами японцы. Кстати, японская версия программы была первой. Однако нормально работающих программ, которые бы поддерживали наши языки, к сожалению, нет. Поэтому мы и решили взяться за дело.
— Когда планируете представить коммерческий вариант программы?
— Думаю, что на следующий год мы сможем уже предоставить что-то, что можно продать. Самое главное, нам необходимо расширить базу голосов. И если мы наберем 8-10 тысяч тембров голоса, то уже сможем говорить о реальной работе этой программы. Однако есть и такой момент — финансирование. Например, мы даем текст человеку, но он не будет читать его бесплатно. Поэтому мы оплачиваем его труд. Вообще, в процессе разработки программы было потрачено около 1 миллиона долларов собственных средств фирмы. Впрочем, государство также оказывало нам финансовую помощь. Например, 17 миллионов тенге выделил Фонд науки. В следующем году мы хотим презентовать эту программу в качестве инвестиционного проекта и, собрав средства, будем двигаться дальше. В то же время частным лицам будем продавать эту программу по цене не более 10 долларов за копию. Между тем не исключена возможность работы программы в режиме онлайн. Сейчас уже ведутся переговоры с АО «Казахтелеком» для того, чтобы программа базировалась на их серверах.
Комментарии