Следите за новостями

Цифра дня

41% казахстанцев столкнулись с инцидентами кибербезопасности

Машинному переводу — почти 60!

Первая автоматизированная система перевода с русского на английский язык была испытана 7 января 1954 года

26 января 2012 14:03, Computerworld.kz
Рубрики: Мир

В это трудно поверить, но прошло уже 58 лет с тех пор, как сотрудники корпорации IBM и Джорджтаунского университета про­вели испытания первой в мире компьютер­ной программы, выполняющей перевод с русского языка на английский.

Эксперимент был проведен 7 января 1954 года. Фразы на русском в особой системе транслитерации, разработанной в Джор­джтаунском университете, набивались на перфокарты, которые обрабатывались на огромном мэйнфрейме IBM 701. Сегодня те же самые фразы можно ввести в Google Translate на смартфоне и получить пере­вод меньше чем за 10 секунд.

Программу перевода, разработанную в 50-х годах в IBM, провозгласили колоссаль­ным прорывом. Вот что говорится в пресс-релизе самой IBM, посвященном испытаниям системы: «Девушка, не знающая ни слова на языке Советов, набивала русскоязычные фразы на перфокартах IBM. Мэйнфрейм 701 (прозванный ‘мозгом’), выдавал их перевод на английский на ав­томатическом печатающем устройстве с головокружительной быстротой — две с половиной строки в секунду.

Mi pyeryedayem mislyi posryedstvom ryechy — набрала девушка. И 701 выдал ответ: We transmit thoughts by means of speech.

Vyelyichyina ugla opryedyelyayetsya otnoshyenyiyem dlyini dugi k radyiusu — отсту­чал перфоратор, и ‘мозг’ немедленно отреагировал: Magnitude of angle is determined by the relation of length of arc to radius.

Всего ‘мозгу’ было задано более 60 предложений на русском языке. Для экспери­мента пришлось прервать шестнадцатичасовой рабочий день этого удивитель­ного инструмента, применяемого для решения задач ядерной физики, расчета траекторий ракет, прогнозирования погоды и прочих математических чудес. На короткий период времени внимание ‘мозга’ пришлось отвлечь от этих молниенос­ных числовых расчетов на совершенно иную ипостась логики, лежащую в принци­пиально новой для гигантских электронных вычислительных машин плоскости: поведение человека, а именно его искусство пользоваться словами. Результа­том, как было продемонстрировано, стал ошеломительный успех.

Сегодня, конечно, еще невозможно подать книгу на русском на вход системы и получить англоязычную на выходе, но уже через пять лет, а быть может, и через три, вполне может стать реальностью преобразование электронным способом речи между несколькими языками по различной тематике».

Программа IBM располагала словарем всего из 250 слов и имела лишь шесть грамматических правил. При этом, помимо общих тем, она специализировалась в области органической химии.

Эксперимент IBM дал мощный толчок развитию технологий машинного перево­да, однако эти проекты оказались чересчур сложными, дорогостоящими и в ко­нечном итоге вызывающими однозначную оценку. В 1964 году группа ученых, вхо­дивших в образованный Пентагоном и Национальным научным фондом США Кон­сультативный комитет по автоматической языковой обработке (Automatic Language Processing Advisory Committee, ALPAC), провела оценку технологий ма­шинного перевода и двумя годами позже, по сути, уничтожила это направление исследований печально знаменитым отчетом.

Отчет был озаглавлен «Язык и машины: применение компьютеров в лингвистике и переводческом деле». Согласно американской Википедии, в отчете остро кри­тиковались идущие проекты, доказывалось, что компьютерные системы работа­ли не быстрее, чем переводчики-люди. Кроме того, демонстрировалось, что, по­скольку переводчиков было в избытке, их услугами можно было пользоваться от­носительно недорого — примерно 6 долл. за 1000 слов.

Видный эксперт по машинному переводу Джон Хатчинс много лет спустя напи­сал: «Самым известным событием в истории машинного перевода, без сомне­ния, стал выход отчета ALPAC в 1966 году. В результате его публикации финан­сирование исследований в области машинного перевода в США прекратилось примерно на двадцать лет. Возможно, еще более серьезным последствием стало то, что широкая публика и научное сообщество начали воспринимать ма­шинный перевод как нечто нереализуемое. Многие годы после этого интерес к данной теме приходилось скрывать — это было почти постыдным. Даже в наши дни ‘нереальность’ машинного перевода многими воспринимается как бесспор­ный факт. Влияние доклада было колоссальным. Удар оказался столь мощным, что в исследовательских кругах до сих пор побаиваются, как бы на машинный пе­ревод не ‘натравили’ очередной ALPAC».