Машинному переводу — почти 60!

Первая автоматизированная система перевода с русского на английский язык была испытана 7 января 1954 года

26 января 2012 14:03, Computerworld.kz

Рубрики: Мир

В это трудно поверить, но прошло уже 58 лет с тех пор, как сотрудники корпорации IBM и Джорджтаунского университета провели испытания первой в мире компьютерной программы, выполняющей перевод с русского языка на английский.

Эксперимент был проведен 7 января 1954 года. Фразы на русском в особой системе транслитерации, разработанной в Джорджтаунском университете, набивались на перфокарты, которые обрабатывались на огромном мэйнфрейме IBM 701. Сегодня те же самые фразы можно ввести в Google Translate на смартфоне и получить перевод меньше чем за 10 секунд.

Программу перевода, разработанную в 50-х годах в IBM, провозгласили колоссальным прорывом. Вот что говорится в пресс-релизе самой IBM, посвященном испытаниям системы: «Девушка, не знающая ни слова на языке Советов, набивала русскоязычные фразы на перфокартах IBM. Мэйнфрейм 701 (прозванный ‘мозгом’), выдавал их перевод на английский на автоматическом печатающем устройстве с головокружительной быстротой — две с половиной строки в секунду.

Mi pyeryedayem mislyi posryedstvom ryechy — набрала девушка. И 701 выдал ответ: We transmit thoughts by means of speech.

Vyelyichyina ugla opryedyelyayetsya otnoshyenyiyem dlyini dugi k radyiusu — отстучал перфоратор, и ‘мозг’ немедленно отреагировал: Magnitude of angle is determined by the relation of length of arc to radius.

Всего ‘мозгу’ было задано более 60 предложений на русском языке. Для эксперимента пришлось прервать шестнадцатичасовой рабочий день этого удивительного инструмента, применяемого для решения задач ядерной физики, расчета траекторий ракет, прогнозирования погоды и прочих математических чудес. На короткий период времени внимание ‘мозга’ пришлось отвлечь от этих молниеносных числовых расчетов на совершенно иную ипостась логики, лежащую в принципиально новой для гигантских электронных вычислительных машин плоскости: поведение человека, а именно его искусство пользоваться словами. Результатом, как было продемонстрировано, стал ошеломительный успех.

Сегодня, конечно, еще невозможно подать книгу на русском на вход системы и получить англоязычную на выходе, но уже через пять лет, а быть может, и через три, вполне может стать реальностью преобразование электронным способом речи между несколькими языками по различной тематике».

Программа IBM располагала словарем всего из 250 слов и имела лишь шесть грамматических правил. При этом, помимо общих тем, она специализировалась в области органической химии.

Эксперимент IBM дал мощный толчок развитию технологий машинного перевода, однако эти проекты оказались чересчур сложными, дорогостоящими и в конечном итоге вызывающими однозначную оценку. В 1964 году группа ученых, входивших в образованный Пентагоном и Национальным научным фондом США Консультативный комитет по автоматической языковой обработке (Automatic Language Processing Advisory Committee, ALPAC), провела оценку технологий машинного перевода и двумя годами позже, по сути, уничтожила это направление исследований печально знаменитым отчетом.

Отчет был озаглавлен «Язык и машины: применение компьютеров в лингвистике и переводческом деле». Согласно американской Википедии, в отчете остро критиковались идущие проекты, доказывалось, что компьютерные системы работали не быстрее, чем переводчики-люди. Кроме того, демонстрировалось, что, поскольку переводчиков было в избытке, их услугами можно было пользоваться относительно недорого — примерно 6 долл. за 1000 слов.

Видный эксперт по машинному переводу Джон Хатчинс много лет спустя написал: «Самым известным событием в истории машинного перевода, без сомнения, стал выход отчета ALPAC в 1966 году. В результате его публикации финансирование исследований в области машинного перевода в США прекратилось примерно на двадцать лет. Возможно, еще более серьезным последствием стало то, что широкая публика и научное сообщество начали воспринимать машинный перевод как нечто нереализуемое. Многие годы после этого интерес к данной теме приходилось скрывать — это было почти постыдным. Даже в наши дни ‘нереальность’ машинного перевода многими воспринимается как бесспорный факт. Влияние доклада было колоссальным. Удар оказался столь мощным, что в исследовательских кругах до сих пор побаиваются, как бы на машинный перевод не ‘натравили’ очередной ALPAC».