Основные типы ошибок машинного перевода. Как научная дисциплина. Подходы к машинному переводу

Подходы к машинному переводу

Системы машинного перевода могут использовать метод перевода основанный на лингвистических правилах. Наиболее подходящие слова из исходного языка просто заменяются словами переводного языка.

Часто утверждается, что для успешного решения проблемы машинного перевода, необходимо решить проблему понимания текста на естественном языке.

Как правило, метод перевода основанный на правилах использует символическое представление (посредника), на основе которого создается текст на переводном языке. А если учитывать природу посредника то можно говорить об интерлингвистическом машинном переводе или трансфертном машинном переводе. Эти методы требуют очень больших словарей с морфологической, синтаксической и семантической информацией и большого набора правил.

Если у системы машинного перевода будет достаточное количество данных, то можно получить перевод хорошего качества. Основная трудность заключается в формировании этих данных. Например, большие корпуса текста необходимые для статистических методов перевода, для перевода, основанного на грамматике, оказываются недостаточными. Более того, для последних, требуется дополнительное задание грамматики.

Для перевода родственных языков (русский, украинский) может оказаться достаточной простая замена слов.

Современные системы машинного перевода делят на три большие группы:

· основанные на правилах;

· основанные на примерах;

СМП, основанные на правилах

Системы машинного перевода основанные на правилах - общий термин, который обозначает системы машинного перевода на основе лингвистической информации об исходном и переводном языках .

Они состоят из двуязычных словарей и грамматик, охватывающих основные семантические, морфологические, синтаксические закономерности каждого языка. Такой подход к машинному переводу еще называют классическим.

На основе этих данных исходный текст последовательно, по предложениям, преобразуется в текст перевода. Часто, такие системы противопоставляют системам машинного перевода, которые основаны на примерах.

Принцип работы таких систем - связь структуры входного и выходного предложения. Перевод при этом получается не особенно хорошего качества. Но на простых примерах работает.

Перевод с английского на немецкий будет выглядеть как:

A girl eats an apple. Ein Madchen isst einen Apfel.

Эти системы делятся на три группы:

· системы пословного перевода;

· трансфертные системы;

· интерлингвистические;

Пословный перевод

Такие системы используются сейчас крайне редко из-за низкого качества перевода. Слова исходного текста преобразуются (как есть) в слова переводного текста. Часто такое преобразование происходит без лемматизации и морфологического анализа. Это самый простой метод машинного перевода. Он используется для перевода длинных списков слов (например, каталогов). Так же он может быть использован для составления подстрочечника для TM-систем.

Трансфертные системы

Как трансфертные системы , так и интерлингвистические, имеют одну и ту же общую идею. Для перевода необходимо иметь посредника, который в себе несет смысл переводимого выражения. В интерлингвистических системах посредник не зависит от пары языков, в то время как в трансфертных - зависит.

Трансфертные системы работают по очень простому принципу: к входному тексту применяются правила, которые ставят в соответствие структуры исходного и переводного языков. Начальный этап работы включает в себя морфологический, синтаксический (а иногда и семантический) анализ текста для создания внутреннего представление. Перевод генерируется из этого представления с использованием двуязычных словарей и грамматических правил. Иногда на основе первичного представления, которое было получено из исходного текста, строят более «абстрактное» внутренне представление. Это делается для того, чтобы акцентировать места важные для перевода, и отбросить несущественные части текста. При построении текста перевода преобразование уровней внутренних представлений происходит в обратном порядке.

При использовании этой стратегии получается достаточно высокое качество переводов, с точностью в районе 90% (хотя это сильно зависит от языковой пары). Работа любой системы трансфертного перевода состоит как минимум из пяти частей:

· морфологический анализ;

· лексический трансфер;

· структурный трансфер;

· морфологическая генерация.

Морфологический анализ. Слова исходного текста классифицируются по частям речи. Выявляются их морфологические признаки. Определяются леммы слов.

Лексические категоризации. В любом тексте некоторые слова могут иметь более чем одно значение, вызывая неоднозначность в анализе. При лексической категоризации выявляется контекст слова. Возможны различного рода пометки и уточнения.

Лексический трансфер. На основе двуязычного словаря происходит перевод лемм слов. Действие очень похоже на пословный перевод.

Структурный трансфер. Слова согласуются в предложении.

Морфологическая генерация. На основе выходных данных структурного трансфера создаются словоформы переводного текста.

Одной из основных особенностей трансфеных систем машинного перевода является этап, во время которого промежуточное представление текста на языке оригинала «передается» в промежуточное представление текста в целевом языке. Это может работать на одном из двух уровней лингвистического анализа, или сразу на обоих.

1. Поверхностный (синтаксический) трансфер. Этот уровень характеризуется передачей «синтаксических структур» между исходным и переводным языком. Подходит для языков в той же семье или того же типа, например, в романских языков, между итальянским испанским, каталонским, французским, и т.д.

2. Глубинный (семантический) трансфер. Уровень характеризуется семантическим представлением. Оно зависит от языка оригинала. Это представление может состоять из ряда структур, которые представляют значение. Перевод также обычно требует структурного трансфера. Этот уровень используется для перевода между более отдаленными языками.

Интерлингвистический машинный перевод

Интерлингвистический машинный перевод - один из классических подходов к машинному переводу. Исходный текст трансформируется в абстрактное представление, которое не зависит от языка (в отличие от трансфертного перевода). Переводной текст создается на основе этого представления. Основным преимуществом такого подхода является то, что для добавления нового языка в систему. Можно доказать математически, что в рамках этого подхода, создания каждого нового интерпретатора языка для такой системы будет удешевлять ее, по сравнению, например, с системой трансфертного перевода. Кроме того, в рамках такого подхода можно

· реализовать «пересказ текста», перефразирование исходного текста в рамках одного языка;

· относительно простая реализация перевода сильно отличающихся языков, таких как, например русский и арабский.

Однако, до сих пор не существует реализаций такого подхода, которые бы корректно работали бы хотя бы для двух языков. Многие эксперты высказывают сомнения в возможности такой реализации. Сама большая сложность для создания подобных систем заключается в проектировании межъязыкового представления. Оно должно быть одновременно абстрактным и независящим от конкретных языков, но в тоже время оно должно отражать особенности любого существующего языка. С другой стороны, в рамках искусственного интеллекта, задача выделения смысла текста на данный момент до сих пор не решена.

Впервые интерлингвистический подход был предложен в 17 веке Декартом и Лейбницем, которые предложили универсальные словари, использующие числовые коды. Другие, такие как Кейв Бек, Афанасий Кирхер и Иоганн Иоахим Бехер работали над разработкой однозначного универсального языка, основанного на принципах логики и иконографики.

В 1668 году Джон Уилкинс в трактате «Опыт о Подлинной символике и философском языке» рассказал о своем интерлингва.

В 18 и 19 веков было разработано много универсальных языков, в том числе и Эсперанто. Известно, что идея универсального языка для машинного перевода, никак не проявилась на начальных этапах развития этой технологии. Вместо нее рассматривались только пары языков. Однако, в течение 1950-х и 60-х годов, исследователи в Кембридже возглавляемые Маргарет Мастерман, в Ленинграде во главе с Николаем Андреевым и в Милане Сильвио Ceccato начали работу в этой области.

В 1970-х и 1980-x годах были сделаны определенные успехи в этой области и был построен ряд систем машинного перевода.

В этом методе перевода, межъязыковое представление можно рассматривать как способ описания анализа текста, на языке оригинала. При этом, в представлении сохраняются морфологические, синтаксические характеристики текста. Предполагается, что таким образом можно передать «смысл» при создании переводного текста.

При этом иногда используется два межъязыковых представления. Одно из них более отражает характеристики исходного языка. Другое - языка перевода. Перевод в данном случае производится в два этапа.

В некоторых случаях используются два и более представления одного уровня (одинаково близкие к обоим языкам), но разнящиеся по тематике. Это необходимо для повышения качества перевода специфических текстов.

Такой подход не нов для лингвистики. Он основан на идеи близости языков. Для улучшения качества перевода, естественный язык используется в качестве моста между двумя другими языками. Например, при переводе с украинского на английский, иногда используется русский язык.

Для использования системы интерлингвистического машинного перевода необходимы:

· словари для анализа и генерации текстов;

· описание грамматик языков;

· база знаний понятий (для создания межъязыкового представления);

· правила проекции понятий для языков и представления.

Самым сложным моментом при создании такого типа является невозможность построить базу для широких областей знаний. А те базы, которые создаются для очень специфичной тематики, обладают высокой вычислительной сложностью.

  • ДЕ-1. Основы строения и свойства материалов. Фазовые превращения.
  • ДЕ-2.Основы термической обработки и поверхностного упрочнения сплавов
  • Лекция 13. Машинный перевод текста. Компьютерные языковые словари

    Основы машинного перевода

    Перевод - это вид языкового посредничества, который ориентирован на иноязычный оригинал. Перевод рассматривается как иноязычная форма существования сообщения, содержащегося в оригинале. Межъязыковая коммуникация, осуществляемая через посредство перевода, в наибольшей степени воспроизводит процесс непосредственного речевого общения, при котором коммуниканты пользуются одним и тем же языком.

    Машинный перевод – это автоматическое извлечение знаний и текстов, написанных на естественном языке с помощью компьютерных программ с опорой на лингвистическое обеспечение.

    Процесс машинного перевода – это действия компьютера по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия.

    Система автоматического понимания текста , исходит из того, что текст на естественном языке, построенный в соответствии со словарями, грамматикой и алгоритмами естественного языка, опирающийся на семантическую сеть, фреймы и тезаурусы, понимается пользователем благодаря тому, что у него существуют лингвистические знания - синтактико-семантические структуры, а также специальные знания.

    Большинство систем автоматической обработки языка ставят своей задачей анализ текстов, заранее разбитых на предложения. Однако языковые данные доступны нам чаще всего в виде текстов, размеченных на абзацы, главы и другие более крупные единицы. Поэтому для их эффективного автоматического анализа необходимы соответствующие алгоритмы сегментации.

    Задачи при создании системы автоматического понимания текста:

    · анализ исходного естественного текста, который обеспечивает построение лингвистических структур, в том числе разных семантических структур, полных, частичных, сжатых, стремящихся представить содержание текста в форме баз данных,

    · сравнение лингвистических структур текста со специальными или индивидуальными знаниями, также представленными в форме базы данных

    · генерализация текстов на основе информации, заключенной в традиционных реляционных базах данных, а также в концептуальных текстовых структурах или в индивидуальных базах данных.

    Для осуществления машинного перевода в компьютер вводится специальная программа, реализующая алгоритм перевода, под которым понимается последовательность однозначно и строго определенных действий над текстом для нахождения переводных соответствий в заданной паре языков при заданном направлении перевода (с одного конкретного языка на другой). Имеются также отдельные системы машинного перевода, рассчитанные на перевод в рамках трех и более языков, но они в настоящее время являются экспериментальными.

    Современный машинный, или автоматический перевод осуществляется с помощью человека: пред-редактора, который тем или иным образом предварительно обрабатывает подлежащий переводу текст, интер-редактора, который участвует в процессе перевода, или пост-редактора, который исправляет ошибки и недочеты в переведенном машиной тексте.

    Система машинного перевода включает в себя двуязычные словари, снабженные необходимой грамматической информацией (морфологической, синтаксической и семантической), которые обеспечивают передачу эквивалентных, вариантных и трансформационных переводных соответствий, толковые и специальные тематические словари, а также алгоритмические средства грамматического анализа, реализующие какую-либо из принятых для автоматической переработки текста формальных грамматик.

    Наиболее распространенной является следующая последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода:

    · ввод текста и поиск входных словоформ во входном словаре с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме. В процессе анализа из формы слова могут быть получены также сведения, относящиеся к другим уровням организации языковой системы.

    · перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области, определение основных грамматических характеристик элементов входного текста, разрешение омографии, лексический анализ и перевод лексем. Обычно на этом этапе однозначные слова отделяются от многозначных, после чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие/отсутствие контекстных определителей значения.

    · Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка.

    · Синтез выходных словоформ и предложения в целом на выходном языке.

    Анализ и синтез могут производиться как пофразно, так и для всего текста, введенного в память компьютера; в последнем случае алгоритм перевода предусматривает определение так называемых анафорических связей.

    Качество машинного перевода зависит от:

    · объема словарей,

    · объема информации, приписываемой лексическим единицам,

    · тщательности составления и проверки работы алгоритмов анализа и синтеза,

    · эффективности программного обеспечения.

    Однако ни от одной из программ пока нельзя ожидать «правильного», литературного перевода текста, состоящего из сложных фраз.

    Современные аппаратные и программные средства допускают использование словарей большого объема, содержащих подробную грамматическую информацию. Информация может быть представлена как в декларативной (описательной), так и в процедурной (учитывающей потребности алгоритма) форме.

    Совершенствование программ по машинному переводу связано с концепцией мягкого понимания текста, согласно которой разные пользователи извлекают свою информацию и свой индивидуальный смысл из одного и того же текста. Модель мягкого понимания текста состоит в способности порождать различные осмысленные интерпретации исходного объекта в зависимости от разных условий и составляющих его восприятия.

    Более частные "машинные средства" в помощь переводчику и редактору - это автоматические словари и терминологические базы данных, компьютерные тезаурусы, средства экранного редактирования, системы орфографической, терминологической и грамматической коррекции текстов.

    Современный машинный перевод следует отличать от использования компьютеров в помощь человеку-переводчику. В последнем случае имеется в виду автоматический словарь , помогающий человеку быстрее подбирать нужный переводной эквивалент. Хотя и в том, и в другом случае компьютер работает вместе с человеком (переводчиком или редактором), в содержание термина «машинный перевод» входит представление о том, что главную, бóльшую часть работы по переводу и отысканию переводных эквивалентов и переводных соответствий машина берет на себя, оставляя человеку лишь контроль и исправление ошибок.

    Компьютерный словарь в помощь человеку – это вспомогательное средство для быстрого нахождения переводных соответствий; при этом, в такого рода словарях в ограниченной степени могут быть реализованы и некоторые функции, присущие системам машинного перевода.

    В информационной технологии различаются 2 основных подхода к машинному переводу:

    · поверхностное ознакомление с содержанием документа на незнакомом языке

    · использование машинного перевода вместо обычного «человеческого». Это предполагает тщательное редактирование и настройку системы перевода на определенную предметную область.

    Здесь играют роль полнота словаря, ориентированность его на содержание и набор языковых средств переводимых текстов, эффективность способов разрешения лексической многозначности, результативность работы алгоритмов извлечения грамматической информации, нахождения переводных соответствий и алгоритмов синтеза.

    Как вид языковой деятельности перевод затрагивает все уровни языка – от распознавания графем (и фонем при переводе устной речи) до передачи смысла высказывания и текста. Кроме того, машинный перевод предоставляет возможность проверять теоретические гипотезы об устройстве тех или иных языковых уровней и эффективности предлагаемых алгоритмов.

    Необходимость в совершенствовании машинного перевода постоянно возрастает, так как это является важнейшим условием обеспечения межъязыковой коммуникации, объем которой возрастает с каждым годом.

    Другие способы преодоления языковых барьеров на пути коммуникации – разработка или принятие единого языка, а также изучение иностранных языков – не могут сравниться с переводом по эффективности.

    Датой рождения машинного перевода как исследовательской области обычно считают март 1947; именно тогда специалист по криптографии Уоррен Уивер в своем письме Норберту Винеру впервые поставил задачу машинного перевода, сравнив ее с задачей дешифровки.

    Проблемами машинного перевода занимается компьютерная лингвистика , которая родилась в январе 1954 года, когда в Джорджтаунском университете (США) был проведен первый в мире публичный эксперимент по машинному переводу. В те же времена под руководством крупнейшего математика и кибернетика Алексея Ляпунова начались активные работы по машинному переводу и в Москве. В начале 1956 года в Институте прикладной математики (ИПМ) им.М.В.Келдыша начала работать первая отечественная система машинного перевода с французского на русский язык.

    Лидеры среди современных программ машинного перевода в России - система PROMT (разработка компании ПРОМТ, www.e-promt.ru) и система СОКРАТ (разработка компании «Арсеналъ», www.ars.ru).

    В последней версии PROMT появилась принципиально новая функциональность, «Ассоциированная Память». Механизм «Ассоциированной Памяти» позволяет обучать систему. С его помощью можно сохранить удовлетворяющий вас перевод текста в базе знаний и в дальнейшем использовать его фрагменты при переводе похожих текстов.

    СОКРАТ пытается найти однозначное решение и не дает вариантности в терминах: слово, отсутствующее в словаре, остается в исходном написании. PROMT же обычно предлагает несколько вариантов перевода слов и словосочетаний.

    Машинный перевод, прошедший несколько стадий своего развития, в настоящее время сконцентрирован на идее моделирования действий человека-переводчика . Процесс перевода очень труден, а правильное использование преимуществ программного обеспечения во многом определяет качество перевода. Современные системы машинного перевода включают в себя множество дополнительных словарей. Основываясь на особенностях архитектурных решений для лингвистических алгоритмов, системы подразделяются на два типа - "Трансфер" и "Интерлингва". Программы автоматического перевода строятся в соответствии с данным разделением. Так, например программа "Сократ" переводит намного лучше, чем скажем "Мэджик Гудди" потому, что лингвистическое обеспечение первой программы намного сильнее, а словари намного больше по объему.

    Результаты машинного перевода всегда приходится редактировать. Так, например, в программе "Парс" предусмотрена функция дополнительного подключения словарей различной тематики. Ведь от качества обеспечения программы зависит и качество выдаваемого машиной перевода. Но даже тонкая настройка системы под лексику переводимого текста не учитывает всех его особенностей, поэтому переведенные слова, имеющие несколько синонимов, помечаются звездочкой, либо приводятся в скобках как вариант.

    Интернет-технологии дали новое развитие машинному переводу, помогли вывести его на новую стадию развития. Машинный перевод - это эффективное средство для просмотра и поиска информации на иностранном языке, а именно эта функция является главной при работе в Интернете. Современное состояние машинного перевода позволяет получать относительно корректный текст перевода веб-страниц с большинства языков. И хотя полностью автоматический высококачественный перевод невозможен, уже имеется программное обеспечение, которое облегчает сам процесс перевода.

    В результате настройки на предметную область и интеграции с другими программами обработки документов машинный перевод позволяет автоматизировать получение переводного текста.

    Основной проблемой всех программ машинного перевода является правильный выбор тематического словаря, а также выстраивание вспомогательных словарей.

    Перевод частично зависит и от уровня подготовки пользователя (знание языка, навыки работы с программами, чувство языка), а также в большей степени его умения правильно работать с текстовым редактором, вспомогательными утилитами, словарями и фразеологическими справочниками. Варианты переводов, производимых с подключением тематических словарей, дает хороший перевод, правильный выбор значения слова и употребление фраз в тексте. Это объясняется тем, что машина настраивает свой словарь на выбор тех синонимов, которые бы соответствовали в большей степени тематике входящего языка, и переводила бы в соответствии с тематикой выходного языка.

    2 подхода к проблеме развития машинного перевода :

    · установка на использование универсального языка смысла, прямой подход к переводу, преобразование текста оригинала в текст перевода

    · установка на промежуточный язык, моделирование человеческого владения языком

    Проблема состоит в том, что смысл текста на естественном языке зависит не только от самого предложения, но также и от контекста, который связан с многозначностью слов и синтаксических конструкций, практической невозможностью глобального описания семантической структуры мира даже в ограниченной предметной области, отсутствием эффективных формальных методов описания лингвистических закономерностей.

    Нерешенные проблемы машинного перевода – это

    · решение неоднозначности формального синтаксического анализа изолированных предложений текста

    · преодоление структурной и смысловой неполноты участков (фрагментов) текста

    · организация гибкого подключения разных предметных областей

    · необходимость понимания текста как целого образования

    Программы машинного перевода лучше обрабатывают научные, технические и образовательные тексты, которым присуще строгое изложение материала.

    Разговорный и публицистический стиль, где много специфических оборотов, но большинство слов используется в прямом смысле, пригодны для ознакомительного перевода, однако для получения грамотного выходного текста требуется ручная правка. Получаемый перевод является неким ознакомительным текстом, где передается лишь общая тематическая направленность текста.

    Перевод же художественной литературы и поэзии не соответствует требованиям машины. Смысл текста, построенного на иносказательных выражениях, при машинном переводе искажается и недоступен даже для ознакомления. Машина не понимает многозначности, что в свою очередь приводит к неправильной интерпретации переводимого текста, который превращается в бессмыслицу.

    Постараться минимизировать такие недоразумения можно, соблюдая следующие правила :

    · правильно выстраивать тематические словари

    · проверять текст оригинала на стадии предподготовки его перевода

    · редактировать на конечной стадии перевода

    · правильно использовать программы словарей

    · хорошо знать грамматику и лексику, а также тематику исходного текста

    · правильно оперировать словарным запасом, клише и словоформами

    · своевременно пополнять специальные словари новыми терминами

    ПРЕДМЕТ, ОБЪЕКТ И ЗАДАЧИ ЛИНГВИСТИЧЕСКОЙ ТЕОРИИ ПЕРЕВОДА

    В настоящее время лингвистическая теория пе­ревода прочно утвердилась как самостоятельная научная дисциплина. Однако до сих пор остаются нерешенными ряд принципиальных вопросов, ко­торые определяют статус теории перевода. Одним из таких вопросов является вопрос о предмете и объекте теории перевода.

    В литературе высказывались различные, часто противоположные точки зрения по поводу того, что следует считать предметом и объектом теории пе­ревода. Так, И.И.Ревзин и В.Ю.Розенцвейг утверж­дают, что объектом перевода является сам процесс перевода, при котором совершается переход от од­ной системы знаков к другой и который может быть описан в семиотических терминах 86 . Эти авторы проводят принципиальное разграничение между процессом перевода и результатом перевода. Они исходят из того, что традиционно наука о переводе строилась как наука нормативная, главными целя­ми которой были установление результата перево­да и выработка критериев оценки качества перево­да. Нормативная теория перевода строилась эмпи­рически, на основе сопоставительного анализа оригиналов и переводов. Теоретические положения при этом заимствовались из лексикологии, грамма­тики, стилистики и литературоведения. При таком подходе, по мнению И.И.Ревзина и В.Ю.Розенцвей-га, теоретическое осмысление процесса перевода не может быть достигнуто. Наука, стремящаяся опи-

    "Ревзин И. И., Розенцвейг В. Ю. М.: Высш. шк., 1964. С.21.


    68 В.В.Сдобников, О.В.Петрова ТЕОРИЯ ПЕРЕВОДА

    Сать перевод как процесс, должна быть не норма­тивной, а теоретической. То есть она должна опи­сывать не то, что должно быть, а то, что заложено в самой природе явления 87 .

    С такой точкой зрения выразил несогласие А.Д.Швейцер, который считает, что столь резкое противопоставление теоретического и нормативно­го подходов едва ли оправданно. Исключение из рас­смотрения результатов процесса перевода непра­вомерно сужает предмет теории перевода и едва ли способствует выявлению его сущности. По мнению А.Д.Швейцера, перевод представляет собой целе­направленную деятельность, отвечающую опреде­ленным требованиям и нормам и ориентированную на достижение определенного результата. Эти нор­мы отражают ценностную ориентацию переводчи­ка, без учета которой нельзя удовлетворительно объяснить логику переводческих решений 88 . Таким образом, А.Д.Швейцер включает в предмет теории перевода как сам процесс перевода, так и резуль­тат переводческого процесса.



    Представляется, что исследователи перевода, пытаясь обозначить предмет теории перевода, не учитывали в полной мере то, что перевод - это слож­ное, комплексное явление, на которое оказывают влияние множество самых разнородных факторов. Понимание этого обстоятельства в большей степе­ни достигается в работах В.Н.Комиссарова, который вполне справедливо замечает, что противопостав­лять процесс перевода его результату вряд ли пра­вомерно. Именно результат перевода представляет собой ту непосредственно наблюдаемую реаль­ность, на основании анализа которой можно косвен­но судить о том, как протекал процесс перевода, недоступный непосредственному наблюдению.

    "РевзинИ. И.,РозенцвейгВ. Ю. Основы общего и машинного перевода. М.: Высш. шк., 1964. С.21.

    "ШвейцерА.Д. Теория перевода: статус, проблемы, аспекты. М: Наука, 1988. С.7.


    ЧАСТЬII. Теория перевода как научная дисциплина 69

    Лингвистическая теория перевода имеет дело как с текстами на исходном языке (ИЯ) и языке перевода (ПЯ), так и с самим процессом преобразования тек­ста оригинала в текст перевода. Но и такой подход не совсем достаточен. Переводческая деятельность по определению носит посреднический характер. Благодаря переводу обеспечивается возможность межъязыковой коммуникации. А это означает, что для создания полноценного перевода переводчик должен принимать во внимание особенности авто­ра исходного сообщения и получателей этого сооб­щения, их знания, опыт, а также особенности вос­приятия людей, которым предназначается перевод, ц все прочие аспекты межъязыковой коммуника­ции, влияющие на ход и результат переводческого процесса. Это означает, что предмет теории пере­вода имеет комплексный характер и не ограничи­вается лишь процессом перевода и его результатом. Лингвистическая теория перевода рассматривает перевод в широких рамках межъязыковой комму­никации и изучает все ее аспекты и определяющие факторы, как собственно языковые, так и внешние по отношению к языку, но прямо или косвенно вли­яющие на выбор языковых единиц в процессе пе­ревода 89 .

    Из данного изложения проблемы видно, что меж­ду исследователями перевода нет единства в отно­шении использованной терминологии. Прежде всего, обращает на себя внимание отсутствие чет­кого разграничения между понятиями предмет на­учного исследования и объект научного исследо­вания. Кстати, анализ дефиниций, предлагаемых словарями русского языка, также не привносит большей ясности в этот вопрос. Например, пред­мет научного исследования определяется как «тема, то, что служит содержанием мысли, речи, на что направлена познавательная или творческая

    89 Комиссаров В. Н. Теория перевода (Лингвистические аспекты). М.: Высш. шк.., 1990. С.40-41.


    70 В.В.Сдобников, О.В.Петрова ТЕОРИЯ ПЕРЕВОДА

    Деятельность» 99 . Объект же определяется как «то, что противостоит субъекту, на что направлена его предметно практическая и познавательная деятель­ность» 100 . Как мы видим, оба понятия определяются как нечто такое, на что направлена практическая, познавательная и творческая деятельность субъек­та исследования. Вместе с тем было бы целесооб­разно в качестве объекта исследования рассматри­вать то, что действительно принадлежит к кругу материальных явлений мира, а в качестве предмета исследования - некую проблему, на разрешение которой научное исследование собственно и направ­лено. Исходя из этого, nog объектом лингвистичес­кой теории перевода мы будем понимать посредни­ческую переводческую деятельность в рамках межъязыковой коммуникации, представленную как непосредственно (процесс), так и опосредованно, то есть отраженную в результатах переводческого процесса. Предметом теории перевода является изучение закономерностей переводческого процес­са, факторов, влияющих на протекание процесса перевода и определяющих результат перевода.

    В.Н.Комиссаров 101 формулирует следующие за­дачи лингвистической теории перевода:

    1) раскрыть и описать общелингвистические ос­
    новы перевода, т.е. указать, какие особенности язы­
    ковых систем и закономерности функционирова­
    ния языков лежат в основе переводческого процес­
    са, делают этот процесс возможным и определяют
    его характер и границы;

    2) определить перевод как объект лингвистичес­
    кого исследования, указать его отличие от других
    видов языкового посредничества;

    3) разработать основы классификации видов пе­
    реводческой деятельности;

    99 Словарь русского языка в 4-х томах. Том III. M.: Рус яз., 1983. С.366. ""Словарь русского языка в 4-х томах. Том 11. М: Рус. яз., 1983. С.579. 101 К о м и с с а р о в В. Н. Теория перевода (Лингвистические аспекты). М.: Высш. шк.., 1990. С.35-36.


    ЧАСТЬ II. Теория перевода как научная дисциплина 71

    4) раскрыть сущность переводческой эквивален­тности как основы коммуникативной равноценнос­ти текстов оригинала и перевода;

    5) разработать общие принципы и особенности
    построения частных и специальных теорий перево­
    да для различных комбинаций языков;

    6) разработать общие принципы научного описа­
    ния процесса перевода как действий переводчика
    по преобразованию текста оригинала в текст пере­
    вода;

    7) раскрыть воздействие на процесс перевода
    прагматических и социолингвистических факторов;

    8) определить понятие «норма перевода» и раз­
    работать принципы оценки качества перевода.

    В соответствии с этими задачами и будет строить­ся наш курс общей теории перевода. Но прежде сле­дует рассмотреть вопрос об ориентировочном со­ставе переводоведения и лингвистической теории перевода.

    Переводоведение как научная дисциплина шире теории перевода и включает несколько научных дисциплин, или разделов. В переводоведение вхо­дят теория перевода, история переводческой дея­тельности, критика перевода, переводческая лек­сикография, дидактика перевода (методика обуче­ния переводу). Как мы видим, лингвистическая теория перевода является лишь одним из разделов переводоведения, но при этом и она имеет комплек­сный характер и включает следующие разделы:

    Общая теория переводе - раздел лингвистичес­кой теории перевода, изучающий наиболее общие лингвистические закономерности перевода, незави­симо от конкретной пары языков, участвующих в процессе перевода, способа осуществления этого процесса и индивидуальных особенностей конкрет­ного акта перевода.

    Специальная теория перевода - раздел лингвис­тической теории перевода, изучающий особеннос­ти процесса перевода текстов разного типа и влия-


    72 В.В.Сдобников, О.В.Петрова ТЕОРИЯ ПЕРЕВОДА

    Ние на этот процесс речевых форм и условий его осуществления. Можно выделить несколько специ­альных теорий перевода: теория художественного перевода, теория научно-технического перевода, теория устного перевода, теория машинного пере­вода и т.п.

    Частная теория перевода - раздел лингвистичес­кой теории перевода, изучающий лингвистические аспекты перевода с одного данного языка на другой данный язык. Частных теорий перевода может быть множество: теория перевода с английского языка на русский, теория перевода с немецкого языка на японский, теория перевода с французского языка на суахили и т.п.

    СВЯЗЬ ТЕОРИИ ПЕРЕВОДА С ДРУГИМИ ЛИНГВИСТИЧЕСКИМИ ДИСЦИПЛИНАМИ

    Лингвистическая теория перевода тесно связана с такими лингвистическими дисциплинами, как контрастивная лингвистика, социолингвистика, психолингвистика, лингвистика текста.

    Теория перевода и контрастивная лингвистика

    Контрастивная лингвистика - направление ис­следований общего языкознания, целью которого является сопоставительное изучение двух, реже нескольких языков для выявления их сходств и раз­личий на всех уровнях языковой структуры 102 . Как отмечает А.Д.Швейцер, вопрос о соотношении кон-трастивной лингвистики и теории перевода до сих пор продолжает оставаться предметом споров. В прошлом нередко отсутствовала четкая диффе-

    102 Лингвистический энциклопедический словарь. М: Сов. энцикло­педия, 1990. С.239.


    . Теория перевода как научная дисциплина 73

    Ренциация этих дисциплин. Я.И.Рецкер еще в 1950 году писал, что «перевод... немыслим без проч­ной лингвистической основы. Такой основой долж­но быть сравнительное изучение языковых явлений и установление определенных соответствий между языком подлинника и языком перевода. Эти соответ­ствия в области лексики, фразеологии, синтаксиса и стиля должны составлять лингвистическую основу теории перевода» 103 . Таким образом, сопоставление языков и языковых явлений фактически отождеств­лялось с лингвистической теорией перевода.

    Порой теория перевода отождествляется не с кон-трастивной лингвистикой вообще, а с одним из ее разделов, а именно: с сопоставительной стилисти­кой. Эта традиция была заложена работой Ж.-П.Ви-нэ и Ж.Дарбельне «Сопоставительная стилистика французского и английского языков» (1958 г.), в ко­торой авторы фактически ставили знак равенства между понятиями сопоставительной стилистики и теории перевода. На эту особенность лингвопере-водческих исследований позднее обращали внима­ние и И.И.Ревзин и В.Ю.Розенцвейг: «Признавая ценность работ этого направления для теории пере­вода,.. нельзя вместе с тем не заметить смешения в них понятий стилистики и теории перевода» 104 . И тем не менее даже десятилетие спустя некоторые исследователи утверждали, что «лингвистическая теория перевода - это не что иное, как «сопостави­тельная лингвистика текста», то есть сопостави­тельное изучение семантически тождественных разноязычных текстов» 105 .

    На тесную связь контрастивной лингвистики и теории перевода указывает и само описание метода

    103 Ш в е й ц е р А. Д. М:
    Наука, 1988. СЮ.

    104 Р е в з и н И. И, Р о з е н ц в е й г В. Ю. Основы общего и машинного
    перевода. М.\
    Высш. шк., 1964. С.32.

    105 Б а р х у д а р о в Л. С. Язык и перевод (Вопросы общей и частной
    теории перевода). М.:
    Междунар. отношения, 1975. С.28.


    74 В.В.Сдобников, О.В.Петрова ТЕОРИЯ ПЕРЕВОДА

    Сопоставительного изучения языков. Принципы со­поставительного описания формулируются А.В.Фе­доровым следующим образом: «Специфичным для того или иного языка является не выражаемое зна­чение, общее для него с другим языком, а формаль­ные категории, в которых оно выражается, струк­турные особенности. От формальной категории, как от объективной данности (например, от определен­ного типа слов, словообразовательных моделей, от порядка слов, от двусоставных предложений с оп­ределенным типом подлежащего и т.п.) исследова­тель идет к определению ее значений в одном языке и далее к выражающим эти значения формальным средствам другого языка (совпадающим или иным типам слов, к одинаковому или отличному порядку слов, двусоставным или односоставным предложе­ниям и т.п.). Естественно, что при таком пути анали­за материал переводов является очень благодар­ным...» 106 . Из этого определения исследовательско­го метода следует, что лингвисты в интересах сопоставительного исследования языков исполь­зовали метод сравнения конкретных речевых про­изведений на разных языках, фактически являю­щихся оригиналами и переводами. Это полностью согласуется с утверждением Э.Косериу о том, что контрастивная лингвистика на уровне языковой нормы, которая исследует фактическое употребле­ние функциональных единиц, охватывает именно ту сферу, в которой протекает процесс перевода, и совпадает с ней. К теории перевода, по мнению Э.Косериу, ближе всего именно та область контра-стивной лингвистики, которая ориентирована на язык в действии. Подобно теории перевода, эта об­ласть имеет дело с речевыми реализациями языко­вой структуры, с областью функционирования язы­ка в речи, и, подобно частной теории перевода, она однонаправленна (например, проблема нахождения

    106 Цит. по: РевзинИ. И., РозенцвейгВ. Ю. Основы общего и машинного перевода. М.: Высш. шк.., 1964. С.33


    ЧАСТЬ //. Теория перевода как научная дисциплина 75

    Соответствий деепричастию актуальна лишь для перевода с русского языка и для контрастивной лин­гвистики, исходным языком которой является рус­ский) 107 .

    Данные контрастивной лингвистики несомнен­но полезны для лингвистической теории перевода. Исследуя соотношение между функциональными единицами языка А и языка В, контрастивная линг­вистика создает необходимый фундамент для пост­роения теории перевода. В самом деле, многие пе­реводческие трансформации, составляющие «тех­нологию» перевода, восходят в конечном счете к функционально-структурным расхождениям меж­ду «сталкивающимся» друг с другом в процессе пе­ревода языками. Контрастивная лингвистика в ряде случаев отвечает на вопрос, почему в переводе осу­ществляется та или иная операция 107 . Одной из при­чин использования переводческих трансформаций является наличие в одном из взаимодействующих языков так называемых «безэквивалентных форм», выявлению которых и способствуют данные кон­трастивной лингвистики.

    Можно сказать, что теория перевода нуждается в контрастивной лингвистике как в источнике исход­ных данных. Эти данные, проливающие свет на рас­хождения между структурными типами, системами и нормами языков, служат в качестве отправного пун­кта для собственно переводческого анализа 108 .

    Несмотря на тесную связь контрастивной линг­вистики и теории перевода, их нельзя приравнивать друг к другу. Задача контрастивной лингвистики - сопоставление языков, выявление их сходств и раз­личий. Теория перевода, в свою очередь, исследует перевод как специфический вид межъязыковой коммуникации, языкового посредничества. Ее це­лью является выявление сущности, перевода, его

    107 Ш в е й ц е р А. Д. Теория перевода: статус, проблемы, аспекты М:
    Наука, 1988. СП.

    108 Там же. С.12.


    76 В.В.Сдобников, О.В.Петрова ТЕОРИЯ ПЕРЕВОДА

    Механизмов, способов реализации, влияющих на него языковых и экстралингвистических факторов. Теория перевода, помимо исходного и конечного текстов, принимает во внимание социокультурные и психологические различия между разноязычны­ми коммуникантами, а также ряд других социокуль­турных и психолингвистических детерминантов процесса перевода. При этом учитывается, что пе­ревод - это не простая смена языкового кода, но и адаптация текста для его восприятия сквозь призму другой культуры.

    Введение

    Машинный перевод - процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем.

    Вместо "машинный" иногда употребляется слово автоматический, что не влияет на смысл. Однако не стоит путать машинный перевод с автоматизированным, он имеет совсем другое значение - при нём программа просто помогает человеку переводить тексты.

    Мысль использовать электронные вычислительные машины (ЭВМ) для перевода была высказана в 1947 году в США, сразу после появления первых ЭВМ. Первая публичная демонстрация машинного перевода состоялась в 1954 году. Несмотря на примитивность той системы, этот эксперимент получил широкий резонанс.

    К середине 1960-х в США для практического использования были предоставлены две системы русско-английского перевода:

    • · MARK
    • · GAT

    Однако созданная для оценки подобных систем комиссия ALPAC пришла к выводу, что в силу низкого качества машинно переведённых текстов эта деятельность в условиях США нерентабельна. Хотя комиссия рекомендовала продолжать и углублять теоретические разработки, в целом её выводы привели к росту пессимизма, снижению финансирования, часто к полному прекращению работ по этой тематике.

    Тем не менее, в ряде стран исследования продолжались, чему способствовал постоянный прогресс вычислительной техники. Особенно существенным фактором стало появление мини- и персональных компьютеров, а с ними всё более сложных словарных, поисковых систем, ориентированных на работу с естественно-языковыми данными. Росла и необходимость в переводе как таковом ввиду роста международных связей. Все это привело к новому подъёму этой области. Наступило время широкого практического использования переводческих систем, сложился рынок коммерческих разработок по этой теме.

    Впрочем, высококачественный перевод текстов широкой тематики по-прежнему недостижим. Однако несомненным является ускорение работы переводчика при использовании систем машинного перевода.

    1. Основная часть

    Системы машинного перевода делятся на три категории:

    • -системы на основе грамматических правил (Rule-Based Machine Translation, RBMT),
    • -статистические системы (Statistical Machine Translation, SMT)
    • -гибридные системы , сочетающие преимущества тех и других (являются наиболее перспективными)

    Машинный перевод на основе правил - общий термин, который обозначает системы машинного перевода на основе лингвистической информации об исходном и переводном языках. Они состоят из двуязычных словарей и грамматик, охватывающих основные семантические, морфологические, синтаксические закономерности каждого языка. Такой подход к машинному переводу еще называют классическим . На основе этих данных исходный текст последовательно, по предложениям, преобразуется в текст перевода. Принцип работы таких систем - связь структуры входного и выходного предложения. перевод компьютерный машинный

    RBMT системы делятся на три группы :

    • · системы пословного перевода;
    • · трансферные системы (Transfer) - преобразуют структуры входного языка в грамматические конструкции выходного языка;
    • · интерлингвистические системы (Interlingua)- промежуточный язык описания смысла.

    Основным достоинством систем на основе трансфера является высокая полнота охвата текстов при приемлемом уровне качества перевода, а также низкий уровень затрат на первичную разработку и модернизацию.

    Компоненты типичной RBMT:

    • · Лингвистические базы данных: - двуязычные словари; - файлы имен, транслитерации; - морфологические таблицы.
    • · Модуль перевода: - грамматические правила; - алгоритмы перевода.
    • · Преимущества RBMT систем :
      • - синтаксическая и морфологическая точность;
      • - стабильность и предсказуемость результата;
      • - возможность настройки на предметную область.
    • · Недостатки RBMT систем :
    • - трудоемкость и длительность разработки;
    • -необходимость поддерживать и актуализировать лингвистические БД;
    • -"машинный акцент" при переводе.

    Статистический машинный перевод - разновидность машинного перевода, где перевод генерируется на основе статистических моделей, параметры которых являются производными от анализа двуязычных корпусов текста (text corpora).

    Статистический машинный перевод противопоставляют системам машинного перевода, основанным на правилах, Rule-Based Machine Translation (RBMT), и на примерах, Example-Based MT (EBMT).

    Первые идеи статистического машинного перевода были опубликованы Уорреном Уивером (Warren Weaver) в 1949 году. "Вторая волна" - начало 1990-х, IBM. "Третья волна" - Google, Microsoft, Language Weaver, Яндекс.

    Статистические модели перевода:

    • · по словам (Word-based translation - WBT)
    • · по фразам (Phrase-based translation - PBT)
    • · по синтаксису (Syntax-based translation - SBT)
    • · по иерархическим фразам (Hierarchical phrase-based translation - HPBT)

    Преимущества SMT:

    • · Быстрая настройка
    • · Легко добавлять новые направления перевода
    • · Гладкость перевода

    Недостатки SMT:

    • · "Дефицит" параллельных корпусов
    • · Многочисленные грамматические ошибки
    • · Нестабильность перевода

    Разработчики систем машинного перевода для улучшения качества вводят некоторые "сквозные" правила, тем самым превращая чисто статистические системы в Гибридный машинный перевод. Добавление некоторых правил, то есть создание гибридных систем, несколько улучшает качество переводов, особенно при недостаточном объёме входных данных, используемых при построении индекса машинного переводчика.

    Гибридный машинный перевод - интеграция разных подходов машинного перевода из возможных вариантов МП:

    • · Rule-based machine translation (RBMT) - Машинный перевод на основе правил.
    • · Corpus-based machine translation (CBMT) - Машинный перевод на корпусах текстов.
    • · Example-based machine translation (EBMT) Машинный перевод на примерах.
    • · Statistical machine translation (SMT) - Статистический машинный перевод.

    Ожидается, что с помощью гибридной архитектуры удастся объединить преимущества этих подходов.

    Гибридная технология перевода предполагает использование статистических методов для построения словарных баз автоматическим путем на основе параллельных корпусов, формирования нескольких возможных переводов, как на лексическом уровне, так и на уровне синтаксической структуры предложения выходного языка, применения постредактирования в автоматическом режиме и выбор лучшего (наиболее вероятного) перевода из возможных на основе языковой модели, построенной по определенному корпусу выходного языка.

    Статистический МП стремится использовать лингвистические данные, а системы с "классическим" подходом, основанном на правилах, применяют статистические методы. Добавление некоторых "сквозных" правил, то есть создание гибридных систем, несколько улучшает качество переводов, особенно при недостаточном объеме входных данных, используемых при построении индексных файлов хранения лингвистической информации машинного переводчика, базирующегося на N-граммах.

    Архитектура Гибридной технологии "SMT и RBMT" [

    RBMT-система дополнена двумя компонентами: модулем статистического постредактирования и модулем языковых моделей. Статистическое постредактирование позволяет сгладить RB-перевод, приближая его к естественному языку и при этом сохраняя четкую структуру синтезируемого текста. Языковые модели используются для оценки гладкости и грамматической правильности вариантов перевода, порождаемых гибридной системой.

    Типичная архитектура HMT :

    • · Параллельный корпус;
    • · Обучение;
    • · Языковая модель;
    • · Данные для постредактирования;
    • · Правила синтеза;
    • · Словарь терминологии.

    Преимущества гибридного перевода:

    • · Быстрая автоматическая настройку на основе Translation Memories заказчика;
    • · Терминологическая точность перевода, а также единство стиля;
    • · Получение дополнительных полезных данных - двуязычного терминологического словаря.

    Заключение

    Главное преимущество машинного перевода в том, что он позволяет быстро справиться с очень большими объёмами текста и поэтому иногда оказывается экономически выгоднее перевода вручную. При этом следует помнить, что качество машинного перевода всегда будет уступать человеческому. Поэтому использовать его целесообразно лишь в определённых случаях.

    Многие типы материалов в принципе не предназначены для машинного перевода. Так, нельзя доверять машине тексты, где неточность перевода может поставить под угрозу здоровье человека, работоспособность сложного прибора или крупный контракт - сэкономленное время здесь не оправдывает риска. Любые документы, подразумевающие юридическую ответственность, требуют контроля человека. Машинный перевод непригоден для маркетинговых материалов, где текст фактически переосмысливается в новом культурном контексте и создается заново.

    Приемлемого качества можно ожидать при переводе строго формализованных технических текстов, в то время как художественные и рекламные тексты машинному переводу не поддаются.

    Прибегая к машинному переводу, важно не только чётко представлять себе желаемый результат и понимать ограничения этого метода, но и учитывать ещё один фактор. Системы МП обычно требуют сложной индивидуальной настройки и доработки, в том числе "обучения" по конкретной тематике - без этого они показывают гораздо худшие результаты. В связи с этим машинный перевод имеет смысл использовать, только если предстоит перевести огромные объёмы однотипных текстов. В этом случае будет экономически целесообразно затратить определённое время на обучение системы, затем применить машинный перевод и получить на выходе текст, пригодный для постредактирования. Если же речь идёт о нескольких десятках страниц, пытаться внедрить машинный перевод бессмысленно и попросту убыточно.

    Таким образом, машинный перевод с постредактированием может оказаться действительно выгодным, если переводятся тексты подходящего типа в очень больших объёмах. Поскольку большие объёмы переводов проходят через переводческие компании, которые часто специализируются в конкретных предметных областях, внедрение достаточно эффективных, но дорогих систем машинного перевода последнего поколения экономически оправдано именно в таких компаниях: ни поставщики контента, пусть даже крупные, ни индивидуальные переводчики не смогут самостоятельно эффективно использовать машинный перевод.

    Используемая литература

    • 1. http://www.logrus.ru
    • 2. http://www.moluch.ru/
    • 3. https://www.academia.edu
    • 4. http://study-english.info/

    Каким образом осуществляется работа программы переводчика?

    В ее основе лежит алгоритм перевода - последовательность однозначно и строго определенных действий над текстом для нахождения соответствий в данной паре языков L1 - L2 при заданном направлении перевода (с одного конкретного языка на другой). Обычные словари и грамматики разных языков не применимы для машинного перевода, так как описывают значения слов и грамматические закономерности в нестрогой форме, никак не приемлемой для «машинного» использования. Следовательно, нужна формальная грамматика языка, т.е. логически непротиворечивая и явно выраженная (безо всяких подразумеваний и недомолвок). Как только начали появляться формальные описания различных областей языка - прежде всего морфологии и синтаксиса, - наметился прогресс и в разработке систем автоматического перевода. Чтобы успешно работать, система машинного перевода включает в себя, во-первых, двуязычные словари, снабженные необходимой информацией (морфологической, относящейся к формам слова, синтаксической, описывающей способы сочетания слов в предложении, и семантической, т.е. отвечающей за смысл), а во-вторых - средства грамматического анализа, в основе которых лежит какая-нибудь из формальных, т.е. строгих, грамматик. Наиболее распространенной является следующая последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода.

    • 1. На первом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например дательного падежа множественного числа) во входном с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В процессе анализа из формы слова могут быть получены также сведения, относящиеся к другим уровням организации языковой системы, например, каким членом предложения может быть данное слово. Для машины совмещение двух этих операций - и грамматического разбора, и обращения к смыслу слов - задача трудная. Лучше сделать синтаксический анализ не зависящим от смысла слов, а словарь использовать на других этапах перевода.
    • 2. Что такое независимый синтаксический анализ, можно понять, если попытаться разобрать фразу, из которой «убраны» значения конкретных слов. Блестящим образцом фразы такого рода является придуманное академиком Л.В. Щербой предложение: Глокая куздра штетко будланула бокра и кудрячит бокрёнка. Бессмысленная фраза? Как будто да: в русском языке нет слов, из которых она состоит (кроме союза и). И все же в какой-то степени мы ее понимаем.
    • 3. То есть машина осуществляет синтаксический анализ предложения без опоры на значения составляющих его слов, с использованием информации только об их грамматических свойствах. В результате синтаксического анализа возникает синтаксическая структура, которая изображается в виде дерева зависимостей: «корень» - сказуемое, а «ветви» - синтаксические отношения его с зависимыми словами. Каждое слово предложения записывается в своей словарной форме, а при ней указываются те грамматические характеристики, которыми обладает это слово в анализируемом предложении.
    • 4. 2. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области (например, при англо-русском переводе обороты типа in case of, in accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамматического анализа); определение основных грамматических (морфологических, синтаксических, семантических и лексических) характеристик элементов входного текста (например, числа существительных, времени глагола, их роли в данном предложении и пр.), производимое в рамках входного языка; разрешение неоднозначности (скажем, англ. round может быть существительным, прилагательным, наречием, глаголом или же предлогом); анализ и перевод слов. Обычно на этом этапе однозначные слова отделяются от многозначных (имеющих более одного переводного эквивалента в выходном языке), после чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие / отсутствие контекстных определителей значения.
    • 5. 3. Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка.
    • 6. 4. Синтез выходных словоформ и предложения в целом на выходном языке. Здесь не получится обойтись простым переводом «узлов» дерева на другой язык. Синтаксис каждого языка устроен на свой лад: то, что в русском предложении - подлежащее, в другом языке может (или должно) быть выражено дополнением, а дополнение, наоборот, должно преобразоваться в подлежащее; то, что в одном языке обозначается группой слов, переводится на другой всего одним словом и т.д. Такой переход от структуры к реальному предложению называется синтаксическим синтезом.
    • 7. В зависимости от особенностей морфологии, синтаксиса и семантики конкретной языковой пары, а также направления перевода общий алгоритм перевода может включать и другие этапы, а также модификации названных этапов или порядка их следования, но вариации такого рода в современных системах, как правило, незначительны. Для решения проблемы многозначности слова используется анализ контекста. Дело в том, что каждое из нескольких значений многозначного слова в большинстве случаев реализуются в своем наборе контекстов. То есть у каждого из «конкурирующих» (при интерпретации) значений - свой набор контекстов. И именно вот эта зависимость значения от окружения позволяет слушающему понять высказывание правильно. Для правильного понимания высказывания необходимо в полной мере учитывать также правила обусловленности выбранного значения лексическим окружением (действующие при «фразеологической» интерпретации слова), правила обусловленности выбранного значения семантическим контекстом (так называемые законы семантического согласования) и правила обусловленности выбранного значения грамматическим (морфолого-синтаксическим) контекстом.
    • 8. Действующие системы машинного перевода, как правило, ориентированы на конкретные пары языков (например, французский и русский или японский и английский) и используют, как правило, переводные соответствия либо на поверхностном уровне, либо на некотором промежуточном уровне между входным и выходным языком. Качество машинного перевода зависит от объема словаря, объема информации, приписываемой лексическим единицам, от тщательности составления и проверки работы алгоритмов анализа и синтеза, от эффективности программного обеспечения. Современные аппаратные и программные средства допускают использование словарей большого объема, содержащих подробную грамматическую информацию. Информация может быть представлена как в декларативной (описательной), так и в процедурной (учитывающей потребности алгоритма) форме.
    • 9. В практике переводческой деятельности и в информационной технологии различаются два основных подхода к машинному переводу. С одной стороны, результаты машинного перевода могут быть использованы для поверхностного ознакомления с содержанием документа на незнакомом языке. В этом случае он может использоваться как сигнальная информация и не требует тщательного редактирования. Другой подход предполагает использование машинного перевода вместо обычного «человеческого». Это предполагает тщательное редактирование и настройку системы перевода на определенную предметную область. Здесь играют роль полнота словаря, ориентированность его на содержание и набор языковых средств переводимых текстов, эффективность способов разрешения лексической многозначности, результативность работы алгоритмов извлечения грамматической информации, нахождения переводных соответствий и алгоритмов синтеза. На практике перевод такого типа становится экономически выгодным, если объем переводимых текстов достаточно велик (не менее нескольких десятков тысяч страниц в год), если тексты достаточно однородны, словари системы полны и допускают дальнейшее расширение, а программное обеспечение удобно для постредактирования.