Андрей Крупин
Специалисты компании PROMT отрапортовали о создании гибридной системы перевода текстов DeepHybrid, совмещающей классическую технологию машинного перевода rule-based (машинный перевод, основанный на правилах) и статистические методы, до сих пор используемые только по отдельности.
По словам разработчиков, кардинальное отличие нового решения заключается в том, что вместо одного варианта перевода программа порождает множество переводов, число которых у одного предложения, в зависимости от многозначности слов, конструкций, и результатов статистической обработки, может доходить до нескольких сотен. Далее вероятностная модель языка позволяет выбрать самый вероятный из предложенных вариантов.
В компании подчеркивают, что вероятностная модель языка и компоненты системы, выполняющие статистическую обработку, создаются с использованием корпусных и статистических методов на основе тысяч текстов, миллионов слов и словосочетаний, объединенных определенной тематикой. При этом даже на самых больших объемах текстов построение всех необходимых средств занимает всего несколько часов.
Первые пользователи системы DeepHybrid, как ожидается, появятся уже в 2011 году на американском рынке. В PROMT уверены, что гибридная технология перевода сыграет значимую роль в области лингвистических IT-решений и будет интересна крупным организациям, реализующим проекты по выводу своих продуктов на рынки других стран.
Ссылки по теме