Microsoft проникла в Wikipedia с СПО-переводчиком

Источник: CNews

Microsoft Research, исследовательское подразделение компании Microsoft, объявило о запуске нового проекта WikiBhasha совместно с крупнейшей онлайн-энциклопедией Wikipedia.

Инструмент WikiBhasha создан исходя из предположения, что англоязычная версия Wikipedia наиболее полна по сравнению с версиями на других языках. Он позволяет редакторам Wiki находить контент в английской энциклопедии и переводить его на другие языки, после чего либо создавать новые статьи, которых нет в других языковых разделах, либо добавлять полученный текст в уже существующие.

По словам представителей Microsoft Research, новый инструмент будет поддерживать создание нового контента на более чем на 30 языках мира. Его название - WikiBhasha - образовано от слова "bhasha", означающего "язык" на хинди и санскрите.

WikiBhasha - проект с открытым исходным кодом, выпущенным под лицензией Apache License 2.0. Бета-версия WikiBhasha доступна всем желающим на сайте Wikipedia или на ресурсе wikibhasha.org в виде инсталлируемого букмарклета. Само приложение работает на платформе Windows Azure.

Microsoft сообщает, что WikiBhasha можно инсталлировать в браузары Internet Explorer (7.0 и 8.0) в операционных системах Windows XP, Vista и Windows 7, а также в Firefox (3.5 и выше) на Linux Fedora (11 и 12), Windows XP, Vista и Windows 7.

Wikimedia Foundation и Microsoft Research планируют в будущем тесно сотрудничать с пользовательским сообществом Wikipedia, фокусируясь на создании нового контента для арабского, немецкого, японского, португальского, испанского и хинди разделов энциклопедии.

"Мы всегда рады видеть работу по улучшению сотрудничества между разделами Wikipedia на разных языках. Microsoft Research проделала в рамках WikiBhasha очень хорошую работу. Также мы рады, что компания открыла исходный код этого инструмента", - отметил Дениз Купер (Danese Cooper), технический директор Wikimedia Foundation.

Разработчики WikiBhasha надеются, что данное решение позволит существенно увеличить объемы контента в версиях Wikipedia на разных языках. По их словам, это поможет не только обычным пользователям, но и специалистам, которые работают над улучшением качества машинного перевода.

"Бета-версия WikiBhasha позволяет легко создавать контент на множестве языков, создавая большое количество параллельных данных на разных языках для исследователей, которые занимаются разработками в области машинного перевода. С участием сообществ пользователей Wikipedia, можно существенно увеличить объемы качественного контента на разных языках", - сказал П. Анандан (P. Anandan), управляющий директор Microsoft Research India.

После выхода пресс-релиза Microsoft в ИТ-блогах было высказано предположение, что посредством WikiBhasha корпорация Microsoft будет тестировать свои технологии машинного перевода.


Страница сайта http://test.interface.ru
Оригинал находится по адресу http://test.interface.ru/home.asp?artId=24548