Освоение XML в среде Microsoft Word 2003Источник: PC Magazine/RE №2/2005 Ричард В. Дрейган
То, с чем легко справляются машины, зачастую сопряжено с трудностями для человека, и в этом смысле XML (eXtensible Markup Language - расширяемый язык разметки) не исключение. Однако XML позволяет многократно использовать документы и контент, а также автоматизировать деловые процедуры, поэтому накопление опыта и знаний в этой области оправдает себя. К счастью, задача существенно упростилась с появлением версии Microsoft Office 2003. Итак, приступим к делу. Откройте Word 2003 и наберите в новом файле какую-нибудь строку текста. Сохраните его с помощью команды File / Save As (Файл / Сохранить как), но в качестве типа документа задайте XML. С помощью Проводника (Explorer) укажите местонахождение файла, щелкните на нем правой клавишей мыши, выберите вариант Open With (Открыть как), после чего обратитесь к редактору Notepad. В результате вы обнаружите, что в Word 2003 работать с XML можно на любом уровне. Для документов Word, сохраненных в XML-формате, применяется подготовленная в Microsoft схема под названием WordML (обратите внимание на третью строку своего XML-файла), которая описывает организацию XML-файла и набор допустимых тегов. (Все схемы определяют форму данных, порядок элементов или тегов, сколько тегов требуется и есть ли в них необходимость. Подробная информация о схемах изложена в статье «Structuring XML Documents» (Структурирование XML-документов) по адресу http://go.pcmag.com/structuringxml.) Просмотрев свой WordML-документ, вы увидите, что вся информация, касающаяся документа Word, - шрифты, стили, индивидуальные параметры и сам текст - хранится между XML-тегами w:wordDocument и /w: wordDocument. В WordML представлена лишь одна из схем, но для формирования данных в соответствии с определенными требованиями понадобятся другие схемы. К счастью, Word 2003 позволяет импортировать XSD-файлы, необходимые для построения и редактирования новых XML-документов. Допустим, что ваша организация планирует обеспечить пользователям возможность импорта материалов с новостями в XML-формате, подходящем для системы управления контентом. Воспользуемся файлом под названием Article.xsd, с выбранной нами готовой схемой и соответствующим его структуре образцом XML-документа под названием SampleArticle.xml. (См. подробности по адресу http://go.pcmag.com/samplexmldocs.) Этот информационный объект содержит поля, с обработкой которых справляется система управления онлайновой информацией, такие, как заголовки новостей, ключевые слова и фотографии. Необходимо «сообщить» Word 2003, что будет использоваться выбранный нами специальный XSD-файл. Обратимся к команде File / New (Файл / Создать) и выберем вариант XML-документ. В правой панели XML Structure щелкнем на пункте Templates and Add-ins (Шаблоны и надстройки), затем на вкладке new XML Schema. Щелкнем после этого на кнопке Add Schema и найдем файл Article.xsd. И наконец, выберем для этой схемы URI-имя. В данном случае тип будет у нас обозначаться как «Article», что позволит «зарегистрировать» в Word новый XML-тип. Начать работу с XML лучше всего с образца документа того типа, который вы хотели бы создать и который соответствует вашему XSD-файлу, например такого, как выбранный нами SampleArticle.xml. В качестве базового XML-редактора Word 2003 отлично справляется со своими функциями, ярко выделяя XML-теги с маркерами полей. Щелкнув на любом из полей, можно быстро выделить внутреннее содержимое любого тега или поля (вместе с вложенными полями и имеющимися в них иерархическими тегами). Можно скрыть эти поля или показать их на экране клавишной комбинацией Ctrl-Shift-X, а также добавлять или удалять теги. После щелчка правой клавишей мыши и выбора пункта View XML Structure Word проанализирует известные теги в файле с XML-документом и выведет их список в правой части экрана в панели XML Structure. Если XML-элементы в документе соответствуют XSD-схеме, файл называют допустимым XML-документом. Мы не рекомендуем наспех вводить в Word 2003 новые теги, так как это может нанести вред имеющемуся допустимому XML-документу. Но, если ваш XML-документ достаточно простой и у вас есть справочная распечатка допустимых в нем тегов и полей, вы, наверное, сможете размечать содержимое, исходя из особенностей этой XML-структуры. Еще один аспект XML-конструкции - XML-атрибуты: если щелкнуть правой клавишей мыши на каком-либо поле, а затем выбрать пункт Attributes, можно будет просматривать и редактировать эти связанные с полями дополнительные элементы. Но широкое использование атрибутов в XML-схеме затрудняет рядовому пользователю редактирование XML-материалов. На рисунке показан образец файла с XML-материалом, сформированного по такой же XSD-схеме, но содержащего только заполнитель. Создавая по XSD-«шаблону» подобный этому образец документа с заполнителем в каждом поле, вы превращаете обычную программу Word 2003 в редактор форм на базе XML. Вполне успешно применять Word в качестве инструмента ввода данных способен практически любой пользователь. Достаточно лишь ввести необходимые данные на место текста-заполнителя в соответствующем поле в рамках каждого тега (и сохранить файл под новым именем). Заполняя требующейся информацией поля между тегами, можно создавать новые XML-документы, соответствующие выбранным вами стандартам. Разрабатывать новые XSD-схемы Word 2003 не позволяет, но можно импортировать существующие. По прогнозам Microsoft (http://msdn.microsoft.com/library/default.asp? url=/library/en-us/dno2k3ta/html/ODC_OFXML_in_Office2003_jrd.asp) в будущем практически каждому из нас придется работать с XML-данными, но чаще всего по схемам, разработанным другими. Если же собственных схем вы не строите, то в вашем распоряжении будет множество их вариантов от отраслевых объединений, поставщиков и квалифицированных пользователей. |