О кодированных текстовых файлах

Как правило, можно совместно использовать текстовые файлы, не обращая внимание на то, каким образом хранится текст в этих файлах. Однако, если с текстовыми файлами работают несколько пользователей, которые используют различные языки или загружают файлы из Интернета, либо используют другие компьютерные системы, при открытии и сохранении файла может потребоваться выбрать стандарт кодировки.

При открытии текстового файла в Microsoft Word или другой программе, а возможно, на компьютере, где установлена операционная система на другом языке, стандарт кодировки помогает программе определить, каким образом следует представить текст для того, чтобы его можно было прочитать.

Что такое кодированный текстовый файл?

Когда текстовый файл закодирован, он сохраняется в соответствии со стандартом кодировки - определенным набором правил, в соответствии с которыми каждому текстовому знаку присваивается числовое значение. Существует множество различных стандартов кодировки, представляющих наборы знаков, используемые в различных языках, причем некоторые из этих стандартов поддерживают только знаки одного языка. Так, для текста на китайском языке может быть использован стандарт кодировки GB2312-80 в случае упрощенного письма и стандарт кодировки Big5 в случае традиционного письма.

Поскольку в Microsoft Word используется стандарт кодировки Юникод (Юникод. Стандарт кодировки знаков, разработанный консорциумом Unicode. Используя для представления каждого знака более одного байта, Юникод позволяет представить в одном наборе знаков почти все языки мира.), то в Microsoft Word можно открывать и сохранять файлы с использованием стандартов кодирования для различных языков. Например, работая с операционной системой, использующей интерфейс на английском языке, в Microsoft Word можно открыть текстовый файл, созданный с использованием стандарта кодировки для греческого или японского языка.

Открытие кодированных текстовых файлов в Microsoft Word

При открытии текстового файла Microsoft Word пытается определить стандарт кодировки, использованный для этого файла. Microsoft Word автоматически определяет большинство существующих стандартов кодировки. Если используемый в файле стандарт кодировки совпадает со стандартом, используемым текущей версией Microsoft Windows для сохранения файлов как простого текста, Microsoft Word открывает файл без дополнительных преобразований.

Если стандарт кодировки определить не удалось, или если он не соответствует стандарту, используемому в Microsoft Windows по умолчанию, то необходимо выбрать правильный стандарт кодировки из списка в диалоговом окне Преобразование файла. Выбранный стандарт кодировки будет использован для преобразования файла в кодировку Юникод (Юникод. Стандарт кодировки знаков, разработанный консорциумом Unicode. Используя для представления каждого знака более одного байта, Юникод позволяет представить в одном наборе знаков почти все языки мира.). Для проверки удобочитаемости текста до открытия файла можно предварительно его просмотреть.

Сохранение файлов как кодированного текста в Microsoft Word

При сохранении файла в виде кодированного текста в первый раз необходимо выбрать нужный стандарт кодировки. По умолчанию выбран стандарт Юникод (Юникод. Стандарт кодировки знаков, разработанный консорциумом Unicode. Используя для представления каждого знака более одного байта, Юникод позволяет представить в одном наборе знаков почти все языки мира.), поскольку он поддерживает большинство знаков.

Если был выбран стандарт кодировки, не поддерживающий знаки, используемые в файле, Microsoft Word подчеркивает красным знаки, которые невозможно сохранить. Можно просмотреть текст в выбранном стандарте кодировки перед сохранением файла. После того как файл закодирован, Microsoft Word продолжает использовать выбранный стандарт кодировки при выборе команды Сохранить (меню Файл) до тех пор, пока не будет выбран другой стандарт кодировки.

При сохранении файла как кодированного текста, форматирование текста, в котором использованы шрифт Symbol или коды полей, не сохраняется.

Стандарты кодировки, поддерживаемые Microsoft Word

По умолчанию при установке Microsoft Office Microsoft Word устанавливает несколько стандартов кодировки и поддерживает стандарт кодировки, используемый операционной системой, установленной на компьютере. Можно установить дополнительные стандарты кодировки, запустив программу установки Microsoft Office еще раз. В окне установки программы Устанавливаемые компоненты разверните компонент Общие средства Office, а затем - компонент Многоязыковая поддержка. Щелкните стрелку рядом с элементом, который необходимо установить, и выберите вариант Запускать с моего компьютера.

Дополнительные сведения см. в документации по Microsoft Windows.


Страница сайта http://test.interface.ru
Оригинал находится по адресу http://test.interface.ru/home.asp?artId=17093