Три подхода в использовании системы Google Sitemaps (исходники, download)

Источник: vitaweb
Титус Хоскинс, Перевод: Демьянчук Виталий

Недавно компанией Google был представлен новый механизм упрощающий индексацию сайта, при помощи которого любой веб-мастер может создавать так называемую карту сайта и предлагать её для индексирования в Google.
Это самый быстрый и простой вариант, который позволит индексировать ваш сайт чаще, предоставляя людям, которые ищут через эту поисковую систему, самую свежую информацию о вашем сайте.

Эта система получила соответствующее название Google Sitemaps (Sitemap - карта сайта).

Для того, чтобы наиболее эффективно использовать технологию Google Sitemaps на вашем сайте, вы должны иметь специальным образом сгенерированный XML-файл для отправки информации об изменениях страниц непосредственно в Google.
Технология XML (Extensible Markup Language - наращиваемый язык разметки) сегодня на слуху, много людей XML уже давно успешно используют. Вы наверняка видели оранжевую пиктограмму на многих веб-сайтах. Очень часто он ассоциируется с ведением блогов, потому что блоги используют XML/RSS-ленты для трансляции своей информации.

Сегодня RSS в быту можно перевести как "Really Simple Syndication - действительно простая трансляция", но разработчики этого формата расшифровывают аббревиатуру RSS как "богатая сводка информации о сайте". XML - это, примерно, настолько же простой код, как и HTML. Самая распространённая сфера применения XML - RSS-ленты новостей, которые доставляют определённого рода информацию о сайте заинтересованным лицам.

В нашем случае заинтересованным лицом является Google. При создании файла XML для системы Sitemaps Google как бы просит веб-мастеров сообщать об изменениях на сайте, фактически, веб-мастер выполняет работу Googlebot'а.

Это очень полезная вещь! В Интернете постоянно появляется очень много новых сайтов. Индексирование всего того материала, что появляется каждый день, - довольно тяжёлая задача для Google. При помощи сервиса Sitemaps, веб-мастеры сегодня могут быть уверенными в том, что их веб-сайт будет обязательно проиндексирован.

Будьте добры, заметьте, что использование сервиса Sitemaps НИКАК не может повлиять на ваши показатели в самом поиске. Вы будете продолжать борьбу со своими конкурентами за высокие позиции результатов выдачи запрошенной информации. Однако Sitemaps поможет вам быть уверенным в том, что все ваши страницы будут быстро проиндексированы и переиндексированы поисковой системой Google.

Существуют также и другие весомые преимущества использования сервиса Google's Sitemaps: в основном они выражаются в управлении некоторыми ключевыми переменными, атрибутами и тегами в файле XML. Попытаюсь объяснить это максимально понятно: технология Sitemaps реализуется в одном файле с расширением .xml, который находится в корне вашего сайта. XML-файл сайта содержится небольшой код, описывающий каждую страницу вашего сайта.

Вот небольшой пример:

<?xml version="1.0" encoding="UTF-8"?>
<url>
<loc>http://www.yoursite.com/</loc>
<priority>1.0</priority>
<lastmod>2005-07-03T16:18:09+00:00</lastmod>
<changefreq>daily</changefreq>
</url>

В начале документа содержится информация о файле, а также XML-код. Весь код, описывающий одну страницу, заключается между тегами <url> в начале и конце одного XML-блока, который отвечает за одну страницу.
Это и есть базовый синтаксис нужного нам XML-файла. Размер файла будет зависеть только от количества тех страниц, которые вы имеете на вашем сайте.

Давайте посмотрим на стандартные элементы любого XML-файла, который необходим для корректной работы сервиса Google Sitemaps:

location - http://www.yoursite.com - адрес страницы сайта

priority - здесь вы устанавливаете приоритет конкретной страницы над другой страницей. Почему же это так важно?
У вас на сайте есть страницы, которые по каким-то причинам важнее, нежели другие. Те страницы, на которые, по вашему мнению, следует обратить большее внимание поисковой системы, как правило, имеют более высокое значение этого параметра (0.0 - наименьший приоритет страницы, 1.0 - наибольший, а 0.5 - соответственно среднее значение).
Эти значения относятся только к страницам вашего файла. Данное поле никак не может повлиять на ваши показатели в поисковой системе.

last modified - дата последнего изменения страницы. Данная отметка позволяет избежать переиндексирования тех страниц, которые не были изменены с момента последнего визита поисковой системы.

change frequency - этим параметром вы говорите Google, как часто вы делаете изменения на этой странице. Для этого параметра есть опции: Never - никогда, weekly - еженедельно, daily - ежедневно, hourly - ежечасно и так далее. Если вы часто обновляете страницу, то этот параметр очень важен.

Зачем мне нужен XML-генератор?

Как показывает практика, XML-файл на вашем сайте необходимо постоянно обновлять. Следовательно, для сохранения драгоценного времени вам нужен генератор, который мог бы просканировать страницы вашего сайта, составить список всех адресов страниц, а затем отправлять этот файл Google. Помните, что Google также предоставляет вам возможность отсылки и обычного текстового файла со всеми адресами страниц вашего сайта.

К текущему моменту существует большое количество генераторов, программ которые могут составлять XML-файлы карты сайта. Пока вы читаете эту статью, в Мире с каждой минутой их становится всё больше и больше.

Для вашего удобства, мы опишем здесь 3 различных подхода по уровню сложности, благодаря которым вы можете сгенерировать XML-файлы карты сайта.

Очень сложный подход: генератор на Python

Если вы знаете ваш сервер, как свои 5 пальцев, и вы не испытываете труда в установке скриптов, то тогда слово "сложность" - это ничто для вас. Google предоставляет небольшой скрипт генератора, который вы можете загрузить отсюда: ссылка на генератор. и установить на ваш сайт. Он будет автоматически сканировать директорию вашего сайта, наполнять ваш XML-файл содержимым, а затем отправлять его в Google.

Для работы этого скрипта необходим Python версии 2.2, который должен быть установлен на вашем веб-сервере. Однако его трудно найти на многих веб-серверах. Но если вы отличный специалист, то использование этого метода - самый лучший вариант.

Ваш не нужно иметь аккаунта в Google для использования сервиса Sitemaps, но всё-таки желательно его получить, т. к. в данном случае вы сможете получать статистическую информацию о вашем сайте. Если вы уже имеете другой аккаунт в системе Google: будь то Gmail, Google Alerts и так далее, - просто используйте какой-нибудь из них для входа и следуйте указаниям оттуда.

Сложный: генератор на коде PHP

Это генератор, написанный на коде PHP, который вы можете загрузить на ваш сервер. Данный генератор проиндексирует ваш сайт и предоставит вам сгенерированный XML-файл карты сайта. Загрузить PHP-скрипт можно отсюда: Загрузить phpSitemapNG. Закачайте этот файл на ваш сервер, запустите генератор для того, чтобы создать XML-файл и отправить его в Google.

Опять же, эта задача не покажется трудной, если вы хорошо разбираетесь в PHP и настройке скриптов.

Простой подход: бесплатный онлайновый генератор

Эти генераторы можно найти везде, и Google содержит список этих "сторонних собирателей" на своём сайте. Найти их можно здесь: http://code.google.com/sm_thirdparty.html.

Самый простой в использовании - это http://www.xml-sitemaps.com: (желательно использовать сервис: http://www.sitemapspal.com/, т к. на момент перевода статьи вышеупомянутый севрис был не доступен - прим. переводчика) вы можете индексировать до 500 (2000 страниц - http://www.sitemapspal.com/) страниц этим онлайновым генератором за довольно короткий промежуток времени. Робот проиндексирует ваш сайт, создаст XML-файл, который вы можете загрузить в сжатом или несжатом виде, сделав небольшие изменения, такие как установка приоритетов, смена частоты и т. д.

Затем загрузите этот файл на ваш сайт с именем sitemap.xml в корневую директорию, т. е. туда, где находится главная страница вашего сайта. Дайте знать системе Google Sitemaps о вашем XML-файле. Больше ничего не нужно.

Конечно, есть один недостаток: если вы часто добавляете страницы на ваш сайт, вам придётся также добавлять в ваш XML-файл карты сайта новые строчки. Однако это действительно большая проблема только для тех, кто каждый день добавляет новые страницы на сайт. Здесь вам только поможет знание таких технологий, как Python или PHP, чтобы всё это делать автоматически.

Google - главная поисковая система Интернета, так что возможность обновлять информацию о ваших страницах, используя систему Google Sitemaps, очень важный шаг. Если вы хотите, чтобы ваш сайт был конкурентоспособным, это фактически самый мудрый способ добиться вашей цели.

В каталоге Download Вы можете найти другие полезные материалы - утилиты, программы, документацию, исходники, электронные книги. Если Вы обнаружили неработающую ссылку, пожалуйста, помогите другим посетителям и администратору каталога Download - сообщите об этом редактору.


Страница сайта http://test.interface.ru
Оригинал находится по адресу http://test.interface.ru/home.asp?artId=4347