sitemap.xml создание файла, правильная карта сайта

Автоматическая генерация sitemap, независимо от структуры сайта возможна при помощи различных сервисов, которые обходят сайт (”пауки”) и на основе этих данных создают файл, который следует загрузить на сайт. Возможна загрузка файла автоматически через определённые промежутки времени (не исключено, что такая услуга платная - либо с ограничениями, например, на количество страниц в карте сайта)

Для генерации sitemap.xml “вручную” средствами сервера, в случае, если мы знаем структуру сайта можно написать несложный скрипт, который будет получать информацию о страницах сайта (очень часто, она хранится в базе данных) и помещать её в XML-файл определённого формата - более подробное описание можно посмотреть на “официальном” сайте
http://www.sitemaps.org/ или русскоязычный раздел - http://www.sitemaps.org/ru/

Памятка по sitemap.xml

Приводить полное описание формата не вижу смысла. Отмечу лишь отдельные моменты и ответы на вопросы по формату sitemaps, которые возникали (не только у меня). Большая часть информации содержится в мануале. Там же есть и примеры правильного sitemap.

  • Обязательными являются только теги <urlset> <url> и <loc>, все дополнительные теги по соседству с loc не обязательны.
  • Вся информация в карте сайта носит “рекомендательный” характер для поисковиков - т.е. если для значений changefreq, например, never или always, это не означает, что поисковый робот будет сканировать страницы с указанной частотой.
  • priority - по умолчанию 0,5; может принимать значения от 0 до 1. Можно использовать для увеличения вероятности присутствия в индексе поисковых систем наиболее важных страниц.
  • В случае большой карты сайта (более 10Мб или 50000 адресов) следует разбивать Sitemap на несколько файлов. Каждый из них можно указать в robots.txt (про правильный robots.txt уже упоминал ранее), или использовать sitemap index, в котором будут указаны ссылки на отдельные карты сайта.
    Sitemap: http://www.example.com/sitemap.xml
  • Можно вместо XML-формата просто перечислить URL в текстовом файле (каждый адрес с новой строки)
  • Для файлов Sitemap Index обязательны теги <sitemapindex>      <sitemap>      <loc>
  • sitemap должен располагаться в корневом каталоге (адреса, не совпадающие с каталогом sitemap недопустимы)
  • после обновления карты сайта можно “пингануть” - сообщить поисковику об этом (не забываем про URLencode):
    {адрес-поисковика}/ping?sitemap=http://www.example.com/sitemap.xml
    www.google.com/webmasters/tools/ping?sitemap=sitemap_url

Проверка Sitemap

Для проверки файлов sitemap на корректность можно воспользоваться уже готовыми инструментами, например

  • http://webmaster.yandex.ru/sitemaptest.xml
  • Инструменты вебмастеров Google - Add/Test Sitemap https://support.google.com/webmasters/answer/183672?hl=EN

Кроме того, можно использовать сервисы, которые помимо проверки собственно самого файла sitemap обходят все адреса, указанные в файле и проверяют их на доступность (как минимум, корректный код ответа 200)

Метки:

Автор будет признателен, если Вы поделитесь ссылкой на статью, которая Вам помогла:
BB-код (для вставки на форум)

html-код (для вставки в ЖЖ, WP, blogger и на страницы сайта)

ссылка (для отправки по почте)

Добавить комментарий