Как создавать и отправлять файлы Sitemap

Опубликовано: 20.10.2017

Здравствуйте, читатели блога Сайт с нуля.

Из этой статьи вы узнаете, как создать файл Sitemap и предоставить к нему доступ роботам Google.

Как создавать и отправлять файлы Sitemap

Решите, какие страницы вашего сайта должны сканировать поисковые роботы Google, и определите канонические URL для каждой из них. Определите, какой формат файла Sitemap нужно использовать. Создать файлы Sitemap можно как вручную, так и автоматически с помощью сторонних инструментов. Проверьте файл Sitemap. Сделайте файл доступны для Google, добавив его в robots.txt и отправив в Search Console.

Для всех форматов действуют следующие ограничения: файл Sitemap может содержать не более 50 000 URL, а его размер в несжатом виде не должен превышать 10 МБ. Если объем файла или количество перечисленных в нем адресов превышают эти пределы, разбейте его на несколько частей. Вы можете создать файл индекса Sitemap, перечислив в нем все файлы Sitemap, и отправить их в Google все сразу.

Общие рекомендации по файлам Sitemap

Используйте один и тот же синтаксис при указании URL . Google будет сканировать их в точности по списку. Например, если сайт размещен по адресу http://www.example.com/, не используйте URL /http://example.com/ (без www) или ./MoyaStranitsa.html (относительный URL). Не указывайте в добавляемых URL идентификаторы сессий  – это может привести к избыточному сканированию страниц. Добавляйте в файл Sitemap информацию о переведенных страницах для их сканирования и индексирования. Это можно сделать с помощью атрибутов hreflang. Файлы Sitemap должны использовать кодировку UTF-8, а в URL необходимо применять экранирование . Разбивайте большие файлы Sitemap на файлы поменьше, чтобы снизить нагрузку на сервер при отправке информации в Google. Файл Sitemap может содержать не более 50 000 URL, а его размер в несжатом виде не должен превышать 10 МБ. Use a sitemap index file  to list all your sitemaps and submit this single file to Google rather than submitting individual sitemaps. Используйте рекомендуемые методы канонизации URL, чтобы сообщить Google о версии домена, для которой составлен файл Sitemap (если сайт доступен как с www, так и без www). В этом случае потребуется только один файл Sitemap. Familiarize yourself with our Webmaster Guidelines, and our SEO Starter Guide  if you’re considering hiring a consultant to help you optimize your sitemaps. Также мы рекомендуем посоветоваться с владельцами схожих сайтов или аналогичных компаний. Применяйте только цифры и латинские буквы. Файл Sitemap обязательно должен быть в кодировке UTF-8 (обычно ее можно выбрать при сохранении). Во всех файлах XML для любых значений данных (включая URL) необходимо применять маскирование элементов при использовании символов, перечисленных в таблице ниже.  Файл Sitemap может содержать только символы ASCII. В нем не должно быть расширенных символов ASCII, определенных управляющих кодов и специальных символов, таких как * и {}. Если они указаны в URL, то при попытке обработать такой файл появится сообщение об ошибке.

Символ Маскирование
Амперсанд & &
Одинарные кавычки '
Двойные кавычки « "
Больше чем > >
Меньше чем < &lt;

Кроме того, все URL (включая адреса в вашем файле Sitemap) должны быть защищены. Также используйте кодирование, чтобы веб-серверу было проще их обрабатывать. Однако если для создания URL вы применяете какой-либо сценарий, инструмент или файл журнала, то есть не вводите адреса вручную, обычно это выполняется автоматически. Если при отправке файла Sitemap вы получаете оповещение о том, что Google не удалось найти ваши URL, убедитесь, что они соответствуют стандарту RFC-3986 для URI, стандарту RFC-3987для IRI и стандарту XML.

rss