Как разбить файл sitemap на несколько файлов?
Разбиение sitemap.xml
на несколько файлов — это стандартная практика, когда количество URL-адресов в карте сайта превышает лимит в 50 000 строк или размер файла приближается к 50 МБ. Для этого используется механизм индексирования карт сайтов через файл sitemapindex.xml
, который содержит ссылки на отдельные файлы sitemap.xml
.
Вот пошаговая инструкция и пример, как это сделать:
Шаг 1: Разделите список URL-адресов
Предположим, у вас есть большой список URL-адресов. Вы можете разделить его на части вручную или автоматически с помощью скрипта. Например, каждая карта сайта будет содержать до 10 000 URL-адресов.
Пример разделения списка:
Этот файл сохраняем как sitemap1.xml
. Затем создаем второй файл sitemap2.xml
с остальными URL-адресами.
Шаг 2: Создайте индексный файл sitemapindex.xml
Теперь создадим основной файл sitemapindex.xml, который будет указывать на каждый отдельный файл карты сайта.
Пример sitemapindex.xml
:
Шаг 3: Укажите путь к sitemapindex.xml
в robots.txt
Чтобы поисковые системы могли найти вашу карту сайта, добавьте строку в файл robots.txt
:
Sitemap: https://example.com/sitemapindex.xml
Таким образом, вы сообщаете поисковикам, где находится главная карта сайта.
Итоговый результат
У вас получится структура:
- Основной файл: sitemapindex.xml
- Файлы отдельных карт сайта: sitemap1.xml, sitemap2.xml, ..., sitemapN.xml
Поисковые роботы сначала обратятся к файлу sitemapindex.xml
, чтобы узнать о наличии нескольких карт сайта, а затем загрузят каждую из них отдельно.
Такой подход позволит вам эффективно управлять большими объемами данных и упростит индексацию вашего сайта.