Как разбить файл sitemap на несколько файлов?

sitemap

Разбиение sitemap.xml на несколько файлов — это стандартная практика, когда количество URL-адресов в карте сайта превышает лимит в 50 000 строк или размер файла приближается к 50 МБ. Для этого используется механизм индексирования карт сайтов через файл sitemapindex.xml, который содержит ссылки на отдельные файлы sitemap.xml.

Вот пошаговая инструкция и пример, как это сделать:

Шаг 1: Разделите список URL-адресов

Предположим, у вас есть большой список URL-адресов. Вы можете разделить его на части вручную или автоматически с помощью скрипта. Например, каждая карта сайта будет содержать до 10 000 URL-адресов.

Пример разделения списка:

Этот файл сохраняем как sitemap1.xml. Затем создаем второй файл sitemap2.xml с остальными URL-адресами.

Шаг 2: Создайте индексный файл sitemapindex.xml

Теперь создадим основной файл sitemapindex.xml, который будет указывать на каждый отдельный файл карты сайта.

Пример sitemapindex.xml:

Шаг 3: Укажите путь к sitemapindex.xml в robots.txt

Чтобы поисковые системы могли найти вашу карту сайта, добавьте строку в файл robots.txt:

Sitemap: https://example.com/sitemapindex.xml

Таким образом, вы сообщаете поисковикам, где находится главная карта сайта.

Итоговый результат

У вас получится структура:
- Основной файл: sitemapindex.xml
- Файлы отдельных карт сайта: sitemap1.xml, sitemap2.xml, ..., sitemapN.xml

Поисковые роботы сначала обратятся к файлу sitemapindex.xml, чтобы узнать о наличии нескольких карт сайта, а затем загрузят каждую из них отдельно.

Такой подход позволит вам эффективно управлять большими объемами данных и упростит индексацию вашего сайта.