Стратегия SEO

Карты сайта XML, как их создавать и почему они предлагают массу преимуществ для SEO


В июне картам сайта XML исполнилось 18 лет, и в честь их полноценного внедрения во взрослую жизнь я рассказываю, как работают карты сайта XML, как их создавать и почему карты сайта XML предлагают массу преимуществ для SEO.

Что такое XML-карта сайта?

В двух словах, карта сайта XML — это протокол в формате XML, который сообщает поисковым системам об URL-адресах веб-сайта, доступных для сканирования.

XML-карты сайта предназначались для обмена информацией о каждом URL-адресе, например:

  • Когда оно обновлялось в последний раз.
  • Как часто оно меняется.
  • Насколько это важно по отношению к другим URL-адресам вашего сайта.

XML-карты сайта позволяют поисковым системам более эффективно сканировать ваш сайт, если определенные URL-адреса изолированы.

Если вы профессионал в области SEO, вы, вероятно, уже используете XML-карты сайта, встроенные в ваш плагин Yoast WordPress. Но есть много дополнений, которые вам могут не хватать.

Как создать динамическую карту сайта XML

Если вы используете WordPress, используйте плагины SEO, такие как Yoast и RankMath, для создания динамической карты сайта XML.



Если вы не используете WordPress, выполните следующие действия, чтобы создать динамическую карту сайта XML.

Поймите свою навигационную структуру

Соберите список всех наших URL-адресов на веб-сайте и сгруппируйте их, чтобы они соответствовали навигационной структуре и группам контента.

Сотрудничайте с вашей командой разработчиков

Поделитесь списком URL-адресов, сгруппированных вместе со своей командой разработчиков, чтобы получить их помощь в создании динамической карты сайта XML с использованием Python, PHP или JavaScript.

Вот пример того, как закодировать динамическую карту сайта XML с помощью Python:

import xml.etree.ElementTree as ET

import datetime

# List of URLs (replace these with your actual URLs)

urls = [

    "

    "

    "

    # Add more URLs here

]

# Create the root element

urlset = ET.Element("urlset")

urlset.set("xmlns", "

# Loop through URLs and create URL entries

for url in urls:

    url_elem = ET.SubElement(urlset, "url")

    loc_elem = ET.SubElement(url_elem, "loc")

    loc_elem.text = url

    lastmod_elem = ET.SubElement(url_elem, "lastmod")

    lastmod_elem.text = datetime.datetime.now().isoformat()

    changefreq_elem = ET.SubElement(url_elem, "changefreq")

    changefreq_elem.text = "daily"  # You can set this to the desired frequency

    priority_elem = ET.SubElement(url_elem, "priority")

    priority_elem.text = "0.5"  # You can set this to a value between 0 and 1

# Create the XML tree

tree = ET.ElementTree(urlset)

# Save the XML to a file

tree.write("sitemap.xml", encoding="utf-8", xml_declaration=True)

Работая с разработчиками, я использовал Flask и Python вместе, чтобы создать по-настоящему динамическую XML-карту сайта, которая меняется при изменении содержимого веб-сайта.

Если мы сможем определить динамический маршрут карты сайта на основе содержимого веб-сайта, используя такую ​​функцию, как get_dynamic_urls(), мы сможем получить все URL-адреса.

@app.route('/sitemap.xml', methods=['GET'])

def sitemap():

    urls = get_dynamic_urls()  # Replace with your dynamic URL retrieval logic

    urlset = ET.Element("urlset")

    urlset.set("xmlns", "

    for url in urls:

        url_elem = ET.SubElement(urlset, "url")

        loc_elem = ET.SubElement(url_elem, "loc")

        loc_elem.text = url

        lastmod_elem = ET.SubElement(url_elem, "lastmod")

        lastmod_elem.text = datetime.datetime.now().isoformat()

        changefreq_elem = ET.SubElement(url_elem, "changefreq")

        changefreq_elem.text = "daily"

        priority_elem = ET.SubElement(url_elem, "priority")

        priority_elem.text = "0.5"

    xml_content = ET.tostring(urlset, encoding="utf-8")

    return xml_content, {'Content-Type': 'application/xml'}

Если вы используете код для нескольких свойств домена, убедитесь, что файлы правильно закодированы на ваших HTML-страницах.

Например, ваши файлы CSS и JavaScript должны быть связаны с помощью <link>и <script>теги.

Прежде чем использовать код в разных доменах, вам необходимо создать централизованный сервер для размещения общих правил XML-карты сайта.

У вас будет несколько этапов создания динамической XML-карты сайта с разработчиками, пока все правила не будут подтверждены.

Не забудьте проверить, действительно ли динамические URL-адреса извлекаются и интегрируются в логику вашей карты сайта.

Загрузите на свой сервер

После сжатия карты сайта XML загрузите динамическую карту сайта XML в корневой каталог вашего веб-сайта.

Отправить в поисковые системы  

Сообщите поисковым системам о ваших XML-картах сайта, отправив их через консоль поиска Google и инструменты Bing для веб-мастеров.

Текущее обслуживание

Карта сайта XML — это не просто тактика SEO «установил и забыл». Очень важно обновлять карту сайта XML по мере изменения вашего веб-сайта.

15 советов, которые следует учитывать при создании карты сайта XML

1. XML-карты сайта не являются фактором ранжирования.

На вопрос в X (ранее Twitter), есть ли преимущества в ранжировании использования XML-карт сайта , Гэри Иллис из Google ответил:

  • — Нет, во всяком случае, не напрямую.
Гэри Иллис о XML-картах сайта

2. Google может найти ваши страницы без карты сайта.

Веб-сайтам не нужна карта сайта, если они маленькие и имеют правильные ссылки, — поделился Дэниел Вайсберг, специалист по поиску в Google, в обучающем видео Google Search Console.

Однако далее он сказал, что карта сайта может быть особенно полезна, если:

  • Сайт действительно большой.
  • Страницы сайта изолированы.
  • Сайт новый или быстро меняется.
Дэниел Вайсберг - Когда карты сайта полезны

Также важно отметить, что Джон Мюллер из Google заявил в X (ранее Twitter), что наличие карты сайта в формате XML является «минимальным базовым уровнем для любого серьезного веб-сайта».

3. Google проверяет, изменилась ли ваша карта сайта XML перед повторной обработкой.

Google действительно проверяет, изменилась ли ваша XML-карта сайта, прежде чем снова тратить ресурсы на анализ и обработку файла, подтвердил Иллиес.

Об этом он заявил в «Часе работы SEO-офиса».

  • «Как только вы измените что-то в своей карте сайта, будь то элемент URL или последний мод, карта сайта будет снова проанализирована и, как правило, обработана повторно. Это не означает, что URL-адреса обязательно будут сканироваться. Конечно, они по-прежнему подлежат оценке качества, как и любой другой URL-адрес. Также стоит отметить, что если вы удаляете URL-адрес из карты сайта, потому что, возможно, он больше не существует, это не означает, что он будет автоматически удален из индекса или даже получит приоритет для сканирования, чтобы его можно было удалить раньше».

4. XML-карты сайта позволяют быстрее индексировать ваш новый контент.

Мюллер подтвердил, что сообщение Google об обновлении XML-карты сайта может помочь быстрее проиндексировать ваш новый контент.

Он поделился :

  • «Проверка карты сайта немного отличается от простого предоставления ее в файле robots.txt: проверяя связь, вы активно отмечаете изменение в файле карты сайта. Если вы заинтересованы в быстрой индексации нового контента, это хорошая практика».

5. XML-карты сайта должны быть в кодировке UTF-8.

Если ваша карта сайта XML не использует UTF-8, поисковые системы не смогут ее прочитать.

6. Размер файла должен быть не более 50 МБ (несжатый) или не превышать 50 000 URL-адресов.

Существуют ограничения на размер ваших XML-карт сайта. Не превышайте 50 000 URL-адресов на карту сайта или 50 МБ (без сжатия).

Если у вас больший размер файла или больше URL-адресов, используйте несколько карт сайта XML.

7. У вас может быть несколько карт сайта XML.

Google позволяет отправлять несколько файлов Sitemap. Разделение файлов Sitemap на разные разделы вашего веб-сайта для измерения производительности может оказаться полезным.

Например, если у вас крупный веб-сайт электронной коммерции, вы можете сегментировать XML-карты сайта по типу продукта (т. е. женская обувь или мужская обувь).

Или, если у вас несколько языков, вам может понадобиться hreflang, связанный с вашей XML-картой сайта <loc>.

Если у вас есть дополнительные языки, это не учитывается при максимальном количестве URL-адресов в 50 000.

Или, если у вас много видео или изображений, вы можете разделить карты сайта XML на карту сайта XML для видео и карту сайта XML для изображений.

Наличие нескольких XML-карт сайта не дает никаких преимуществ в рейтинге.

8. Если у вас есть несколько карт сайта XML, не забудьте использовать индексный файл карты сайта.

Если у вас есть несколько XML-карт сайта для большого сайта, вам нужно будет отправить индексный файл карты сайта, чтобы отправить множество карт сайта одновременно.

9. Тег Lastmod должен быть безупречным

The <lastmod>Тег — одна из наиболее важных частей вашей XML-карты сайта.

Например, мои структурированные данные используют дату <lastmod> моей XML-карты сайта.

The <lastmod>Тег также сигнализирует поисковым системам, обновили ли вы старый контент или запустили новый.

Мюллер подтвердил это, заявив:

  • «…Если вы просто меняете нижний колонтитул с меткой времени, то, конечно, страница тоже технически изменилась, но если это должно быть приоритетом — вероятно, нет».

Bing даже высказал официальную позицию по поводу lastmodтег в XML-карте сайта, в котором указывается:

  • «Для XML-карт сайта одним из наиболее важных тегов, которые вы можете включить в карту сайта, является тег «lastmod».

10. XML-карты сайта должны включать только 200 URL-адресов статуса, которые все являются самоканонизированными.

Не забывайте сохранять только действующие URL-адреса со статусом 200, индексируемые и самоканонизированные.

Если вы продолжите демонстрировать страницы с перенаправлением 404 или 301, поисковые системы могут полностью перестать сканировать вашу карту сайта XML.

Мюллер ответил на комментарий на сайте X (ранее известного как Twitter):

  • «Мы бы прекратили получение файлов карты сайта, если URL-адреса недействительны, но если вы возвращаете контент или перенаправляете (что в некотором роде рекомендуется), мы продолжим их пробовать. Это не должно вызвать проблем, поскольку общие файлы карты сайта составляют лишь крошечную часть всех URL-адресов, полученных с сайта».

11. Поисковые системы могут ежедневно проверять вашу XML-карту сайта.

Фабрис Канель из Microsoft рассказал, что Microsoft ежедневно проверяет вашу XML-карту сайта .

Хотя Мюллер рассказал, что Google проверяет вашу карту сайта XML на основе частоты (т. е. <lastmod> ярлык).

12. Скорость страницы косвенно влияет на вашу XML-карту сайта.

Мы все знаем, насколько важна скорость страницы для наших усилий по SEO. Но как медленно работающий веб-сайт влияет на вашу XML-карту сайта?

Мюллер подтвердил , что скорость страницы не должна влиять на вашу XML-карту сайта, заявив:

  • «Пока время не истечет, с тобой все будет в порядке. Может быть, закешировать последнюю версию, чтобы предотвратить ненужную нагрузку на сервер?»

Правда в том, что я работал над медленно работающими веб-сайтами, где XML-карта сайта не загружалась, когда поисковые системы сканировали веб-сайт, вызывая серьезные колебания рейтинга.

Если ваш веб-сайт не загружается должным образом, это косвенно повлияет на вашу карту сайта XML.

Вот почему важно использовать сжатие Gzip, чтобы уменьшить размер файла и ускорить загрузку.

13. Удалите тег <priority> из XML-карты сайта.

Иллиес сравнил <priority>тег в XML-картах сайта как «мешок шума».

Поэтому, если вы зависите от поисковых систем, которые будут сканировать ваши URL-адреса в вашей XML-карте сайта на основе приоритета, вам придется долго ждать.

Я рекомендую удалить этот тег из ваших XML-карт сайта.

14. Если у вас есть проблемы со структурой навигации, соедините карту сайта XML с картой сайта HTML.

HTML-карты сайта всегда вызывали неоднозначные чувства.

Мюллер заявил, что HTML-карты сайта «никогда не понадобятся».

Он продолжил:

  • «С годами я изменил свое мнение о HTML-картах сайта: они никогда не понадобятся. Маленькие и большие сайты всегда должны иметь четкую навигационную структуру. Если вы чувствуете необходимость в HTML-карте сайта, вместо этого потратьте время на улучшение архитектуры вашего сайта. HTML-карты сайта помещаются в ту же корзину, что и счетчики загрузки HTML».
<iframe src=" class="mastodon-embed" style="max-width: 100%; border: 0" width="400" allowfullscreen="allowfullscreen"></iframe><script src=" async="async"></script> 

При работе с большими веб-сайтами на уровне предприятия в структуре навигации веб-сайта часто присутствует несколько уровней лиц, принимающих решения. И часто во внимание принимаются лучшие практики SEO.

Я соединяю свою карту сайта XML с картой сайта HTML до тех пор, пока не буду уверен в навигации по нашему веб-сайту и иерархии внутренних ссылок.

15. Не забудьте включить все ваши XML-карты сайта в файл robots.txt.

Не забудьте включить XML-карты сайта (все они) в качестве ссылок в файл robots.txt.

Вот пример:

Включите все ваши XML-карты сайта в файл robots.txt.

Не беспокойтесь о том, где в файле robots.txt они должны находиться. Это не влияет на расположение XML-карты сайта в файле robots.txt .

Мюллер подтвердил это:

XML-карты сайта — это образец вашего сайта для поисковых систем.

Независимо от того, запускаете ли вы новую веб-страницу или просто добавляете канонический тег к дублирующей странице, вашу карту сайта XML необходимо обновлять круглосуточно и без выходных.

Но делайте это с осторожностью.

Хотя вам не следует быть параноиком, ваша карта сайта XML — это план вашего дома для поисковых систем.

Поэтому не забудьте отправить свои XML-карты сайта в консоль поиска Google и инструменты Bing для веб-мастеров.

Мнения, выраженные в этой статье, принадлежат приглашенному автору и не обязательно принадлежат Search Engine Land. Здесь перечислены штатные авторы.

Информация для Вас была полезна?
0
0
0
0
0
0
0

Похожие статьи

Кнопка «Наверх»