Проект не ведет коммерческой деятельности и публикует материалы из открытых источников для ознакомления с актуальными технологиями.

Стратегия SEO

Google делится информацией об индексировании и бюджете сканирования

Google недавно опубликовал подкаст, в котором обсуждается то, что известно как краулинговый бюджет, и то, что влияет на Google при индексации контента.

И Гэри Иллиес, и Мартин Сплитт поделились своим мнением об индексации Интернета с точки зрения Google.

Происхождение концепции краулингового бюджета

Гэри Иллиес сказал, что концепция краулингового бюджета была создана поисковым сообществом за пределами Google.

Он объяснил, что внутри Google нет ничего, что соответствовало бы идее краулингового бюджета.

Когда люди говорили о краулинговом бюджете, то, что происходило внутри Google, включало несколько показателей, а не одну вещь, называемую краулинговым бюджетом.

Так что внутри Google они обсуждали, что может представлять собой краулинговый бюджет, и придумали способ говорить об этом.



Он сказал:

«…долгое время мы говорили, что у нас нет понятия краулингового бюджета. И это было правдой.

У нас не было чего-то, что могло бы означать краулинговый бюджет сам по себе — так же, как, например, у нас нет числа для EAT.

А потом, потому что об этом говорили, мы попытались придумать что-то… по крайней мере, как-то определенное.

А затем мы работали с двумя, тремя или четырьмя командами — я не помню — где мы пытались придумать хотя бы несколько внутренних показателей, которые можно было бы сопоставить с чем-то, что люди внешне определяют как краулинговый бюджет».

Что означает краулинговый бюджет в Google

По словам Гэри, часть расчета краулингового бюджета основана на практических соображениях, например, сколько URL-адресов сервер позволяет роботу Googlebot сканировать, не перегружая сервер.

Гэри Иллиес и Мартин Сплитт:

«Гэри Иллиес: … мы определили это как количество URL-адресов, которые робот Googlebot может и хочет или получает указание сканировать».

Мартин Сплитт: Для данного сайта.

Гэри Иллиес: Для данного сайта — да.

И для нас это примерно то, что означает краулинговый бюджет, потому что, если подумать, мы не хотим наносить вред веб-сайтам, потому что Googlebot имеет достаточно возможностей Chrome, чтобы сбивать сайты…»

Уравновешивание различных соображений

Еще один интересный момент, который был сделан, заключался в том, что в отношении ползания существуют разные соображения. Существуют ограничения на то, что можно хранить, поэтому, по мнению Google, это означает использование ресурсов Google».где это важно.

«Мартин Сплитт: Очевидно, очевидно, что все хотят, чтобы все индексировалось как можно быстрее, будь то новый веб-сайт, который только что появился в сети, или веб-сайты с большим количеством страниц, и они хотят часто менять их, и они обеспокоен тем, что вещи не сканируются так быстро.

Я обычно описываю это как проблему с балансом между тем, чтобы не перегружать веб-сайт, и также тратить наши ресурсы там, где это важно».

Джон Мюллер недавно написал в Твиттере, что Google не все индексирует, и упомянул, что не все полезно.

Мюллера твит:

«…важно иметь в виду, что Google просто не индексирует каждую страницу в Интернете, даже если она отправлена ​​напрямую. Если ошибки нет, со временем она может быть выбрана для индексации — или Google может просто сосредоточиться на некоторых других страницах вашего сайта».

Он последовал за еще один твит:

«Ну, многие оптимизаторы и сайты (возможно, не вы/ваши!) производят ужасный контент, который не стоит индексировать. То, что он существует, не означает, что он полезен для пользователей».

  • Мартин Сплитт называет процесс сканирования проблемой «тратить наши ресурсы там, где это важно».
  • Джон Мюллер упомянул, если содержание «полезно для пользователей».

Полезность — это интересный аспект для оценки контента, и, на мой взгляд, он может быть более полезным для диагностики контента, чем бесплодный совет убедиться, что контент «нацелен на намерение пользователя» и что он «оптимизирован по ключевым словам».

Например, я недавно просматривал сайт YMYL, где весь сайт выглядел так, как будто он был создан из контрольного списка SEO.

  • Создать профиль автора
  • Профиль автора должен иметь страницу LinkedIn
  • Ключевое слово оптимизировать трафик
  • Ссылки на «авторитетные» сайты

Издатель использовал изображения, сгенерированные искусственным интеллектом, для биографии автора, которые также использовались в поддельном профиле LinkedIn.

Многие из веб-страниц сайта связаны с тонкими страницами .gov, которые имеют ключевые слова в заголовке, но совершенно бесполезны. Было похоже, что они даже не смотрели на правительственную страницу, чтобы решить, стоит ли на нее ссылаться.

Внешне они ставили галочки в контрольном списке SEO-задач, выполняли механические SEO-действия, такие как ссылки на сайт .gov, создание профиля автора и т. д.

Они создали видимость качества, но на самом деле не достигли его, потому что на каждом шагу не задумывались о том, полезно ли то, что они делают.

Краулинговый бюджет — это не то, о чем стоит беспокоиться

Гэри и Мартин начали говорить о том, что большинству сайтов не нужно беспокоиться о краулинговом бюджете.

Гэри указал пальцем на блоги в поисковой индустрии, которые в прошлом продвигали идею о том, что краулинговый бюджет — это то, о чем следует беспокоиться, хотя, по его словам, это не то, о чем следует беспокоиться.

Он сказал:

«Я думаю, что отчасти это страх перед чем-то, что они не могут контролировать, что люди не могут контролировать, а с другой стороны, это просто дезинформация.

…И в те времена были некоторые блоги, где люди говорили о краулинговом бюджете, и это так важно, а потом люди находили это и запутывались: «Должен ли я беспокоиться о краулинговом бюджете или нет?»

Мартин Сплитт спросил:

«Но допустим, вы были интересным блогом… Вам нужно беспокоиться о краулинговом бюджете?»

И Гэри ответил:

«Я думаю, что большинству людей не нужно беспокоиться об этом, и когда я говорю «большинство», это, вероятно, более 90% сайтов в Интернете не должны беспокоиться об этом».

Через несколько минут в подкасте Мартин заметил:

«Но людей это беспокоит, и я не совсем уверен, откуда это взялось.

Я думаю, это связано с тем, что на нескольких крупных веб-сайтах есть статьи и сообщения в блогах, в которых говорится о краулинговом бюджете.

Обсуждается на курсах SEO-обучения. Насколько я видел, это обсуждается на конференциях.

Но это проблема, которая встречается редко. Как будто это не то, от чего страдает каждый веб-сайт, и все же люди очень нервничают по этому поводу».

Как Google определяет, что индексировать

Далее последовало обсуждение факторов, заставляющих Google индексировать контент.

Интересно, когда Гэри говорит о желании индексировать контент, который может быть найден.

Гэри Иллиес:

«…Потому что, как мы сказали, у нас нет бесконечного пространства, поэтому мы хотим индексировать то, что мы думаем — ну, не мы — но наши алгоритмы определяют, что это может быть найдено в какой-то момент, и если мы этого не сделаем, есть сигналы, например, об определенном сайте или определенном URL-адресе или о чем-то еще, то как мы узнаем, что нам нужно просканировать это для индексации?»

Гэри, технический писатель Google Search Central, Лиззи Сассман (@окайлиззи), далее говорилось о выводе из остальной части сайта о том, стоит ли индексировать новый контент.

«И некоторые вещи, из которых вы можете сделать вывод — например, если вы запускаете новый блог на своем основном сайте, например, и у вас есть новый подкаталог блога, например, тогда мы можем как бы сделать вывод на основе всего сайта, хотим ли мы много сканировать из этого блога или нет.

Лиззи Сассман: Но блог — это новый тип контента, который может обновляться чаще, так как мы можем определить, что это…? Это просто новое. Мы не уверены, что это будет новостью, например, как
часто это еще предстоит определить.

Гэри Иллиес: Но нам нужен стартовый сигнал.

Лиззи Сассман: И стартовый сигнал…

Гэри Иллиес: Делайте выводы с основного сайта».

Затем Гэри перешел к разговору о сигналах качества. Сигналы качества, о которых они говорили, были ли сигналы, связанные с интересом пользователей, например, заинтересованы ли люди в этом продукте? Заинтересованы ли люди в этом сайте?

Он объяснил:

«Но дело не только в частоте обновлений. Это также сигналы качества, которые есть на основном сайте.

Так, например, если мы видим, что определенный шаблон очень популярен в Интернете, например, продукт с косой чертой очень популярен в Интернете, и люди на Reddit говорят об этом, другие сайты ссылаются на URL-адреса в этом шаблоне, тогда для нас это сигнал о том, что людям в целом нравится сайт».

Гэри продолжает говорить о сигналах популярности и интереса, но в контексте разговора, который представляет собой новый раздел запущенного сайта.

В обсуждении он называет новый раздел Каталогом.

Иллиес:

«Хотя если у вас есть что-то, на что люди не ссылаются, а затем вы пытаетесь запустить новый каталог, ну, людям не нравится сайт, то зачем нам сканировать этот новый каталог, который вы только что запустили?

И в конце концов, если люди просто начнут ссылаться на него…»

Бюджет сканирования и сайты, которые индексируются

Резюмируя кое-что из того, что обсуждалось:

  • Google не имеет бесконечных возможностей и не может индексировать все в Интернете.
  • Поскольку Google не может индексировать все, важно быть избирательным, индексируя только тот контент, который имеет значение.
  • Темы содержания, которые имеют значение, как правило, обсуждаются
  • Важные сайты, которые, как правило, полезны, обычно обсуждаются и ссылаются на них.

Очевидно, что это не исчерпывающий список всего, что влияет на то, что индексируется. Он также не предназначен для контрольного списка SEO.

Это просто идея о том, какие вещи настолько важны, что обсудили Гэри Иллиес и Мартин Сплитт.


Избранное изображение Shutterstock/Trismegist san

Цитата

Слушайте подкаст здесь:


Самое время подумать о том, как прокачать себя и своих работников. Освоить новую профессию, повысить уровень квалификации, занять высокооплачиваемую должность. Вы сможете увеличить свою прибыль многократно. Все в Ваших руках!

Стать Digital профессионалом.

Подборка статей по SEO оптимизации сайта. Выбора стратегии продвижения. Продвижение сайта в поисковых системах и социальных сетях. Обучение востребованным профессиям в сфере IT. Настройка рекламных кампаний в интернет. Маркетинг. Анализ рынка. Полезные секреты проведения рекламных кампаний. Все для PR — менеджера.

Информация для Вас была полезна?
0
0
0
0
0
0
0

Похожие статьи

Кнопка «Наверх»