Вопрос качества поиска

Опубликован один интересный вопрос, касающийся качества поисковой выдачи Гугла, и ответ на вопрос работника самого Гугла. Очень интересно почитать, но примеры сайтов не приводятся намеренно.

Вопрос вебмастера

В общем уже как пару месяцев смотрю на один запрос, и в выдаче Гугла находятся сайты абсолютно не по теме. Данный запрос имеет неплохой трафик и его получают действительно плохие сайты. Начнем с анализа ТОП 1 сайта: мы видим, что это дубль контента, потому как оригинал находиться в другом месте. Данный сайт за счет количества комментариев генерирует множество страниц и тем самым Гугл ему дал хорошую позицию. Но на данный запрос страница вовсе не отвечает! На втором месте у нас сайт, где мало того, что вообще не имеет никаких ключевых слов в тайтле, он и внутри вообще не по теме. На третьем трастовый портал, но не по теме. На четвертом тоже не в тему. На пятом инфы по теме нет, но за счет траста выезжают.

Ответ сотрудника Гугл

Вы задали очень интересный и, одновременно, сложный вопрос. Но больше интересный и нужный для понимания некоторых вещей.

Я начну с общих вещей, а потом перейду непосредственно к ответу на Ваши замечания.

Прежде всего, я хочу отметить, что в настоящее время качество поисковой выдачи по многим запросам оставляет желать намного лучшего. Поэтому, я хочу предостеречь и Вас и многих других от принятия скоропалительных мер по внесению изменений в свои сайты на основе того, что видно сейчас. Причина заспамливания выдачи, НА МОЙ ВЗГЛЯД, имеет несколько причин:

1. Массивные изменения в алгоритме ранжирования, которые еще не отразились на всех сайтах.

2. Глубина изменений в самих подходах определения релевантности и ценности страниц для пользователей поиска.

3. Не достаточное качество "настроек" алгоритмов (а это неминуемо, когда меняются фундаментальные основы оценок). Но о качестве алгоритмов нельзя судить до того времени, пока не будет устоявшейся выдачи (не будут обработаны все сайты), а сейчас её трудно назвать устоявшейся. После этого, естественно, можно и нужно будет говорить о полученном качестве и недостатках.

И так. Еще на этапе апдейта по имени Панда (более года назад) было заявлено, что мэйн-стримом дальнейшего развития алгоритмов будет их интеллектуализация.

Интеллектуализация означает, прежде всего, отход от "чисто технического" подхода к определению релевантности, который долгое время основывался на анализе вхождения словоформ в контент. Теперь основной упор делается на "смысловую оценку запроса" и "смысловое соответствие" - это если максимально кратко.

Посмотрите на выдачу по запросу [купить авто] и вы воочию увидите и поймете, о чем идет речь. Основная масса снипетов в выдаче вообще не содержит слова "купить", наоборот, они содержат антоним "продажа". Но, с точки зрения пользователя поиска, такая выдача полностью релевантна "смыслу поискового запроса" и "цели поискового запроса". Это один из главных моментов, который следует понять в послепандовскую эру СЕО.

Ценность страниц для пользователей поиска, естественно, определяется и на основе модифицированной релевантности, но не только на её основе.

Важнейшим показателем ценности является показатель не банальности содержания. Это многогранный фактор.

Множество сайтов содержат сходное по теме содержание - никто не может ограничить кого-то вправе писать на ту или иную тему. Но если на тысяче сайтов появляется практически одно и то же, пусть даже написанное совершенно другими фразами, но сводящееся к пережевыванию одной и той же темы без привнесения чего-то нового, то это уже банальное содержание.

Конечно, есть случаи, когда элемент банальности неминуем. Именно в таких случаях нужно принимать меры по дебанализации. Например, если взять туристические сайты, то там будут описания отелей и т.д. Естественно, что какими словами Вы бы не описывали один и тот же отель, но в смысловом плане, это будет одно и то же. Дебанализация для этого примера будет заключаться не только в разносторонности приводимой информации, но еще и в том, какую оригинальную информацию удастся разместить, кроме банальной. Например, это могут быть отзывы туристов о рассматриваемом отеле, различные пользовательские рейтинги и т.д., то есть все то, что дает основу считать страницу и сайт в целом заслуживающим отдельного внимания. Сюда же можно отнести и интерес пользователей к контенту в виде его расшаривания, обсуждения на профильных форумах, наличие собственного развитого коммюнити либо в виде собственного форума, либо в виде присутствия в соц-сетях.