Поддержка Проблемы и решения Как грамотно избежать индексирования дублирующих ссылок?

  • Поиск Google по отдельным фразам из публикаций в моем блоге часто выдает по несколько разных ссылок на одну и ту же публикацию. Насколько я понимаю, дублирующие ссылки лучше запретить для индексирования (Disallow в robots.txt). Но проблема в том, что в разных случаях в выдаче Google бывают разные результаты — иногда полный набор ссылок (прямая, год, автор, категория), иногда неполный (год, автор, категория), иногда вообще одна (год).

    Вопрос: есть ли способ добиться индексации именно прямых ссылок — таким образом, чтобы запрет на индексацию дублирующих ссылок не привел к полному отсутствию результатов в выдаче?

    Страница, с которой нужна помощь: [войдите, чтобы увидеть ссылку]

Просмотр 15 ответов — с 31 по 45 (всего 51)
  • Я обратился, но там на вопрос как лучше избежать дублей (с учетом того, что в выдаче часто присутствуют только дубли и отсутствуют канонических ссылок), мне так не ответили

    Значит вопрос был задан некорректно.
    А у нас не сеошный форум, а технический, конкретно по ВП.

    В данном случае у меня вопрос по настройке плагина

    Вопрос «как лучше» — это не вопрос по плагину.
    По плагину это типа «где найти такую настройку».

    Модератор Yuri

    (@yube)

    ОК. Погнали по порядку.
    Главная — index, просто потому, что иначе нельзя.
    Запись — index, потому что это основной контент.
    Архив по дате — noindex.
    Рубрика — описания нет, записи целиком — noindex.
    Метка — описания нет, записи целиком — noindex.
    Автор — про автора ни слова, записи целиком — noindex.
    То есть, закрыть от индексации всё, громе главной и собственно записей и стат.страниц, если там есть что-то, достойное быть найденным.

    p.s. «Да, мы атеисты.» 🙂

    p.p.s. Сие есть мои рекомендации для сайта gadgets-news.ru, а не для всех и всякого.

    • Ответ изменён 6 лет, 2 месяца назад пользователем Yuri. Причина: p.p.s

    Большое спасибо, Юрий! На главной у меня нет настроек по индексации, вероятно она делается в любом случае. И как я понимаю, в XML-карте сайта метки и рубрики надо сделать «Не в карте сайта».

    А как вы считаете — стоит ли дополнительно запретить индексацию в robots.txt, или настроек плагина достаточно?

    И еще вероятно надо отключить индексацию подстраниц архива (Чтобы в результаты поиска не включались страницы архивов вида /page/2/ и т.п., отметьте этот пункт) в Другое, верно?

    Модератор Yuri

    (@yube)

    И как я понимаю, в XML-карте сайта метки и рубрики надо сделать «Не в карте сайта».

    Да. Зачем подсовывать ПСам то, что потом окажется noindex?

    стоит ли дополнительно запретить индексацию в robots.txt, или настроек плагина достаточно?

    Плагина достаточно, он добавляет meta robots.

    Для ясности: robots.txt запрещает индексацию документов, а не их чтение пауками.

    И еще вероятно надо отключить индексацию подстраниц архива

    Если закрыта таксономия, то <meta name="robots" content="noindex,follow"/> будет на всех страницах архива, поэтому ничего отдельно делать не нужно. Вот если бы таксономии были разрешены к индексации, тогда имело бы смыл закрыть их страницы.

    Ясно, еще раз большое спасибо!

    Создал первую запись после установки плагина (http://gadgets-news.ru/intel-vaunt-umnye-ochki-neotlichimye-ot-obychnyh/) — появились описания проблем:

    Мета-описание не задано, поисковые системы будут вместо него отображать часть текста страницы.

    На этой странице нет ни одного изображения, попробуйте добавить несколько по мере необходимости.

    На этой странице нет внутренних ссылок, подумайте о том чтобы добавить некоторые.

    Вопросы:
    1) В тексте у меня есть и внутренние ссылки, и локальные изображения. Я переключал разделы, но информация не обновилась и сообщения об этой проблеме остались — это баг плагина или я что-то делаю не так?

    2) Нужно ли менять мета-описание? У меня, как и прописывал в настройках плагина, стоит %%excerpt%% (как я понимаю, первые 50 слов в публикации).

    Также пишет Ярлык этой страницы слишком длинный, подумайте, как сократить его — о чем речь?

    Для ясности: robots.txt запрещает индексацию документов,

    Поправлю, Вас, коллега — не запрещает, а рекомендует не индексировать.
    И это не только по стандарту, но и в реальности бывают случаи, когда закрытое в робосте оказывается в индексе.

    Мета-описание не задано, поисковые системы будут вместо него отображать часть текста страницы.

    При создании записей желательно и даже идеально или вручную задавать мета описания записей (её краткое содержимое) в блоке плагина в редакторе записей

    http://joxi.ru/1A5Kv8gSKlR07m

    или использовать поле «Отрывок», которое выводится как на странице записей в качестве анонса записи, так и автоматически заполняет поле мета описания в блоке сео плагина

    http://joxi.ru/a2XzEw6tyvo0Gr

    На этой странице нет ни одного изображения, попробуйте добавить несколько по мере необходимости.

    Тут все ясно. Надо как минимум задавать изображение (миниатюру) записи.
    http://joxi.ru/E2pEXa0uBE6BaA

    На этой странице нет внутренних ссылок, подумайте о том чтобы добавить некоторые.

    Речь идет о внутренней перелинковке страниц. Поисковым роботам будет полезно по этим ссылкам «погулять» по другим страницам вашего сайта. Можно конечно вручную добавить ссылки на другие страницы вашего сайта, так чтобы они логично и ненавязчиво для посетителя данной страницы вписались в её содержание. Однако гораздо удобнее для этого использовать такую фишку, как «Похожие записи»., с помощью которой будут автоматически генерироваться ссылки на другие страницы вашего сайта.

    Вот к примеру как это реализовано на сайте нашего коллеги @flector
    http://joxi.ru/8AnEOKMuqdQz12

    Вам, как новичку, надо для этого подобрать один из многочисленных плагинов https://ru.wordpress.org/plugins/search/related+posts/

    • Ответ изменён 6 лет, 2 месяца назад пользователем O.
    • Ответ изменён 6 лет, 2 месяца назад пользователем O.
    • Ответ изменён 6 лет, 2 месяца назад пользователем O.
    • Ответ изменён 6 лет, 2 месяца назад пользователем O.
    • Ответ изменён 6 лет, 2 месяца назад пользователем O.
    • Ответ изменён 6 лет, 2 месяца назад пользователем O.
    • Ответ изменён 6 лет, 2 месяца назад пользователем O.

    И как я понимаю, в XML-карте сайта метки и рубрики надо сделать «Не в карте сайта».

    Абсолютно правильно понимаете!

    Ярлык этой страницы слишком длинный, подумайте, как сократить его — о чем речь?

    Ярлык — это ссылка, которая автоматически генерируется из названия записи или страницы если у вас в настройках постоянных ссылок включена генерация ссылки по названию записи или страницы
    /%postname%/
    http://joxi.ru/BA05Nx7cBkbJ9r
    (ИМХО. Это в большинстве случаев абсолютно правильная структура внутренних ссылок)
    Если длинное название — соответственно и длинная ссылка, чего вроде бы не любят ПС. Но благодаря плагину, который по-вашему«непонятно что делает» :)))

    название записи можно оставить прежним, а ссылку задать произвольно в соответствующем окне блока сео плагина
    http://joxi.ru/12Mzlw8t4NoM7A

    • Ответ изменён 6 лет, 2 месяца назад пользователем O.
    • Ответ изменён 6 лет, 2 месяца назад пользователем O.
    • Ответ изменён 6 лет, 2 месяца назад пользователем O.

    Perdyllo
    Большое спасибо за подробную и полезную информацию, завтра займусь изучением.

    который по-вашему«непонятно что делает» :)))

    Это я писал до того, как обнаружил кнопку, включающую все эти настройки ))

    Модератор Yuri

    (@yube)

    Но благодаря плагину, который по-вашему«непонятно что делает» :)))
    название записи можно оставить прежним, а ссылку задать произвольно в соответствующем окне блока сео плагина

    Вообще-то, WP это умеет делать и без плагинов 🙂

    screenshot

    Похоже я все-таки был прав насчет бага — когда захожу в редактирование той записи, то проблем с изображением и внутренними ссылками уже нет. Зато появилась новая, и тоже непонятная:

    Первый абзац не содержит фокусное ключевое слово. Убедитесь, что тема записи понятна сразу.

    А на самом деле ключевое слово (Vaunt) в первом абзаце содержится (во втором предложении).

    Первый абзац не содержит фокусное ключевое слово. Убедитесь, что тема записи понятна сразу.

    Вот на это можете не обращать внимания. Это ерунда. Ключевые слова сейчас поисковиками не учитываются и в том же yoast плагине есть соответствующая настройка: http://joxi.ru/KAggdwyhgPdb4A

    Модератор Yuri

    (@yube)

    А на самом деле ключевое слово (Vaunt) в первом абзаце содержится (во втором предложении).

    Не-а. В первом абзаце (параграфе, теге|элементе <p>) содержится только картинка, а слово во втором.

Просмотр 15 ответов — с 31 по 45 (всего 51)
  • Тема «Как грамотно избежать индексирования дублирующих ссылок?» закрыта для новых ответов.