И всё это замечательно индексируется в яндексе.
На странице есть тег canonical
, который указывает поисковым системам правильный адрес:
<link rel="canonical" href="https://bio-metria.ru/catalog/programm/skanery-pasport/penta-scanner-block/" />
Есть каноникал. Но в индексе такие страницы тоже есть, и страницы такие, судя по адресу тоже есть, и становится всё больше, сейчас уже за 350 перевалило. Страниц таких наделать можно бесконечно, что неправильно. А правильно это ответ 404.
Модератор
Yuri
(@yube)
Но в индексе такие страницы тоже есть, и страницы такие, судя по адресу тоже есть
Каноничные есть, а неканоничных нет. У меня другой Яндекс?
Модератор
Yuri
(@yube)
По-моему, Вы просто путаете «просканировано» и «проиндексировано».
Чтобы CMS на любой несуществующий url, в т.ч. с «левыми» get-параметрами, возвращала 404, она должна быть изначально спроектирована соответствующим образом. WordPress к таковым не относится. Поэтому остается или пользоваться тем, что есть, или искать полностью удовлетворяющую альтернативу.
Чтобы CMS на любой несуществующий url, в т.ч. с «левыми» get-параметрами, возвращала 404 — это как раз нормально, так, как и должно быть. Что ж, придется смириться.
Модератор
Yuri
(@yube)
это как раз нормально
Это очень-очень трудоемко. Для этого, как минимум, в формальной спецификации каждого плагина/модуля должно присутствовать формальное описание допустимых эндпойнтов и параметров для каждого типа/класса урлов (грубо говоря, что допустимо у рубрик, то недопустимо у одиночных постов), чтобы чекер CMS не рубил используемые плагином видоизмененные урлы. Аццкий ад. Особенно для открытых систем. Поэтому умные люди и изобрели canonical.