• Хочу настроить robots.txt, но совершенно не понимаю внутренную структуру своего WP. В тематической статье нашел про БД и 11 таблиц, включая wp_posts, где хранятся все записи, но у себя ни папки, ни файла с таким именем не нахожу. При последнем добавлении записей сегодня, в папке htdocs данные с датой изменения в этот день — это только папка статистики (awstats), а дата изменения папки wp-content — недельной давности. Такое ощущение, что нужные файлы скрыты, хотя в настройках ftp-клиента скрывание невидимых файлов отключено. Проверял в двух ftp-клиентах.

    Спрашиваю не из праздного любопытства — хочу понять, какие папки запретить индексировать. Буду очень признателен за совет. Речь идет о новостном блоге, в который ежедневно в линейном виде добавляются записи. Правильно ли я понимаю, что для индексации оптимально запретить индексацию всех папок, кроме папки с записями?

Просмотр 9 ответов — с 1 по 9 (всего 9)
  • Модератор Yui

    (@fierevere)

    永子

    User-agent: *
    Crawl-delay: 2
    Disallow: /wp-includes/
    Disallow: /wp-admin/
    Disallow: /wp-content/plugins
    Disallow: /wp-content/themes
    Disallow: /search

    вот примерно так
    если есть плагин генерирующий sitemap
    то еще директивы

    Sitemap: http://сайт/sitemap.xml

    Модератор Yui

    (@fierevere)

    永子

    структура вашего wp

    /wp-content/uploads
    ваша медиатека

    из служебных папок которые важны:
    /wp-content/themes
    темы оформления

    /wp-content/plugins
    плагины

    все остальное файлы дистрибутива wordpress

    непосредственно тексты статей, комментарии , итд, итп в базе данных mysql

    Большое спасибо за пояснения, Yui. Если можно еще 3 вопроса:

    1) Где эта база данных хранится, почему я не вижу никаких (кроме папки со статистикой) файлов/папок с датой добавления последней записи?

    2) Насколько для WordPress полезен sitemap? Меня смутило в описании одного плагина, что там надо прописывать рекомендуемую частоту индексации (насколько я понял, чаще чем «ежедневно» выбрать нельзя), а кроме того я не знаю, что включать в содержание карты сайта (чем, например, архивы отличаются от статей). Можно ли там напортачить с настройками так, что станет только хуже?

    3) Какой плагин порекомендуете по sitemap, особенно для Яндекса (понимаю, что sitemap для всех, но может некоторые настройки особо дружат с Яндексом)? У меня один сайт забанен Яндексом (почему платоны не знают), при этом Google его индексирует иногда уже спустя несколько минут. Хочу попробовать оптимизировать его при помощи robots.txt и sitemap, но не хотел бы навредить индексации гуглом. Кстати, может лучше, во избежание такого риска, и в robots.txt ваши настройки прописать только для Яндекса?

    Модератор Yui

    (@fierevere)

    永子

    1. когда wp ставили — надо было ввести параметры mysql сервера
    вот там и находится
    (а также см phpmyadmin в управлении хостингом)

    2. на 100%, это подсказка индекс ботам по структуре сайта. Обычно настройки по умолчанию сгодятся.

    3. у меня на одном из сайтов этот
    Google XML Sitemaps http://wordpress.org/plugins/google-sitemap-generator/

    на двух других комбайн Yoast http://wordpress.org/plugins/wordpress-seo/

    для разных ботов в robots.txt можно добавлять разные настройки, начинаются они с User-agent: где пишется идентификатор бота, обычно набор идентификаторов. а также рекомендации можно найти на специальных страницах поисковиков http://help.yandex.ru/webmaster/ например

    Большое спасибо за все Ваши пояснения, Yui.

    Чем больше узнаешь, тем больше вопросов ((

    Yui, не подскажете еще:
    1) Почему мои ftp-клиенты и даже панель адинистратора на сайте хостера не видят robots.txt (хотя в настройках включен показ скрытых файлов)? Ссылка «сайт/robots.txt» его открывает без проблем.

    2) В robots.txt после установки и настройки плагина Google XML Sitemaps отображается только один линк на Sitemap:
    Sitemap: http://сайт/sitemap.xml.gz

    При этом через ftp-клиент я вижу и sitemap.xml тоже. Если я доберусь до robots.txt, мне надо будет добавить
    Sitemap: http://сайт/sitemap.xml ?

    Модератор Yui

    (@fierevere)

    永子

    1) потому что вы его не создали и он создается динамически

    2) они идентичны
    .gz — сжатая версия, достаточно указать только 1 из 2 вариантов

    тем больше вопросов

    Но Вы всё же читайте правила форума. П2 особенно внимательно.

    Ида. Это форум по ВП, а не по СЕО.

    Еще раз большое спасибо, Yui. Прошу прощения за оффтоп.

Просмотр 9 ответов — с 1 по 9 (всего 9)
  • Тема «Где хранятся записи?» закрыта для новых ответов.