Описание
Internet Archive Wayback Machine Link Fixer — это плагин WordPress, предназначенный для борьбы с «гниением ссылок» — постепенным устареванием веб-ссылок по мере перемещения, изменения или удаления страниц. Он автоматически сканирует содержимое ваших записей — при сохранении и по всем существующим записям — для обнаружения исходящих ссылок. Для каждой ссылки он проверяет наличие архивной версии в Wayback Machine Архива Интернета и создает снимок, если таковой отсутствует.
Когда связанная страница исчезает, плагин помогает сохранить пользовательский опыт, перенаправляя посетителей на надежную архивную версию. Он также работает проактивно, архивируя ваши собственные записи каждый раз при их обновлении, создавая последовательную резервную копию истории вашего контента.
Защитите свои ссылки, сохраните свой контент и автоматизируйте процесс архивации — всё с минимальными усилиями.
Ключевые особенности
- Автоматически сканирует исходящие ссылки в содержимом записей
- Проверяет наличие существующих архивов в Wayback Machine
- Создает новые снимки, если архив не существует
- Перенаправляет битые или отсутствующие ссылки на архивные версии
- Архивирует ваши собственные записи при обновлениях
- Работает как с новым, так и с существующим контентом
- Помогает поддерживать долгосрочную надежность контента и SEO
Внешние сервисы
Этот плагин подключается к внешним сервисам, предоставляемым Архивом Интернета, для обеспечения своей основной функциональности. Следующая информация подробно описывает, какие данные отправляются, когда и зачем:
API Wayback Machine Архива Интернета (web.archive.org)
Что это за сервис и для чего он используется:
Wayback Machine Архива Интернета — это цифровой архив Всемирной паутины. Этот плагин использует их API для проверки существующих архивных версий веб-страниц, создания новых снимков страниц и проверки статуса заданий архивации.
Какие данные отправляются и когда:
- Проверка статуса системы: Персональные данные не отправляются. Используется для проверки, находится ли сервис Wayback Machine в сети.
- Валидация учетной записи пользователя: При настройке ключа API ваш ключ доступа и секретный ключ отправляются в заголовке Authorization для проверки вашей учетной записи и получения статистики использования (доступные снимки, дневные лимиты и т.д.).
- Архивация URL: URL-адреса из содержимого вашего сайта отправляются для создания новых снимков в Wayback Machine. Это включает как внешние ссылки, найденные в вашем контенте, так и URL-адреса ваших собственных записей, когда включена автоархивация.
- Проверки статуса снимков: Идентификаторы заданий отправляются для проверки статуса запросов на архивацию.
- Поиск существующих снимков: URL-адреса отправляются для поиска существующих архивных версий веб-страниц.
Условия обслуживания и Политика конфиденциальности:
- Условия обслуживания: https://archive.org/about/terms.php
- Политика конфиденциальности: https://archive.org/about/privacy.php
API бота Архива Интернета (iabot-api.archive.org)
Что это за сервис и для чего он используется:
Этот сервис проверяет, доступны ли веб-страницы, и получает конечные URL-адреса после перенаправлений. Он используется для определения того, являются ли ссылки битыми и нуждаются ли в замене на архивные версии.
Какие данные отправляются и когда:
- Проверки доступности ссылок: URL-адреса из содержимого вашего сайта отправляются для проверки их доступности и получения конечного URL-адреса после любых перенаправлений.
- Параметр impersonate: Технический параметр (
impersonate=1) отправляется для обеспечения корректного поведения при проверке ссылок.
Условия обслуживания и Политика конфиденциальности:
- Условия обслуживания: https://archive.org/about/terms.php
- Политика конфиденциальности: https://archive.org/about/privacy.php
Хранение данных и конфиденциальность:
Архив Интернета — это некоммерческая организация, занимающаяся сохранением цифрового контента для публичного доступа. URL-адреса, отправленные в эти сервисы, становятся частью публичного архива и могут быть доступны через интерфейс Wayback Machine. Никакая личная информация, кроме самих URL-адресов, не передается этим службам.
Документация для разработчиков
Документация для разработчиков и исходный код доступны в репозитории GitHub: https://github.com/a8cteam51/internet-archive-wayback-machine-link-fixer
Скриншоты

Обзор панели управления, включающий текущую статистику использования, последние проверки и добавленные ссылки. 
Обзор ссылок, найденных в содержимом вашего сайта. 
Вкладка справки для объяснения значков и таблицы ссылок. 
Детали ссылки: отображение информации о ссылке, всех проверках и записях, в которых она встречается.
Часто задаваемые вопросы
-
Как работает проверка ссылок?
-
Ваш контент проверяется на наличие ссылок. Когда находится ссылка, плагин проверяет, обрабатывалась ли она ранее. Если нет, то он найдет или создаст снимок веб-страницы в Архиве Интернета. Затем, если позже целевой сайт этой ссылки отключится, мы сможем изменить ссылку на архивную версию.
-
Как мы определяем, что ссылка битая?
-
Мы используем политику, подобную Википедии. Мы проверяем ссылки раз в неделю, и если получаем 3 последовательные ошибки, мы считаем ссылку битой, если только целевой сайт не вернется в сеть.
-
Можно ли обработать все ссылки?
-
К сожалению, нет. Некоторые сайты не разрешают Архиву Интернета архивировать их контент.
-
Архивируется ли мой собственный контент?
-
Да, вы можете включить Авто-архиватор, и тогда новые снимки будут создаваться каждый раз при внесении изменений.
-
Что происходит с битыми ссылками?
-
Когда мы находим битую ссылку, мы обновляем src на лету; это означает, что исходный контент не редактируется и остается таким, каким был создан.
-
Сколько времени это занимает?
-
Всё зависит от количества ссылок в вашем контенте. Всё обрабатывается в фоновом режиме, но может занять много недель, если на сайте тысячи ссылок. Лучше всего использовать его как инструмент, который вы настраиваете и оставляете работать в фоне.
-
Добавляет ли это большую нагрузку на мой сайт?
-
Поскольку вся обработка происходит в фоновом режиме, в пользовательских таблицах, это не должно добавлять заметной нагрузки на ваш сайт.
-
Нужен ли мне ключ API archive.org?
-
Хотя это и не обязательно, наличие ключа API значительно увеличит количество снимков, которые вы можете создавать в день.
-
Что происходит, если Архив Интернета отключается?
-
Если сервисы Архива Интернета отключатся, исправление ссылок задержит все процессы на 24 часа и повторит попытку позже.
-
Как часто обновляются мои собственные записи при активной автоархивации?
-
Существующий контент отправляется в Wayback Machine пакетно при активации плагина, а затем повторно каждые 30 дней (по умолчанию, но может быть изменено). Новый контент отправляется на архивацию вскоре после публикации. Обновления существующего контента также вызывают отправку обновлений в Wayback Machine.
-
Совместимость с мультисайтами?
-
К сожалению, в настоящее время плагин не полностью совместим с мультисайтами. Единственный способ его использования — включение на уровне отдельного сайта, а не всей сети. Мы планируем решить эту проблему в одном из будущих релизов.
-
Поддержка плагинов-конструкторов страниц и произвольных полей?
-
Сейчас плагин лучше всего работает с основным редактором блоков, и нам предстоит дополнительная работа для поддержки плагинов-конструкторов страниц и произвольных полей.
Отзывы
Участники и разработчики
«Internet Archive Wayback Machine Link Fixer» — проект с открытым исходным кодом. В развитие плагина внесли свой вклад следующие участники:
Участники«Internet Archive Wayback Machine Link Fixer» переведён на 4 языка. Благодарим переводчиков за их работу.
Перевести «Internet Archive Wayback Machine Link Fixer» на ваш язык.
Заинтересованы в разработке?
Посмотрите код, проверьте SVN репозиторий, или подпишитесь на журнал разработки по RSS.
Журнал изменений
1.3.6
- Allows posts to be selected to be excluded from link fixing and/or auto archiving.
- Improves cleanup of passed attempts to create and verify snapshots
- Adds an Archive.org donation notice.
- Improves translatable strings for betting internationalisation.
1.3.5
- Небольшая корректировка процесса логирования ошибок при создании снимков.
- Улучшение способа генерации статистики по ссылкам.
- Приводит все архивированные URL к https://, можно отключить в настройках.
- Улучшения в обработке отмененных действий по сканированию собственных записей, чтобы предотвратить переполнение базы данных отмененными задачами.
1.3.4
- Незначительные улучшения и изменения пользовательского интерфейса
- Уменьшены интервалы проверки по умолчанию и общее количество битых страниц, необходимое для срабатывания перенаправления.
- Упрощен процесс онбординга.
1.3.3
- Исправлена ошибка, при которой ссылки и скрипты загружались, даже если было установлено «ничего не делать»
- Переход на пользовательские URL с префиксом WP
- Исправлены различные проблемы с иконками и счетчиками на панели управления
- Улучшена обработка проблем аутентификации и уведомлений
- Обнаружение тестовых сайтов и предотвращение запуска автоархивации.
- Исправлена ошибка, при которой отсутствие опции автоархивации в базе данных могло приводить к индексации записей.
1.3.2
- Исправление ошибки
1.3.1
- Внесены различные изменения в пользовательский интерфейс и опыт взаимодействия, касающиеся значков, подсказок и меток.
- Также исправлены несколько незначительных ошибок, связанных с настройками и работой мастера.
1.3.0
- Первая публичная версия.
Примечание: все версии до 1.3.0 не были публично выпущены.
