В качестве доказательства того, насколько хороши мои усилия SEO для одного из наших веб-сайтов, вики, проживающие в том же домене, получили 2601 спам-страницы за 2 дня (совпадение, которое было перечислено в SERPs 2 дня назад...).Заключительные штрихи очистки таблиц Mediawiki после удаления спам-страниц
Я заблокировал вики (только для чтения), включил списки блоков, Captchas и т. Д. И т. Д. И использовал расширение Nuke для удаления всего спама.
Теперь это замечательно только для одного расширения, но оно все еще оставляло вещи здесь и там, которые я бы хотел обрезать.
В принципе, Nuke (который, я думаю, это официальное расширение) оставил «осиротевшие» записи в следующих таблицах: pagelinks, searchindex, users.
У меня нет проблем с удалением записей, но я не хочу нарушать согласованность базы данных, случайно обрезая материал. Я могу понять, как выполнять SQL-запросы, сценарии командной строки Linux и всевозможные передовые материалы.
Итак, вот некоторые вопросы для некоторых полезных читателей StackOverflow, которые знают Mediawiki внутренностей:
Могу ли я свободно удалять пользователей строк таблицы? Мне просто нужно сохранить две строки, чтобы запрос SQL был простым. Я просто не хочу вызывать побочные эффекты с любыми другими таблицами, которые могут быть связаны с ними.
Что я могу сделать, чтобы удалить осиротевшие записи в pagelinks? Они явно указывают на теперь страницы, но по умолчанию поддерживаются сценарии Mediawiki по умолчанию, которые я использовал (сначала расширение nuke, затем
rebuildall.php
) не убирают этих сирот. Это заставляет меня поверить, что у меня все еще может быть мусор, в результате сценарий не удаляет ссылки, указывающие на него. Тем не менее, я проверил тройные страницы ... только несколько страниц, сделанных нами, больше не осталось. Я также очистил ревизии.
Я попытался с помощью консоли refreshLinks.php
и orphans.php
сценарии, но они ничего не сделали соответствующий.
Я уверен, что таблица pagelinks может быть дополнительно обрезана, потому что с помощью скрипта обслуживания консоли dumpLinks.php
я могу легко grep всевозможные «неудобные» слова и ссылки.
Я голосую, чтобы закрыть этот вопрос как не по теме, потому что это ** блог ** сообщение, а не вопрос! –