Когда вы находите URL-адрес на странице результатов поиска Google (SERP), имеет ли он тот же заголовок, что и в вашем теге? И есть ли у него описание/фрагмент?
Что я думаю о том, что Google знает о URL-адресе из ссылки на вашем сайте, поэтому он попытается выполнить сканирование и индексировать его. Однако, поскольку он заблокирован файлом robots.txt, не разрешается сканировать страницу, поэтому он не может видеть метатег noindex, который находится на вашей странице входа.
Поскольку он не знает, что он не должен индексировать страницу, Google добавит URL-адрес в свой индекс. Тем не менее, такие страницы, как правило, имеют только заголовок и URL-адрес в SERP, и они почти всегда не имеют описания/фрагмента. Иногда заголовок в SERP выглядит так, как будто они просматривали страницу, но то, что они на самом деле делают, это попытка создать заголовок на основе якорного текста ссылок, указывающих на него.
Верный способ получения страницы, не отображаемой в SERP, состоит в том, чтобы удалить команду Disallow: /admin/
и разрешить роботу Googlebot сканировать страницу и увидеть метатег noindex, nofollow.
Команда noindex удалит страницу из SERP, а nofollow поможет сообщать Googlebot о том, чтобы не отдавать приоритет ссылкам, которые он находит на вашей странице входа (это поможет поддерживать эффективность сканирования, но не гарантирует Google не будет сканировать ссылки, найденные на странице).
Возможно ли, что страница существовала до того, как вы добавили/использовали ваш файл robots.txt? В случае htat для Google может потребоваться некоторое время, чтобы адаптироваться к изменению. –
Нет, оба загружены в то же время, 4 месяца назад. И все же, почему разница между командой «inurl» и «site»? – waanders