Предположим, у меня есть сайт WordPress со многими блогами. Я обнаружил, что кто-то там копирует содержимое каждой страницы моего сайта и вставляет его на свой сайт. Я полагал, что он не делает это вручную, поскольку сумма огромна. И я пытаюсь воспроизвести то, что он сделал, и я нахожу, что на самом деле для меня довольно легко сделать то же самое, используя php curl и некоторый Dom Parsing (давая мне знать имя класса, где находится полезный текст).Могу ли я предотвратить программную выборку содержимого с моего сайта?
Могу ли я иметь какие-либо способы предотвратить это или, по крайней мере, сделать это труднее для них сделать это в будущем? Благодаря!
Несмотря на понижение, я не думаю, что это невозможно, по крайней мере, увеличить сложность для него. Я могу скрутить мой сайт, но для некоторых художественных сайтов в Китае я могу получить мусор через завиток.Они не используют JavaScript для разборки скремблированного теста, как это было предложено в ответе, так как даже если я отключу JS в своем браузере, я могу без проблем просматривать обычную версию сайта. Я постараюсь понять, как они это достигают, и может опубликовать ответ, если найду его. – user2335065