2015-07-31 4 views
0

Я ищу, чтобы рассчитать какое-то «сходство» между двумя скриншотами веб-сайтов. Я специально хочу рассчитать, как определенный веб-сайт изменяется с течением времени (т. Е. Определять, какие веб-сайты имеют тенденцию сохранять постоянный вид), а также сравнивать внешний вид веб-сайта с кучей других сайтов подобного класса (например, на всех новостных сайтах) чтобы увидеть, насколько отличительным оно является от других. [одно из приложений, которые я имею в виду, анализирует эволюцию сайтов новостей - многие блоги очень похожи друг на друга, в то время как некоторые из новостных сайтов весьма своеобразны и со временем сильно изменились)Сравнивать сходство относительно разнородных изображений [веб-сайты] друг с другом

Существует множество других переполнений стека при сравнении сходства изображений - однако они имеют тенденцию фокусироваться на обнаружении идентичных/очень похожих изображений (например, Image comparison - fast algorithm или Image similarity comparison). В сравнении, я ищу, чтобы определить какой-то счет между изображениями, которые являются совершенно разными. Таким образом, некоторые методы, такие как хеширование/сопоставление ключевых точек, вероятно, исключены (т. Е. Потому что два изображения, которые могут не разделять любые ключевые точки в точности, могут по-прежнему казаться очень похожими, по крайней мере, на глаз)

Примечание: Мое нынешнее мозговое штурмование было используйте метод гистограммы цветов, возможно, используя относительно грубые ведра цветов, поскольку многие цвета относительно неразличимы (например, конвертировать сайт в 256 цветов). Возможно также сравнение того, что сайт имеет тенденцию доминировать только одним цветом или имеет широкий спектр цветов.

ответ

0

Возможно, я использовал HOG (Histogram Of Gaussians) в верхней части страницы (фиксированный размер). Это будет действовать как огромная «функция» для веб-сайта. Затем вы можете рассчитать доверие HOG между различными образцами.