Ну, я бы предложил, чтобы проще всего экспортировать их как XML (с использованием API AJAX) или HTML, а затем разобрать их все в массив, перебрать их и извлечь домены, а затем отсортировать список и подсчитать значение, чтобы вы получили хеш, например {"example.org" => 1, "cnn.com", 50} и т. д. Затем сортируйте их, чтобы вы могли видеть свою первую десятку.
Как вы это сделаете, это зависит от того, какой язык программирования и библиотеки вы предпочитаете использовать. Я бы, вероятно, использовал Нокогири и Руби. В принципе, загрузите данные с помощью API, проанализируйте его с помощью библиотеки синтаксического анализа XML для вашего предпочтительного языка программирования, используйте библиотеку URI для извлечения хост-части URI (или используйте регулярное выражение), а затем просто перемещайте массив до тех пор, пока он не будет делает то, что вы хотите.