2010-08-06 6 views
0

Вот мой код в python, который выражает список объектов ссылок. Я хочу удалить дубликаты из них.Как удалить дубликаты в ссылках, связанных с использованием mechnize в Python?

cb = list() 
for link in br.links(url_regex="inquiry-results.jsp"): 
     cb.append(link) 
print set(cb) 

Но оно возвращает ошибку unhashable instance. link что-то вроде этого -

Link(
    base_url='http://casesearch.courts.state.md.us/inquiry/inquirySearch.jis', 
    url='/inquiry/inquiry-results.jsp?action=..........', 
    text='12', 
    tag='a', 
    attrs=[('href', '/inquiry/inquiry-results.jsp?action=.......'), 
    ('title', 'Go to page 12')] 
    ), 

[Добавлены новые строки и точки только для удобства]

Как я могу удалить дубликаты?

ответ

3

Вы можете построить словарь, используя URL-адрес в качестве ключей и получить его значение:

cb = {} 
for link in br.links(url_regex="inquiry-results.jsp"): 
    cb[link.url] = link 
print cb.values()