У меня есть список слов, который состоит из множества предметов. Субъекты были автоматически извлечены из предложений. Я хотел бы сохранить только существительное от предметов. Поскольку вы можете видеть, что некоторые из субъектов имеют adj, которые я хочу удалить.Как сохранить только слова-слова в слове? python NLTK
wordlist=['country','all','middle','various drinks','few people','its reputation','German Embassy','many elections']
returnlist=[]
for word in wordlist:
x=wn.synsets(word)
for syn in x:
if syn.pos() == 'n':
returnlist.append(word)
break
print returnlist
результаты выше:
['country','it', 'middle']
Однако, я хочу, чтобы получить результат должен выглядеть следующим образом
wordlist=['country','it', 'middle','drinks','people','reputation','German Embassy','elections']
Как сделать это?
вы хотите использовать только NLTK –
нет действительно. пока я могу получить результат идеи. любой метод является приемлемым – bob90937
'middel' не существительное, а также' it' (местоимение) –