Я мечение текста для поиска существительных и прилагательных:NLTK разбирает скобку неправильно
text = u"""Developed at the Vaccine and Gene Therapy Institute at the Oregon Health and Science University (OHSU), the vaccine proved successful in about fifty percent of the subjects tested and could lead to a human vaccine preventing the onset of HIV/AIDS and even cure patients currently on anti-retroviral drugs."""
nltk.pos_tag(nltk.word_tokenize(text))
Это приводит к:
[('развитые', 'ННП'), («в '' В '), (далее '' Dt '), (' Вакцина ' ' ННП '), (' и', 'СС '), (' Джин',»ННП '), (' терапия '' ННП '), (' институт '' ННП '), (' в '' IN '), (далее '' Dt '), (' Oregon '' ННП «), ('Здоровье', 'ННП'), ('и', 'CC'), ('Наука', 'ННП'), ('университет', 'ННП'), ('(', 'ННП'), (OHSU '' ННП '), (') '' ННП '), (', ' ' '), (далее', 'Dt'), ('Vaccine', 'NN'), ('доказали', 'ВБД'), ('успешно', 'JJ'), ('', 'в'), ('о' 'в'), ('Пятьдесят', 'JJ'), ('процента', 'NN'), ('из', 'в'), (далее ', 'Dt'), («предметы '' NNS '), (' испытания '' ВБД '), (' и '' СС '), (' может '' MD '), (' свинец '' VB «), ('до', 'в'), ('а', 'Dt'), ('Человек', 'NN'), ('Вакцина', 'NN'), ('предотвращение', 'VBG'), (далее ', 'Dt'), ('начало', 'NN'), ('из', 'в'), ('NNS' 'ВИЧ/СПИД'), ('и', «CC '), (' даже '' RB '), (' Cure '' NN '), (' пациенты '' NNS '), (' в настоящее время '' RB '), (' на '' IN '), (' антиретровирусные '' JJ '), (' наркотики, 'NNS'), (' ''.')]
Есть встроенный способ правильно обнаружения скобку, когда мечения предложения?
Что вы имеете в виду Correct ? Рассматривали ли вы Раскрывая скобки? – Spaceghost