Привет Я работаю с NLTK, nps_chat corpus.Tagged nltk.corpus.nps_chat.xml_post
Я знаю, что я могу получить доступ к NPS корпуса чата, как следующий
posts = nltk.corpus.nps_chat.xml_posts()
Я подготовил список Labeled_names, следующий
Labeled_names=[(post.text,post.get('class')) for post in posts]
И я получил следующее, как это,
>>> Labeled_names[:10]
[('now im left with this gay name', 'Statement'), (':P', 'Emotion'), ('PART', 'System'), ('hey everyone ', 'Greet'), ('ah well', 'Statement'), ('NICK :10-19-20sUser7', 'System'), ('10-19-20sUser7 is a gay name.', 'Accept'), ('.ACTION gives 10-19-20sUser121 a golf clap.', 'System'), (':)', 'Emotion'), ('JOIN', 'System')]
Что мне нужно знать, а не только текст, есть способ получить помеченный текст, usi ng nltk.corpus.nps_chat.xml_post?
Вы имеете в виду POS-тегированный текст? Если это так, используйте 'nltk.pos_tag()' для пометки текста. – DyZ
№ NPS chat corpus уже отмечен. Мне нужно сделать это, чтобы получить те теги, когда я получил текст, используя post.text –
Только тег 'nltk.corpus.nps_chat.tagged_posts()' отмечен. – DyZ