Я использую NLTK и TextBlob найти существительные и словосочетания в тексте:Python: NLTK и TextBlob на французском
from textblob import TextBlob
import nltk
blob = TextBlob(text)
print(blob.noun_phrases)
tokenized = nltk.word_tokenize(text)
nouns = [word for (word, pos) in nltk.pos_tag(tokenized) if is_noun(pos)]
print(nouns)
Это прекрасно работает, если мой текст на английском языке, но это не уедешь, если мой текст на французском языке.
Мне не удалось найти способ адаптации этого кода для французского языка, как это сделать?
И есть ли список где-нибудь из всех языков, которые можно разобрать?
У вас есть два отдельных фрагмента кода. Один использует «TextBlob» (строки 1 и 2). Другой использует 'nltk' (строки 3-5). Какой из них не работает? – DyZ
@DYZ работают с английским текстом, но оба не работают с французским текстом. С французским текстом Textblob сообщает существительные фразы, которые на самом деле не являются фразами, а nltk сообщает о словах, которые не являются существительными. – Sulli