Я должен классифицировать некоторые настроения моего кадра данных, как этофрейма данных tfidf с питоном
Phrase Sentiment
is it good movie positive
wooow is it very goode positive
bad movie negative
я сделал некоторую предварительную обработку, как токенизации стоп-слова, вытекающими и т.д. ... и я получаю
Phrase Sentiment
[ good , movie ] positive
[wooow ,is , it ,very, good ] positive
[bad , movie ] negative
мне нужно, наконец, чтобы получить dataframe Wich линий являются текстом, значение является tf_idf и столбцами являются такими словами, как что
good movie wooow very bad Sentiment
tf idf tfidf_ tfidf tf_idf tf_idf positive
(то же самое для остальных линий 2)
Спасибо, что это работает –
У меня ошибка памяти памяти в этой строке r = pd.DataFrame (X.toarray(), columns = vect.get_feature_names()) –
@AmalKostaliTarghi, я обновил свой ответ - пожалуйста, проверьте, помогло ли это – MaxU