Я пытаюсь подготовить данные для контролируемого обучения. У меня есть данные Tfidf, который был сгенерирован из колонки в моем dataframe под названием «слит»Комбинируйте Sklearn TFIDF с дополнительными данными
vect = TfidfVectorizer(stop_words='english', use_idf=True, min_df=50, ngram_range=(1,2))
X = vect.fit_transform(merged['kws_name_desc'])
print X.shape
print type(X)
(57629, 11947)
<class 'scipy.sparse.csr.csr_matrix'>
Но мне также нужно добавить дополнительные столбцы этой матрицы. Для каждого документа в матрице TFIDF у меня есть список дополнительных числовых функций. Каждый список имеет длину 40 и состоит из поплавков.
Так что для уточнения, у меня есть 57 629 списков длины 40, которые я хотел бы добавить к моему TDIDF результату.
В настоящее время у меня это в DataFrame, например, данные: merged ["other_data"]. Ниже приведен пример строки из объединенного [ «other_data»]
0.4329597715,0.3637511039,0.4893141843,0.35840...
Как я могу добавить в 57,629 ряды моей колонке dataframe с матрицей TF-IDF? Я честно не знаю с чего начать и буду признателен за любые указатели/руководство.