Использование в Python 2.7 (интерпретатор miniconda). Смущенный приведенным ниже примером около OneHotEncoder
, путают почему enc.n_values_
вывод [2, 3, 4]
? Если кто-то может помочь прояснить, это будет здорово.OneHotEncoder путаница в scikit learn
http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html
>>> from sklearn.preprocessing import OneHotEncoder
>>> enc = OneHotEncoder()
>>> enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
OneHotEncoder(categorical_features='all', dtype=<... 'float'>,
handle_unknown='error', n_values='auto', sparse=True)
>>> enc.n_values_
array([2, 3, 4])
>>> enc.feature_indices_
array([0, 2, 5, 9])
>>> enc.transform([[0, 1, 1]]).toarray()
array([[ 1., 0., 0., 1., 0., 0., 1., 0., 0.]])
пожеланиями, Лин
Спасибо yangjie, поэтому 3 образца: '[0, 1, 0, 1]', '[0, 1, 2, 0]' и '[3, 0, 1, 2]'? –
Также путают насчет '[n_samples, n_feature]', я думал, что это строки 'n_samples' и столбцы' n_feature', но это не так, если бы вы могли сделать ясность, это будет здорово. :) –
Это строки 'n_samples' и столбцы' n_feature'. В X есть 4 образца, каждый образец имеет 3 функции. – yangjie