0

Использование в Python 2.7 (интерпретатор miniconda). Смущенный приведенным ниже примером около OneHotEncoder, путают почему enc.n_values_ вывод [2, 3, 4]? Если кто-то может помочь прояснить, это будет здорово.OneHotEncoder путаница в scikit learn

http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html

>>> from sklearn.preprocessing import OneHotEncoder 
>>> enc = OneHotEncoder() 
>>> enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]]) 
OneHotEncoder(categorical_features='all', dtype=<... 'float'>, 
     handle_unknown='error', n_values='auto', sparse=True) 
>>> enc.n_values_ 
array([2, 3, 4]) 
>>> enc.feature_indices_ 
array([0, 2, 5, 9]) 
>>> enc.transform([[0, 1, 1]]).toarray() 
array([[ 1., 0., 0., 1., 0., 0., 1., 0., 0.]]) 

пожеланиями, Лин

ответ

1

n_values это количество значений в функции.

В этом примере

X = 0 0 3 
    1 1 0 
    0 2 1 
    1 0 2 

(форма X является [n_samples, n_feature])

Для первой функции, есть 2 значения: 0, 1;

Для второй функции, есть 3 значения: 0, 1, 2.

Для третьей функции, есть 4 значения: 0, 1, 2, 3.

Поэтому enc.n_values_ является [2, 3, 4].

+0

Спасибо yangjie, поэтому 3 образца: '[0, 1, 0, 1]', '[0, 1, 2, 0]' и '[3, 0, 1, 2]'? –

+0

Также путают насчет '[n_samples, n_feature]', я думал, что это строки 'n_samples' и столбцы' n_feature', но это не так, если бы вы могли сделать ясность, это будет здорово. :) –

+1

Это строки 'n_samples' и столбцы' n_feature'. В X есть 4 образца, каждый образец имеет 3 функции. – yangjie

 Смежные вопросы

  • Нет связанных вопросов^_^