2017-02-19 11 views
1

Python 3.5, предварительная обработка с sklearnЧто такое preprocessing.scale()? Как это работает?

df = quandl.get('WIKI/GOOGL') 
X = np.array(df) 
X = preprocessing.scale(X) 
+0

Вы посмотрели [документацию] (http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.scale.html)? –

+0

Да, но я не могу понять, что он делает с значениями X? –

+1

Я верю, что он вычитает среднее значение и делит на стандартное отклонение вашего набора данных вдоль данной оси. – pbreach

ответ

2

preprocessing.scale() алгоритм помещает данные на одном уровне. Это полезно в большинстве редких наборов данных. Простыми словами, ваши данные значительно распространены. Например, значение X может быть, например, так:

Х = [1, 4, 400, 10000, 100000]

Проблема с разреженностью является то, что он очень предвзятым или в статистических терминах перекоса. Таким образом, масштабирование данных приносит все ваши значения на один масштаб, устраняя разреженность. Что касается того, как он работает математически, это следует той же концепции нормализации и стандартизации. Вы можете исследовать их, чтобы узнать, как это работает в деталях. Но чтобы сделать жизнь проще, алгоритм sklearn делает все для вас!

 Смежные вопросы

  • Нет связанных вопросов^_^