Python 3.5, предварительная обработка с sklearnЧто такое preprocessing.scale()? Как это работает?
df = quandl.get('WIKI/GOOGL')
X = np.array(df)
X = preprocessing.scale(X)
Python 3.5, предварительная обработка с sklearnЧто такое preprocessing.scale()? Как это работает?
df = quandl.get('WIKI/GOOGL')
X = np.array(df)
X = preprocessing.scale(X)
preprocessing.scale() алгоритм помещает данные на одном уровне. Это полезно в большинстве редких наборов данных. Простыми словами, ваши данные значительно распространены. Например, значение X может быть, например, так:
Х = [1, 4, 400, 10000, 100000]
Проблема с разреженностью является то, что он очень предвзятым или в статистических терминах перекоса. Таким образом, масштабирование данных приносит все ваши значения на один масштаб, устраняя разреженность. Что касается того, как он работает математически, это следует той же концепции нормализации и стандартизации. Вы можете исследовать их, чтобы узнать, как это работает в деталях. Но чтобы сделать жизнь проще, алгоритм sklearn делает все для вас!
Вы посмотрели [документацию] (http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.scale.html)? –
Да, но я не могу понять, что он делает с значениями X? –
Я верю, что он вычитает среднее значение и делит на стандартное отклонение вашего набора данных вдоль данной оси. – pbreach