У меня есть данные, подобные следующим:Как нормализовать только определенные столбцы в scikit-learn?
[
[0, 4, 15]
[0, 3, 7]
[1, 5, 9]
[2, 4, 15]
]
я использовал oneHotEncoder
http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html#sklearn.preprocessing.OneHotEncoder.fit_transform для предварительной обработки этих данных и поэтому подходит для линейной регрессии, чтобы дать мне это:
[
[1, 0, 0, 4, 15]
[1, 0, 0, 3, 7]
[0, 1, 0, 5, 9]
[0, 0, 1, 4, 15]
]
Однако, я тогда хотел бы нормализовать эти данные.
До сих пор я просто нормализовать данные следующим образом:
preprocessing.normalize(data)
Однако это нормирует все столбцы, включая категории них.
Мои вопросы следующие:
- Как нормализовать только определенные столбцы?
- Желательно ли нормализовать данные категории или я должен избегать этого?
Спасибо!