Некоторые функции такие, как «выпускной курс из школы», а другие функции категоричны, как название школы. Я использовал кодировщик ярлыков для функций, которые категорически преобразуют их в целые числа.Обучение машинам: как применить одну горячую кодировку в кадре данных pandas с использованием как категориальных, так и числовых функций?
У меня теперь есть dataframe с обоими поплавками и целыми числами, представляющими числовые функции и категориальные функции (преобразованные с помощью кодера метки) соответственно.
Я не уверен, как действовать с учащимся, нужно ли мне использовать одну горячую кодировку? И если да, то как я могу это сделать? Я не могу просто передать dataframe в sklearn OneHotEncoder, так как есть поплавки, согласно моему текущему пониманию. Я просто применяю кодер метки ко всем функциям для решения проблемы?
Sample data from my dataframe. OPEID and opeid6 were transformed using a label encoder
Спасибо большое!
Возможный дубликат [sklearn трубопровода - как применять различные преобразования на различных coluns] (http://stackoverflow.com/questions/39001956/sklearn-pipeline-how-to-apply-different-transformations -on-different-coluns) – maxymoo
Возможный дубликат [Как я могу написать горячую кодировку в Python?] (http://stackoverflow.com/questions/37292872/how-can-i-one-hot-encode-in-python) –