1

Некоторые функции такие, как «выпускной курс из школы», а другие функции категоричны, как название школы. Я использовал кодировщик ярлыков для функций, которые категорически преобразуют их в целые числа.Обучение машинам: как применить одну горячую кодировку в кадре данных pandas с использованием как категориальных, так и числовых функций?

У меня теперь есть dataframe с обоими поплавками и целыми числами, представляющими числовые функции и категориальные функции (преобразованные с помощью кодера метки) соответственно.

Я не уверен, как действовать с учащимся, нужно ли мне использовать одну горячую кодировку? И если да, то как я могу это сделать? Я не могу просто передать dataframe в sklearn OneHotEncoder, так как есть поплавки, согласно моему текущему пониманию. Я просто применяю кодер метки ко всем функциям для решения проблемы?

Sample data from my dataframe. OPEID and opeid6 were transformed using a label encoder

Спасибо большое!

+1

Возможный дубликат [sklearn трубопровода - как применять различные преобразования на различных coluns] (http://stackoverflow.com/questions/39001956/sklearn-pipeline-how-to-apply-different-transformations -on-different-coluns) – maxymoo

+0

Возможный дубликат [Как я могу написать горячую кодировку в Python?] (http://stackoverflow.com/questions/37292872/how-can-i-one-hot-encode-in-python) –

ответ

0

Просто используйте OneHotEncodercategorical_features аргумент для выбора с функциями категоричны:

categorical_features: «все» или массив индексов или маски:

Укажите, какие функции рассматриваются как категоричен.

  • «все» (по умолчанию): все функции рассматриваются как категориальные.
  • массив индексов: массив категориальных признаков функции.
  • маска: массив длины n_features и с dtype = bool.

    Некатегорические функции всегда сложены справа от матрицы.