У меня есть 40 входных категоричные поля, такие как «CpuModel» (1523 возможностей)Слишком много возможностей для категориальных полей
каждый из них может иметь тысячи возможностей.
Если я использую get_dummies, моя таблица panda будет содержать много фиктивных столбцов. Эти поля, которые я планирую использовать в качестве входных функций для алгоритмов машинного обучения.
Как я должен справиться с этим?
Идея не определена. wld должны читать документацию. что касается точности, мой совет будет проверять оба, используйте тот, который дает лучший результат. – epattaro