Как представить набор/список элементов во входных данных (фрейм данных) для H2O?Представляет список элементов ввода CSV для H2O
Я использую игристую воду 1.6.5 с потоком H2O. Мои исходные данные (столбцы в файле CSV) выглядит следующим образом:
age: numeric
gender: enum
hobbies: ?
sports: ?
хобби и спорт списки/наборы с ограниченным числом возможных записей (~ 20 каждый). Для этого H2O, похоже, не имеет подходящего типа данных. Как экспортировать их в файл CSV, который может быть обработан H2O Flow?
Не знаю о h2o, но машинное обучение имеет понятие «одна горячая кодировка». Вы можете просто сделать всевозможные записи в вашем списке хобби и спорта, как «столбец csv», который является двоичным, как ваш гендерный атрибут. –
Звучит как действительный вариант, спасибо. Тем не менее, я надеюсь, что есть более простой и удобный способ, чем делать это вручную. –