Мой вопрос состоит из трех частей: (1) Может ли связанная с ней несущая сеть обрабатывать входные функции, которые являются смешанными: некоторые из них категоричны (дискретно-значные: например, Low, Med, High) и некоторые являются реальными? Общее число переменных входных функций составляет около 80 - 90, и я хочу решить (контролируемую) проблему классификации (2) Если ответ на часть (1) да, я прочитал об использовании двоичных кодов, таких как (Low = 001, Med = 010, High = 100 и т. Д.) Для представления дискретнозначных функций ввода в других контекстах - будут ли они работать и для NN? Я обеспокоен масштабированием/нормализацией всего вектора входных функций (который, я полагаю, рекомендуется) - как масштабировать/нормализовать весь смешанный вектор функции или он не требуется? (3) Кто-то предположил, что я использую Random Forest (RF). Я не знаком с РФ. Каковы плюсы и минусы использования РФ против НН в данном контексте?Нейронные сети Смешанные функциональные и категориальные функции ввода
0
A
ответ
0
Я могу ответить на вопрос №2, я не очень подготовлен по РФ, поэтому я просто оставлю этот ответ более опытным людям.
Что касается пункта 2, если вы преобразуете каждый свой категориальный ввод в k-вектор (с k = # классов), вы просто вводите k новых входов, которые масштабируются в диапазоне [0, 1 ], поэтому, если ваши действительные функции ввода сами масштабируются в этом диапазоне, вы в значительной степени в порядке.
Обратите внимание, что при использовании функции активации TANH (чьи выходы в диапазоне от -1 до 1), вы должны превратить ваш категорический вход оснащен соответствующим образом, так что (скажем, к = 3):
0 должен стать < 1, -1, -1>
1 должен стать < -1, 1, -1>
2 должен стать < -1, -1, 1>
Надежда Я четко что.