2016-11-22 4 views
1

У меня есть функции с 18 размерами после выбора функции и будут использоваться для обучения классификатора, RNN, HMM и т. Д.Нужно ли нормализовать/стандартизировать данные в машинном обучении?

Особенности: stddev, средняя и производная акселерометра и гироскопа. Эти функции имеют разные единицы, и нормализация/стандартизация потеряют истинное значение функций.

Например, единица одного вектор-функции представляет собой скорость вращения (степень/сек), значение в этой функции составляет от -120 до 120. Другим является stddev ускорения оси x, значение в основном находится между 0 и 2. Если я хочу выполнить стандартизацию, все векторы признаков будут центрированы около 0, при этом отрицательные/положительные значения будут разбросаны вокруг нуля. -> Даже stddev будет иметь отрицательные значения! Он полностью теряет смысл?

Неужели я ошибаюсь? Любая информация ценится! Благодаря!

+1

Это не подходит для SO. в любом случае у вас есть anwser [здесь] (http://stats.stackexchange.com/questions/189652/is-it-a-good-practice-to-always-scale-normalize-data-for-machine-learning) –

ответ

-2

Всегда рекомендуется предлагать масштабирование и нормализацию функции как шаг предварительной обработки, и это даже пригодится градиентному спуску (наиболее распространенный алгоритм обучения), даже в вашем случае это было бы полезно, но если вы сомневаетесь, можете выполнить перекрестное подтверждение. Например, при использовании изображений и нейронных сетей иногда после нормализации функции (пиксели) получают отрицательные значения, что не приводит к тому, что данные обучения теряют смысл.

 Смежные вопросы

  • Нет связанных вопросов^_^