0

1) Какое влияние оказывает параметр randomSeed на dimensionality reduction на random projection в weka?Какое влияние randomSeed на уменьшение размерности на случайную проекцию?

2) Во-вторых, говорят, что dimensionality reduction не потеря информации, но я заметил, что, если мы устанавливаем numberOfAttributes меньше, улучшает точность, принимая во внимание, если мы устанавливаем numberOfAttributes близко к текущей (фактическая) или большое значение, будь то это снижает точность?

+1

Уменьшение размерности обычно теряет информацию. Это форма сжатия с потерями. –

ответ

0

Google для «случайного числа семян», чтобы понять случайный параметр семян.

Уменьшение размерности теряет информацию, но более низкая размерность может упростить задачу оптимизации. Утерянные данные также могут отвлекать шум, поэтому не удивляйтесь, что иногда подход с потерями повышает производительность. Просто не полагайтесь на это.

+0

это означает, что мы никогда не уверены, что уменьшение размерности улучшит точность или нет, но оно всегда будет оптимизировать процесс классификации? –

+0

Нет, иначе мы всегда или никогда не будем этого делать, но не только иногда. –

+0

На самом деле у меня есть 146 размер в моих данных. Я уже применил информацию, чтобы уменьшить размер. Я хочу ускорить процесс классификации без снижения точности. Я узнал, что только способ оптимизации классификации - использовать быстрый ученик и уменьшить размеры, но в моем случае они снижают точность, т. Е. Если я устанавливаю размер, чтобы уменьшить атрибуты до 80%, это уменьшает точность больше, чем я устанавливаю атрибуты уменьшения на 50% , Есть ли другой способ оптимизации процесса классификации? –