2016-11-09 11 views
0

Я работаю в weka с набором данных, который имеет счет как последний атрибут. Атрибут count, который является числовым типом данных, относится к числу велосипедов, которые сдаются в аренду в этот конкретный день. Например. 12, 15, 30, 11, 45. Я хотел предсказать эти значения в своем тестовом наборе данных.Работая в Weka, последний тип данных атрибута должен быть номинальным?

+0

Weka обычно предполагает, что последним атрибутом является атрибут target. Алгоритмы классификации требуют, чтобы цель была номинальной, но алгоритмы прогнозирования (например, линейная регрессия) допускают числовой класс. Вы также можете изменить целевой атрибут на вкладке предварительного процесса в Weka Explorer. – Walter

ответ

0

Это зависит от вашего алгоритма.

Алгоритмы классификации обычно требуют номинального или двоичного «целевого» значения.

Регрессионным алгоритмам потребуется числовая цель.

0

Вы можете использовать линейную регрессию с числовым целевым атрибутом (Weka называет это «атрибутом класса»). Фактически все алгоритмы Weka на вкладке «классифицировать», которые недоступны (из-за атрибута числового класса), будут выделены серым цветом.

Если у вас много дискретных независимых переменных, например. «погода», «is_weekend», «режим оплаты», «customer_gender», ... вы также можете использовать фильтр «Discretize» Weka для преобразования атрибута числового класса в дискретный, например. интервальные классы, такие как 0-10 байков/день, 10-20 b./day и т. д.

Для этого вы должны временно присвоить аттрибуту класса любому другому атрибуту. Сделайте это с помощью selectbox в верхней части окна внизу справа от вкладки фильтра. затем примените дискретизированный фильтр, но ТОЛЬКО на атрибут class bikes_per_day (по умолчанию фильтр дикретизирует все атрибуты). Затем повторно назначьте атрибут класса последнему, теперь дискретизированному атрибуту.

Тогда будут доступны алгоритмы классификации Weka, такие как J48 (больше не выделены серым цветом). Они могут давать более сжатые, интерпретируемые результаты, например. маленькие деревья принятия решения, такие как: Если сезон = лето и день = выходные и weather_forecasted = солнечно, то preded_rented_class = 40-50 байков/день