Мои оригинальные данные представлены в широком формате, как показано в Таблица A.ANOVA с использованием широкого формата таблицы данных
Предположим, я хочу исследовать, страдают ли ветераны, испытавшие различные туры военной службы, с разных уровней депрессии.
я решил запустить односторонний тест ANOVA по данным с Depression_Score в качестве критерия и «дежурства служило» как фактор. Я знаю, что могу переформатировать данные в длинный формат, как в Таблица B, а затем запустить ANOVA.
Вот мой вопрос, хотя: можно запустить тест ANOVA непосредственно на таблице A без изменения формы данных в таблице B?
Если да, то какие команды R я использовал бы для программирования этого?
Таблица A:
ArmyVet_ID Served_WW2 Served_KoreanWar Served_VietnamWar Depression_Score
110001 1 0 0 3
110002 1 0 0 1
110004 0 1 0 4
110005 0 1 0 3
110009 0 0 1 7
110010 0 0 1 5
Таблица B:
ArmyVet_ID Served Depression_Score
110001 WW2 3
110002 WW2 1
110004 KoreanWar 4
110005 KoreanWar 3
110009 VietnamWar 7
110010 VietnamWar 5
Должно ли это быть 'data = B' во втором случае? Еще одно уточнение. Если бы было 4 столбца факторов (вместо 3, как в этом случае), я бы подал 3 из этих столбцов 'as.matrix' и т. Д.? –
@ user1883050 - это не имеет никакого значения - 'Depression_Score' одинаково как в' A', так и 'B' в ваших примерах. Да, я считаю, что вам нужно всегда использовать столбцы «n-1», так как вы можете делать сравнения «n-1» без удвоения. См. Столбец 'Df' и обратите внимание, что он всегда' 2' в результатах anova. – thelatemail