Во-первых, манипулирование данными было самой сложной задачей, чтобы узнать, что происходит от SPSS/SAS до R. Я лично обнаружил, что получение данных в правильной форме для анализа обычно намного сложнее, чем анализ сам. Во-вторых, истинное понимание того, как бороться с категориальными ценностями посредством использования факторов. Наконец, сводные статистические данные и описания иногда могут быть сложными для получения формата, который можно передать в PPT или Excel, которые являются (моими) клиентами обычно ожидаемыми/требуемыми для отчетности.
Я бы сосредоточиться на:
1 Манипуляция данными
Понимание структуры данных. Импорт Экспорт. Затем углубленное обучение использованию пакетов, таких как plyer, измените форму с особым упором на то, как эффективно использовать литье с формулами и расплавлять с помощью идентификаторов. Как применять численные функции в data.frame с помощью ddply.
2 Факторинг данных
В целом, объяснение работы с перекодирование с, epicalc или определяемой пользователем функции. Кроме того, объяснение значимости факторов, уровни и этикетки
3 Descriptives
Потратьте несколько минут, чтобы ввести xtabs(), таблицу(), prop.table() с помощью бросания() из RESHAPE создать столбчатые таблицы данных, которые более эффективно экспортируются в Excel.
Графика необязательна, если вы хорошо справились с вышеуказанным, они должны иметь возможность получать данные, необходимые для создания графиков, в любом удобном для них программном обеспечении.
4 Графика
Если вы сделали хорошую работу преподавания манипулирование данными, получение данных в форме, необходимой для построения графиков должно быть довольно простым (или, по крайней мере, воспроизводимым) в этой точке. ggplot2 сложный и требует, чтобы день был одним из них для игры. Но можно дать краткий обзор. В качестве альтернативы базовая графика проста для понимания, и помощь намного более понятна в отношении того, что происходит и как работает синтаксис.
Примечание: Я не учитывал статистический анализ. Однако обзор lm() и, возможно, anova() или cor() был бы полезен в качестве начальной точки. Но это должно быть объяснено одновременно с data.mipulation.
Я бы отметил это как * Community Wiki * –
@Gaby: может быть, вы правы. Готово. –