2010-09-26 3 views
6

Обсуждение в this question является прямой причиной, по которой я задаю этот вопрос. Более общая причина заключается в том, что мне часто приходится объяснять использование R людям, знакомым только с SPSS. Я знаю большинство основ SPSS, поскольку мы все еще используем его в статистике базового курса. Но поскольку я больше человек из R, трудно понять, как пользователи SPSS сталкиваются с первой встречей с R.Как вы пережили переход от SPSS к R?

Я знаю, что есть книга R for SAS and SPSS users и которая содержит уже некоторую информацию. Тем не менее, я хотел бы знать, какие более сложные части при переключении с SPSS на R.

Или другими словами: если вам нужно будет объяснить R в один день пользователям SPSS, какие темы вы бы сосредоточили на ? Это не гипотетический вопрос кстати (да, я знаю, это не потому, что за него платят, что это всегда имеет смысл ...).

+0

Я бы отметил это как * Community Wiki * –

+0

@Gaby: может быть, вы правы. Готово. –

ответ

10

Во-первых, манипулирование данными было самой сложной задачей, чтобы узнать, что происходит от SPSS/SAS до R. Я лично обнаружил, что получение данных в правильной форме для анализа обычно намного сложнее, чем анализ сам. Во-вторых, истинное понимание того, как бороться с категориальными ценностями посредством использования факторов. Наконец, сводные статистические данные и описания иногда могут быть сложными для получения формата, который можно передать в PPT или Excel, которые являются (моими) клиентами обычно ожидаемыми/требуемыми для отчетности.

Я бы сосредоточиться на:

1 Манипуляция данными

Понимание структуры данных. Импорт Экспорт. Затем углубленное обучение использованию пакетов, таких как plyer, измените форму с особым упором на то, как эффективно использовать литье с формулами и расплавлять с помощью идентификаторов. Как применять численные функции в data.frame с помощью ddply.

2 Факторинг данных

В целом, объяснение работы с перекодирование с, epicalc или определяемой пользователем функции. Кроме того, объяснение значимости факторов, уровни и этикетки

3 Descriptives

Потратьте несколько минут, чтобы ввести xtabs(), таблицу(), prop.table() с помощью бросания() из RESHAPE создать столбчатые таблицы данных, которые более эффективно экспортируются в Excel.

Графика необязательна, если вы хорошо справились с вышеуказанным, они должны иметь возможность получать данные, необходимые для создания графиков, в любом удобном для них программном обеспечении.

4 Графика

Если вы сделали хорошую работу преподавания манипулирование данными, получение данных в форме, необходимой для построения графиков должно быть довольно простым (или, по крайней мере, воспроизводимым) в этой точке. ggplot2 сложный и требует, чтобы день был одним из них для игры. Но можно дать краткий обзор. В качестве альтернативы базовая графика проста для понимания, и помощь намного более понятна в отношении того, что происходит и как работает синтаксис.

Примечание: Я не учитывал статистический анализ. Однако обзор lm() и, возможно, anova() или cor() был бы полезен в качестве начальной точки. Но это должно быть объяснено одновременно с data.mipulation.

+0

+1 и прием. Вероятно, это то, что я сделаю. Спасибо за указатель на данные факторинга. Я воспринимаю это как нечто само собой разумеющееся, что люди понимают, о чем я говорю, когда я использую «факторы», но на самом деле большинство нет. На стороне примечания: как бы вы сравнили факторы с метками/... в SPSS? Какие-нибудь советы по этому поводу? –

+1

Мой совет по сравнению. Я этого не сделаю. Они концептуально настолько различны, что попытка связать их вместе, скорее всего, вызовет путаницу, чем какая-либо польза. –

+0

@ Joris: Просто скажите людям, что «факторы» представляют собой категориальные переменные. –

3

Совсем недавно у меня был студент, который несколько разбирался в статистике и заранее сделал анализ в SPSS.Затем я показал ему, как делать то же самое в Р. Мы прошли через код и замышляли, объясняли и обсуждали каждую строку. Он понял, насколько легко и удобно это делать в R. Таким образом, сообщество R выросло на 1. :)

3

Самая большая проблема, с которой исследователи, с которыми я столкнулся, - это отсутствие графического интерфейса «точка-и-клик» , Несмотря на то, что в сообществе R существует ряд усилий, ни один из них не достиг уровня простоты использования/мощности, который имеет SPSS.

Поскольку кодирование является второй натурой для пользователей R, иногда мы забываем, что большинство пользователей статистического программного обеспечения не могут программировать (и избегать его, как чума), даже если они могут иметь сильное практическое понимание статистики.

Если бы у меня был один день, чтобы привести пользователя SPSS в R, я бы начал их на Deducer. Deducer - это проект R GUI (заметка о самообновлении: я автор), который должен чувствовать себя очень знакомым для пользователя из SPSS. Поскольку они нуждаются в более продвинутых функциях, они, естественно, перейдут в командную строку для удовлетворения своих потребностей.

+1

+1 за усилие, которое вы положили в Deducer –

+0

Deducer даже делает такие вещи, как вывод кода, который он использовал для выполнения действия (в некоторых случаях), которое может обеспечить будущее понимание фактического кодирования. –

+2

Я отказываюсь смотреть на любой выход SPSS без команд, встроенных в выход. Это значение по умолчанию вер. 16, но прежде, чем вам пришлось идти в предпочтения. –

6

Хотя я «написал книгу» о миграции R на SPSS, которая была нацелена на программистов и большинство пользователей SPSS, которые, как я знаю, предпочитают вместо этого «указывать и нажимать». Графический пользовательский интерфейс, такой как Deducer (или R Commander), может помочь им чувствовать себя как дома, обучая их тому, как работает программный код R, если они хотят его увидеть. Plot Builder Deducer также неплохо справляется с созданием сложных графиков, и если вы хотите узнать код ggplot2, он также покажет вам это. Ян отлично справился с этим!

Однако, хотя графический интерфейс пользователя SPSS охватывает 98% того, что может сделать SPSS, Deducer покрывает, пожалуй, 1% от того, что R может сделать. Вероятно, это все равно 75% того, что вам нужен средний исследователь, но R настолько широк, что для того, чтобы максимально использовать его, людям нужно научиться программировать. Бесплатная версия моей книги «R для пользователей SAS и SPSS» составляет всего 80 страниц. & охватывает области программирования, которые, я думаю, скорее всего путают начинающих. Он находится в http://r4stats.com.

+1

+1 для ссылки –

+0

Большое спасибо за ваш ввод и ссылку. –

+0

Спасибо, что написал эту книгу. Исходя из SAS, я знал имя SAS для того, что я хотел сделать, и большая часть моей проблемы пыталась выяснить, что R «называется» той же командой. У меня была такая же проблема с SPSS и Stata. – Michelle

 Смежные вопросы

  • Нет связанных вопросов^_^