2015-01-18 3 views
0

Я использую R Studio версии 0.98.1062 на Mac (OS X Yosemite 10.10.1). Я хочу, чтобы создать таблицу (предпочтительно, чтобы передать его, чтобы преуспеть или в формате PDF) из данных для нескольких сводных статистических данных, характеризующих долю женщин, обучающихся в различных дисциплинах:Создать таблицу из нескольких сводных статистических данных

резюме (сельское хозяйство $ X2009.PROP)

Мин. 1-й кв. Средний средний 3-й Ку. Максимум.

0,0000 0,3333 0,4881 0,4689 0,6026 1,0000

резюме (экономика $ X2009.PROP)

Мин. 1-й кв. Средний средний 3-й Ку. Максимум.

0,0000 0,2555 0,3161 0,3218 0,3887 0,6923 29

резюме (образование $ X2009.PROP) Акрополя

Мин. 1-й кв. Средний средний 3-й Ку. Максимум.

0,0000 0,2967 0,5000 0,5490 0,8571 1,0000 46

резюме (закон $ X2009.PROP) Акрополя

Мин. 1-й кв. Средний средний 3-й Ку. Максимум. Акрополя

0,0000 0,4250 0,5695 0,5324 0,6593 1,0000 28

В основном я хочу, чтобы таблица выглядит следующим образом:

Дисциплина/SS Min.1st Qu. Средний средний 3-й Ку. Максимум.

сельского хозяйства 0,0000 0,3333 0,4881 0,4689 0,6026 1,0000

экономика 0.0000 0,2555 0,3161 0,3218 0,6923 29

образование ....

закон ....

Будете ли вы так добры посоветуйте мне, как написать код для этого?

+0

Это опасно близко к «CODE PLZ» (особенно учитывая использование стиля чата «u»/«i» для «вас» и «я»), на который здесь не смотрят wll. – Livius

ответ

0

Существует два основных способа сделать это: объединить данные заранее или после этого.

Некоторые примеры данных, случайным образом взяты из равномерного распределения:

x <- runif(100) 
y <- runif(100) 

Объединить и обобщать

Если вы хотите заранее объединить данные, то вам необходимо использовать data.frame():

d <- data.frame(variable1=x,variable2=y) 
summary(d) 

, который даст вам выход:

variable1   variable2  
Min. :0.03026 Min. :0.01173 
1st Qu.:0.29410 1st Qu.:0.24968 
Median :0.48517 Median :0.47524 
Mean :0.51137 Mean :0.47865 
3rd Qu.:0.71354 3rd Qu.:0.69512 
Max. :0.98465 Max. :0.980 

(Обратите внимание, что вы также можете сделать data.frame() без указания имен столбцов, и в этом случае имена переменных будут использоваться в качестве имен столбцов.) Это может занять некоторую работу, чтобы пресекать его в желаемом формате, но это вероятно, будет лучшим форматом для последующих анализов в R. (d теперь находится в «широком формате», из которого нетрудно перевести в стандартный «длинный формат» через пакеты, такие как reshape или его преемник reshape2).

В качестве боковой панели вы можете использовать cbind() (привязка столбцов) вместо data.frame, и в этом случае у вас теперь будет матрица вместо фрейма данных. Для чисто числовых значений и простой сводной статистики это не имеет большого значения. Я упоминаю это только как параллельное rbind() (см. Ниже) - обычно наблюдения хранятся в кадрах данных вместо простых матриц (т. Е. Семантически более богатое хранилище).

Обобщить и объединение

Если вы хотите, чтобы объединить резюме, вы можете использовать rbind() (строку привязки), чтобы объединить резюме.

xs <- summary(x) 
ys <- summary(y) 

s <- rbind(xs,ys) 

print(s) 

, который даст вам такой вывод:

 Min. 1st Qu. Median Mean 3rd Qu. Max. 
xs 0.03026 0.2941 0.4852 0.5114 0.7135 0.9847 
ys 0.01173 0.2497 0.4752 0.4787 0.6951 0.9803 

Оттуда, он должен быть достаточно легким, чтобы использовать встроенные функции для написания табличных данных в файл, см ?write.table. Excel может открывать как разделенные табуляцией, так и CSV-файлы. Если вы хотите перейти непосредственно в PDF, вам нужно взглянуть на экспорт в LaTeX через пакет xtable и/или использование RMarkdown для создания отчета. Печать таблиц с этими системами хорошо документирована в другом месте в Интернете.