2013-03-08 2 views
0

Я работаю над распределением данных, которое имеет следующие точки зрения.Как распространять точки в boxplot в R?

< вход -read.table ("входной_файл", заголовок = TRUE, Сентябрь = "\ т")

таблица (вход)

0.786333  1 1.04453 1.06159 1.33277 1.53607 2.25893 
    49  938  1  1  36  16  166 

если я участок коробка участок для него, я получить одиночную линию для наименьшей базы данных, самой высокой точки отсчета и медианной.

boxplot (вход)

enter image description here

Есть ли способ, чтобы распределить пункты по нормализации, так что может быть лучше boxplot с четкой границей для низкой опорной точки, самой высокой точки привязки и медианы?

+0

Boxplot является complety неправильный подход с учетом ваших данных, которые имеют две четкие пики и только несколько других значений. Что вы действительно хотите показать своей фигурой? –

+0

Я планирую сделать http://stackoverflow.com/questions/13927473/how-to-plot-bar-plot-in-parallel-to-horizontal-to-box-plot-with-fraction-of-area – Manish

+0

Ну, как вы можете видеть из вашего рисунка, ваши данные не подходят для такого сюжета. –

ответ

2

Вы явно имеют biomodal распределение, я не думаю, что boxplot является полезным резюме здесь

Плотность участка является более полезным

plot(density(zz)) 

enter image description here

Вы также могли бы рассмотреть возможность скрипичный сюжет, который представляет собой смесь между графиком плотности ядра и boxplot.

Использование vioplot пакета

library(vioplot) 
violplot(zz) 
+1

Но мне нужно классифицировать их в категории, так как у нас есть 25%, 50% и 25% для boxplot. Могу ли я сделать то же самое с плотностью? – Manish

+2

@ user15662 у вас есть только 7 уникальных значений из 1207 - используйте их для создания значимых категорий. При этом график плотности ясно показывает, что вы можете использовать обрезание около 1,5 для двух категорий. – mnel

+1

На самом деле мне нужно построить один барплот параллельно коробке с чем-то (высоким, средним, низким). zz <-rnorm (1: 1000) boxplot (zz), где ширина поля (50%) средняя, ​​а с другой стороны - низкая (25%) и высокая (25%). Я не думаю, что смогу сделать это с помощью vioplot. – Manish