2015-10-29 2 views
-1

я следующий набор данных:Нормализованная гистограмма в MATLAB некорректна?

X=[4.692 
    6.328 
    4.677 
    6.836 
    5.032 
    5.269 
    5.732 
    5.083 
    4.772 
    4.659 
    4.564 
    5.627 
    4.959 
    4.631 
    6.407 
    4.747 
    4.920 
    4.771 
    5.308 
    5.200 
    5.242 
    4.738 
    4.758 
    4.725 
    4.808 
    4.618 
    4.638 
    7.829 
    7.702 
    4.659]; % Sample set 

Я приспособил распределение Парето к этому с помощью метода максимального правдоподобия, и я получаем следующий график:

enter image description here

Где следующий бит код - это то, что рисует гистограмму:

[N,edges,bin] = histcounts(X,'BinMethod','auto'); 
bin_middles=mean([edges(1:end-1);edges(2:end)]); 
f_X_sample=N/trapz(bin_middles,N); 
bar(bin_middles,f_X_sample,1);; 

Я делаю это правильно? Я проверил 100 раз, и распределение Парето действительно оптимально, но оно кажется ужасно отличным от гистограммы. Есть ли ошибка, которая может быть причиной этого? Спасибо!

+2

Попробуйте вручную увеличить количество ящиков, вместо того, чтобы использовать флаг 'auto' – tashuhka

+0

Хорошо, попробуем это, когда я получу компьютер. Хотя ваше предложение не «искусственно», хотя? –

ответ

1

Я согласен с комментарием @ tashuhka, что вам нужно подумать о том, как вы клонируете свои данные.

Представьте крайний случай, когда вы объединяете все вместе в один ящик, а затем пытаетесь подогнать эту единицу к распределению. Ваш PDF-файл не будет похож на ваш квадрат. Разделите на два бункера, и теперь фитинг по-прежнему сосет, но по крайней мере один бар (возможно) немного больше другого и т. Д. И т. Д. И т. Д. С другой стороны, каждая точка данных имеет свой собственный бар, а гистограмма ничего, кроме случайного леса баров с одним счетом.

Существует множество различных стратегий для choosing an "optimal" bin size, которые минимизируют количество ящиков, но максимизируют представление базового PDF-файла.

Наконец, обратите внимание, что здесь у вас всего 30 баллов, поэтому может возникнуть другая проблема: вы просто не собрали достаточное количество данных, чтобы на самом деле скрыть базовый PDF-файл.

+0

Увеличилось количество мусорных банок, спасибо! –

 Смежные вопросы

  • Нет связанных вопросов^_^