1

Для оценки плотности ядра, как указано ниже, используются для оценки функции плотности вероятности.путаница по оценке плотности ядра 2 измерения в R

Моя путаница о том, что именно делает kde2d делать? Означает ли она совместную вероятность распределения вероятности распределения двух случайных величин - f (a, b) в нижнем примере? И что означает цвет?

Вот пример кода, на который я имею в виду.

b<-log10(rgamma(1000,6,3)) 
a<-log10((rweibull(1000,8,2))) 
density<-kde2d(a,b,n=100) 
filled.contour(density,color.palette=colorRampPalette(c('white','blue','yellow','red','darkred'))) 

спасибо заранее, Лин

+1

'Он оценивает функцию плотности распределения совместного распределения двух случайных величин?' - да. Поскольку теперь у вас есть три оси: «rv1», «rv2» и «оценочная вероятность», вам нужно покрасить один из них, чтобы отображать их на графике «2d».Таким образом, вы можете цветовым кодом вероятности и/или рисовать контурные линии с равной вероятностью. См. Wikipedia для получения дополнительной информации о контурных линиях: https://en.wikipedia.org/wiki/Contour_line – cel

+1

Посмотрите на исходный код 'kde2d'. Часто бывает легко устранить 2d kde, как только вы узнаете, что 2d нормальная оценка плотности ядра является продуктом двух 1d нормальных kdes. – shayaa

+0

@cel, спасибо и проголосуйте, поэтому ** darkred ** color означает более высокую вероятность для '(x, y)', чем ** white **, правильно? Означает ли это также и в области ** darkred **, случайная величина 'x' и' y' имеет более высокую корреляцию, чем ** белый **? –

ответ

5

Что такое оценка плотности ядра? По существу он соответствует небольшой кривой нормальной плотности по каждой точке (центру нормальной плотности, являющейся той точкой) данных, а затем суммирует все небольшие нормальные плотности с оценкой плотности ядра.

Для иллюстрации я добавлю изображение 1-мерной оценки плотности ядра от one of your links. enter image description here

До сих пор мы быстро обсудили, что такое 1D оценка плотности ядра.

Как насчет двухмерных плотностей ядра?

# library(MASS) 
b <- log10(rgamma(1000,6,3)) 
a <- log10((rweibull(1000,8,2))) 
# a and b contain 1000 values each. 

density <- kde2d(a,b,n=100) 

Функция создает сетку из min(a) к max(a) и min(b) к max(b). Вместо того, чтобы устанавливать крошечную нормальную плотность 1D по каждому значению в a или b, kde2d теперь подходит для крошечной нормальной нормальной плотности по всем точкам сетки. Так же, как и в плотности ядра размером в один размер, он затем суммирует все значения плотности.

Что означают цвета? Как @cel указал в комментариях: предполагаемая вероятность зависит от двух переменных, поэтому мы имеем теперь три оси (, b и estimated probability). Один из способов визуализации 3-х осей - использование изо-вероятностных контуров . Это звучит фантастически, но в основном это то же самое, что и изображения высокого/низкого давления, которые мы знаем из прогноза погоды.

Вы используете

filled.contour(density,color.palette = colorRampPalette(c('white', 'blue', 
                  'yellow','red', 
                  'darkred'))))) 

Так от низкого до высокого, сюжет будет окрашен white, blue, yellow, red и в конечном итоге darkred для самых высоких значений расчетной вероятности. Это приводит к следующему графику:

+0

Спасибо, Кен, проголосуйте. Поэтому в моем примере кода ** darkred ** color означает более высокую вероятность для '(x, y)', чем ** white **, правильно? Означает ли это также и в области ** darkred **, случайная величина 'x' и' y' имеет более высокую корреляцию, чем ** белый **? –

+1

@LinMa Я редактировал сообщение. Цвета ** не ** представляют собой корреляцию, они представляют собой оценку предполагаемой плотности соединения. Поскольку 'kde2d' не содержит ковариационную матрицу для моделирования отношения между' a' и 'b', я уверен, что она принимает независимость от значений в' a' и 'b', то есть' a' и 'b' являются коррелированы. –

+0

Спасибо Кен, проголосуйте за ответ. Я думаю, что для более глубокого цвета (темный в вашем примере) это означает, что более высокая плотность - что означает, что 'a' и' b', скорее всего, происходят в такой темной области, правильно? Если это правильно, почему мы не можем заключить, что 'a' и' b' имеют более высокую корреляцию в темной области? –