1

У меня есть данные размерности 50x100000. (100000 функций, каждая из которых имеет размер 50).gaussian смс модель вероятность matlab

Я хотел бы поместить гауссовую смесь, используя эти данные. Я использовал следующий код.

   obj = gmdistribution.fit(X',3); 

Что мне нужно, когда я даю новые данные Y, я должен быть в состоянии получить вероятность вероятности $ P (Y | \ Theta) $, где $ \ Theta $ являются параметры модели смеси gaussing.

Я использовал следующий код, чтобы получить значения вероятности.

   P = pdf(obj,X'); 

Но я получаю очень низкие значения, все около 0. Что это происходит? Как я могу получить подходящие значения вероятности?

+0

Когда вы говорите, что ваши данные имеют размер 50x100000, вы имеете в виду, что у вас есть 100000 векторов длины 50 и что вы ищете смесь многомерных нормальных распределений, то есть каждое распределение в смеси является многомерным нормальное распределение для вектора длины 50? – Stochastically

+0

да это правильно. – user570593

ответ

4

В одном измерении максимальное значение pdf распределения Гаусса составляет 1/sqrt (2 * PI). Таким образом, в 50 измерениях максимальное значение будет 1/(sqrt (2 * PI)^50), что составляет около 1E-20. Таким образом, значения pdf будут иметь этот порядок величины или меньше.

+0

Благодарим вас за ответ. что здесь PI? Я планирую построить классификатор, чтобы отклонять выбросы от значений вероятности. Я изучаю этот дистрибутив на основе одного класса данных. В моем случае, как я могу построить классификатор на основе значений вероятности? – user570593

+0

PI is 3.14159 и т. Д. Sqrt является функцией квадратного корня. Я думаю, что я, вероятно, ответил на ваш первоначальный вопрос, поэтому, если вы согласны, вы можете подумать о том, чтобы этот ответ был полезен и/или принят. Если вы разместите еще один вопрос, связанный с тем, как создать классификатор, я обязательно посмотрю и отправлю ответ на ваш новый вопрос, если смогу. FYI, я всегда смотрю на все вопросы, имеющие тег «вероятность». – Stochastically

+0

Благодарим вас за ответ. Я отправил новый вопрос по адресу http://stackoverflow.com/questions/17113387/outlier-detection-based-on-gaussian-mixture-model, который ищет ваш ответ. :-) – user570593

 Смежные вопросы

  • Нет связанных вопросов^_^