2016-02-10 4 views
0

Я новичок как для стана, так и для машинного обучения. Теперь я хотел бы реализовать модель pmf. Вот часть моего кода:Не удалось реализовать модель pmf в pystan

pmf_cod=""" 
data { 

int<lower=0> K; //number of factors 
int<lower=0> N; //number of user 
int<lower=0> M; //number of item 
int<lower=0> D; //number of observation 
int<lower=0> D_new; //number of pridictor 
int<lower=0, upper=N> ii[D]; //item 
int<lower=0, upper=M> jj[D]; //user 
int<lower=0, upper=N> ii_new[D_new]; // item 
int<lower=0, upper=N> jj_new[D_new]; // user 
real<lower=0, upper=5> r[D]; //rating 
real<lower=0, upper=5> r_new[D_new]; //pridict rating 

} 

parameters { 
row_vector[K] i[M]; // item profile 
row_vector[K] u[N]; // user profile 
real<lower=0> alpha; 
real<lower=0> alpha_i; 
real<lower=0> alpha_u; 

} 

transformed parameters { 
matrix[N,M] I; // indicator variable 
I <- rep_matrix(0, N, M); 
for (d in 1:D){ 
    I[ii[d]][jj[d]] <- 1; 
} 
} 

model { 
for (d in 1:D){ 
    r[d] ~ normal(sum(u[jj[d]]' * i[ii[d]]), 1/alpha); 
} 

for (n in 1: N){ 
    u[n] ~ normal(0,(1/alpha_u) * I); 
} 
for (m in 1:M){ 
    i[m] ~ normal(0,(1/alpha_i) * I); 
} 
} 
""" 

Но я получил ошибку: No matches for: row vector ~ normal(int, matrix) в этой строке кода:

for (n in 1: N){ 
    u[n] ~ normal(0,(1/alpha_u) * I); 
} 

Где I единичная матрица. Таким образом, произведение (1/alpha_u) * I также является матрицей. Но stan просто принимает векторную или реальную ценность как дисперсию. Интересно, как преобразовать его в вектор или одно значение.

Спасибо заранее!

+0

Возможный дубликат [Умножить два вектора 1 \ * k, но не получено Нет совпадений для: real ~ normal (матрица, реальная) ошибка в pystan] (http://stackoverflow.com/questions/35296429/multiply-two-1k-vectors-but-got-no-matches-for-real-normalmatrix-real-err) – syclik

ответ

1

Похоже, если вы собираетесь использовать в многомерный нормальную плотность, в этом случае функция, которую вы ищете multi_normal, а не normal. Однако функция multi_normal нуждается средний вектор в качестве первого аргумента, так что вы должны были бы назвать его как u[n] ~ multi_normal(rep_vector(0, K), (1/alpha_u) * I); Кроме того, нет необходимости создавать I в transformed parameters блоке, когда он должен быть создан в transformed data блоке.

Все сказанное, вы никогда не должны использовать плотность multi_normal в Стэне, когда матрица дисперсии-ковариации является диагональной. В этом предположении многомерные нормальные коэффициенты распределения в произведение одномерных нормальных распределений, поэтому вам было бы лучше делать u[n] ~ normal(0, 1/alpha_u);