У меня есть временная серия значений осадков в файле csv. Я построил гистограмму данных. Гистограмма сдвинута влево. Я хотел преобразовать значения так, чтобы они имели нормальное распределение. Я использовал преобразование Йео-Джонсона, доступное в R. Преобразованные значения: here.Оценка лямбда для преобразования Yeo и Johnson
Мой вопрос:
В вышеприведенной трансформации, я использовал тест значение 0,5 для лямбда, который работает отлично. Есть ли возможность определить оптимальное значение лямбда на основе временных рядов? Буду признателен за любые предложения.
До сих пор, вот код:
library(car)
dat <- scan("Zamboanga.csv")
hist(dat)
trans <- yjPower(dat,0.5,jacobian.adjusted=TRUE)
hist(trans)
Я смущен относительно того, какая модель (объект в команде Box-Cox) применима для моих данных. На данный момент я не подгоняю какую-либо модель данных. – Lyndz
Наиболее очевидным было бы установить тривиальную линейную модель: 'your_model <- lm (dat ~ 1)'. –
@ Lyndz Да, я бы посоветовал Ben Bolker об этом –