Как вы выполняете проверку качества связи для обобщенной линейной модели в R?

Я работаю над установкой обобщенной линейной модели в R (с использованием glm()) для некоторых данных, которая имеет два предиктора в полном факториале. Я уверен, что семейство gamma - правильное распределение ошибок для использования, но не уверен в том, какую функцию ссылок использовать, поэтому я бы хотел протестировать все возможные функции ссылок друг против друга. Конечно, я могу сделать это вручную, создав отдельную модель для каждой функции связи, а затем сравните отклонения, но я полагаю, что есть функция R, которая сделает это и скомпилирует результаты. Я искал в CRAN, SO, Cross-validated и в Интернете - ближайшая функция, которую я нашел, была clm2, но я не верю, что хочу создать кумулятивную модель ссылок - на основе моего понимания того, что такое clm's.Как вы выполняете проверку качества связи для обобщенной линейной модели в R?

Моя текущая модель выглядит следующим образом:

CO2_med_glm_alf_gamma <- glm(flux_median_mod_CO2~PercentH2OGrav+ 
          I(PercentH2OGrav^2)+Min_Dist+ 
          I(Min_Dist^2)+PercentH2OGrav*Min_Dist, 
        data = NC_alf_DF, 
        family=Gamma(link="inverse"))

Как закодировать эту модель в функцию R, которая будет делать такой тест «добро-оф-линии»?

(Что касается статистической достоверности такого теста, то this discussion, а также обсуждение со статистикой post-doc заставляет меня полагать, что это действительно для сравнения AIC или отклонений между обобщенными линейными моделями, которые идентичны, за исключением имеющие разные функции связи)

источник

2015-04-20 DirtStats

На самом деле нецелесообразно сравнивать отклонения от не-вложенных моделей. Я думаю, что ваша проблема статистическая и принадлежит [stats.se]. Как только вы точно знаете, что такое правильный способ сравнения моделей, но не уверены, как это сделать в R, тогда это скорее вопрос переполнения стека.Если это всего лишь вопрос программирования, добавьте пример [воспроизводимый пример] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) с образцами входных данных и желаемый выпуск. – MrFlick

Первоначально я не был уверен, что сравнение (две идентичные модели с идентичными данными, только функция ссылки меняется) была статистически достоверной, но [это обсуждение] (http://stats.stackexchange.com/questions/46833/problem-with -comping-glm-models-having-a-different-link-function) поддерживает идею о том, что она действительна. – DirtStats

Я отредактировал вопрос, чтобы попытаться вывести мой вопрос из возможности быть вне темы, надеюсь, мои правки помогли. Я рассматриваю этот вопрос так же, как [этот обсуждаемый «рекомендательный» вопрос] (http://meta.stackoverflow.com/questions/254393/what-exactly-is-a-commommation-question), который, я считаю, был отредактирован и затем решил стать дубликатом. В моих исправлениях я попытался дать понять, что это, в конечном счете, вопрос о кодировании, в котором может быть полезен дополнительный фон в доступной функции. – DirtStats

Это не «все возможные ссылки», это тестирование по определенному классу ссылок, но Pregibon проводит тест на добротность, который реализован в пакете LDdiag. Это не на CRAN, но вы можете установить его из archives через

devtools::install_version("LDdiag","0.1")

Данный пример (не так интересно) является

quine$Days <- ifelse(quine$Days==0, 1, quine$Days) 
ex <- glm(Days ~ ., family = Gamma(link="log"), data = quine) 
pregibon(ex)

pregibon семейство функций звена осуществляется в glmx package. Как отметил Ахим Зелейс в комментариях, пакет предоставляет различные параметрические функции ссылок и поддерживает общую оценку и вывод, основанный на таких параметрических ссылках (или, более типично, параметрических семействах). Чтобы увидеть обработанный пример, как это можно использовать для различных оценок качества, см. example("WECO", package = "glmx"). Это повторяет анализ из двух работ Коэнкера и Юна (см. Ниже).

This example также может быть полезен.

Koenker R (2006). «Параметрические ссылки для двоичного ответа». R News, 6(4), 32--34; link to page with supplementary materials.
Koenker R, Yoon J (2009). «Параметрические ссылки для моделей двоичного выбора: рыбацкий-байесовский коллоквиум». Journal of Econometrics, 152, 120--130; PDF.

источник

2015-04-21 03:05:43

Чтобы добавить дополнительную информацию к комментарию Бена о 'glmx'. Пакет предоставляет различные параметрические функции ссылок и поддерживает общую оценку и вывод, основанный на таких параметрических ссылках (или, в более общем смысле, параметрических семействах). Чтобы увидеть обработанный пример, как это можно использовать для различных оценок качества, см. «Пример (« WECO », package =« glmx »)». Это повторяет анализ из двух статей Роджера Коэнкера (и соавтора) в «R News» и «Journal of Econometrics» соответственно. –

Благодарим вас обоих за эти предложения и ресурсы. Я проверю «glmx» и примеры. – DirtStats

я узнал, что драги функцию (MuMIn package) может быть использован для выполнения благости-оф-линии испытаний на GLMS, пленки и т.д. В более общем плане это функция выбора модели, но обеспечивает хорошую сделку настройки. В этом случае вы можете использовать различный вариант для сравнения моделей, соответствующих различным функциям связи. См. Пример Beetle, в котором они работают для деталей.

источник

2015-09-26 00:41:47 DirtStats

Как вы выполняете проверку качества связи для обобщенной линейной модели в R?

ответ

Смежные вопросы