Я использую statsmodels для логистического регрессионного анализа в питона т.д .:Есть ли способ реализовать весы образца в логистической регрессии python?
import statsmodels.api as sm
import numpy as np
x = arange(0,1,0.01)
y = np.random.rand(100)
y[y<=x] = 1
y[y!=1] = 0
x = sm.add_constant(x)
lr = sm.Logit(y,x)
result = lr.fit().summary()
Но я хочу, чтобы определить различные взвешиваний для моих наблюдений. Я объединяю 4 набора данных разных размеров и хочу весить анализ таким образом, чтобы наблюдения из самого большого набора данных не доминировали над моделью.
Поблагодарили бы за любые предложения! Спасибо.
statsmodels в настоящее время поддерживает весы только для модели линейной регрессии. – user333700
GLM с семейным биномиальным позволяет: 'Биномиальные семейные модели принимают 2-й массив с двумя столбцами. Если это предусмотрено, каждое наблюдение ожидается [успех, сбой]. Возможно, это будет возможно использовать для определения весов образца, но я никогда не пробовал. – user333700