Я пытаюсь понять следующий случай:Инициализация Xgboost DMatrix уменьшить особенности номер
, когда я создаю новый
xgbost
DMatrixxgX = xgb.DMatrix(X, label=Y, missing=np.nan)
Что магия здесь делает? Любой совет будет замечательным!
Я пытаюсь понять следующий случай:Инициализация Xgboost DMatrix уменьшить особенности номер
, когда я создаю новый xgbost
DMatrix
xgX = xgb.DMatrix(X, label=Y, missing=np.nan)
Что магия здесь делает? Любой совет будет замечательным!
Посмотрите на xgboost issue #1223
Там, khotilov делает комментарий:
Проблема с КСО, что, когда у вас есть полностью разреженных столбцов в конце концов, вы не можете понять, что они существуют просто глядя на индексы и указатели CSR.
Следствием этого является то, что функция, которая создает DMatrix
от X
, XGDMatrixCreateFromCSR
, не учитывает пустые столбцов в конце, что в вашем случае составляет 9 столбцов. Вы можете проверить это в своем случае и определить, действительно ли у вас есть 64 функции в X
.
Есть ли способ переместить мой вопрос в 'DataScience stack' http://datascience.stackexchange.com/? – SpanishBoy