Машинное обучение - вычисление важности «значения» в переменной

-1

Я анализирую медицинский набор данных, содержащий 15 переменных и 1,5 миллиона точек данных. Я хотел бы предсказать госпитализацию и, что более важно, какой тип лекарства может быть ответственным. Переменная медицины имеет около 700 видов лекарств. Кто-нибудь знает, как рассчитать важность «значения» (типа препарата в этом случае) в переменной для повышения?Мне нужно знать, лучше ли «лекарство А» для прогнозирования, чем «лекарство B», как в переменной, называемой «лекарством». Модель логистической регрессии может предоставлять такую информацию с точки зрения значений p для каждого препарата, но я бы хотел использовать более сложный метод. Из-за этого вы можете создать двоичную переменную для каждого типа лекарств, но это дает 700 дополнительных переменных и, похоже, не работает очень хорошо. В настоящее время я использую r. Надеюсь, вы поможете мне решить эту проблему. Заранее спасибо! С уважением ПитерМашинное обучение - вычисление важности «значения» в переменной

источник

2015-07-01 Peter Hansen

Я попытался сузить его на примере и повысить. –

см. varImp() в библиотеке caret, которая поддерживает все алгоритмы ML, на которые вы ссылались.

источник

2015-07-01 12:40:12 C8H10N4O2

Сделал работу, спасибо! –

Машинное обучение - вычисление важности «значения» в переменной

ответ

Смежные вопросы