2013-05-24 4 views
1

Я использую алгоритм AdaBoost M1 в Weka Experiment среде с установкой по умолчанию:AdaBoost ВЕК Правда положительного против ложного положительного вопроса признания

  1. прогоны (1-10) -> 10 работает, чтобы обеспечить более статистически значимые результаты
  2. Случайного Split Результат Производитель
  3. Я использую поезд проценты разделить обучение на основе данных оценки

Теперь проблема с Средневзвешенным ТПОМ и результатами FP. я получаю это:

TP: 0,8
FP: 0.47

Но, насколько мне известно, если скорость ТР 0,8, скорость FP должна быть выше, чем 0,2? Я предполагаю, что это должно сделать что-то с 10 прогонами, но в любом случае, если из этого прогона взяты средние значения, снова этот показатель FP должен быть намного ниже?

Извините, если это слишком простой вопрос, но из моей логики это похоже на ошибку в инструментах Weka, или я не прав? Благодаря

EDIT:

Для того, чтобы избежать задавать новый вопрос, и потому, что это связано с той же проблемой, может кто-нибудь ответить на какие Средневзвешенные значения отображаются в Weka?

Я включил пример Атиллы ниже: можно видеть, что средневзвешенные значения не являются средними значениями, например. AVG (0,933,0,422)! = 0,77 и т. Д.

Может ли кто-нибудь ответить на эти значения?

=== Подробное Точность по классам ===

  TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class 
     0.933 0.578 0.776  0.933 0.847  0.429 0.844  0.917  tested_negative 
     0.422 0.067 0.745  0.422 0.538  0.429 0.844  0.696  tested_positive 

Взвешенный Средн. 0,77 0,416 0,766 0,77 0,749 0,429 0,844 0,847

+0

Есть ли кто-нибудь, кто может помочь мне решить эту проблему? – supermus

ответ

1

Запуск adoboostM1 с параметрами по умолчанию для набора данных диабета weka. Я получил следующие результаты.

=== Detailed Accuracy By Class === 

      TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class 
      0.933 0.578 0.776  0.933 0.847  0.429 0.844  0.917  tested_negative 
      0.422 0.067 0.745  0.422 0.538  0.429 0.844  0.696  tested_positive 
Weighted Avg. 0.77  0.416 0.766  0.77 0.749  0.429 0.844  0.847 

Обратите внимание, что это TP Rate и FP скорость для каждого из вашего класса значения. Поскольку у меня есть два (2) значения для функции класса в этом наборе данных, у меня есть два (2) линий.

заметить также, что:

0.933 + 0.067 = 1 
0.578 + 0.422 = 1 

Как вы правильно отметили, что уровень TP + скорость FP должна быть равна единице (1). Итак, в вашем примере: я предполагаю, что у вас есть следующая переменная класса:

target {A,B} 

TP Rate FP Rate 
0.8  0.47 ..... for A 
0.53  0.2 ..... for B 
+0

Да, я вижу сейчас. Спасибо, но у меня есть еще один вопрос: что такое взвешенная средняя. тогда? В вашем случае (а также на моем) AVG (0,933,0,422)! = 0,77, так что, если это не средняя скорость классификации TP для обоих классов, что это такое? – supermus