2016-04-01 1 views
0

С Stanford Classifier можно использовать перекрестную проверку, установив параметры в свойствах файлов, таких, как это в течение 10-кратного поперечного проверки:Stanford кросс проверки классификатор или агрегированные показатели

crossValidationFolds=10 
printCrossValidationDecisions=true 
shuffleTrainingData=true 
shuffleSeed=1 

Запуск этот выход , на каждую смену, различные показатели, такие как точность, отзыв, точность/усредненный по значению F1 и усредненный по Макро F1.

Есть ли возможность получить усредненную или иным образом агрегированную оценку всех 10 средних или средних значений F1 или всех 10 макроопределенных F1 в качестве части выхода?

В Weka по умолчанию выход после 10-кратной проверки перекрестных ссылок включает усредненные показатели по всем складкам. Является ли такой вариант доступным и в Стэнфордском классификаторе? Наличие окончательной точности, отзыва или оценки F1 и оптимизации параметров против него, как в Weka, очень полезно, и я хотел бы сделать это со Стэнфордским классификатором. Как?

ответ

1

Когда я бегу с 10 сгибами, я вижу этот выход. Когда я запускать эту команду:

java -cp "*" edu.stanford.nlp.classify.ColumnDataClassifier -prop examples/cheese2007.prop -crossValidationFolds 10 

Я вижу это на выходе (после того, как ### Fold 9)

[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - 181 examples in test set 
[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - Cls 2: TP=109 FN=6 FP=7 TN=59; Acc 0.928 P 0.940 R 0.948 F1 0.944 
[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - Cls 1: TP=59 FN=7 FP=6 TN=109; Acc 0.928 P 0.908 R 0.894 F1 0.901 
[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - Accuracy/micro-averaged F1: 0.92818 
[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - Macro-averaged F1: 0.92224 
[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - Average accuracy/micro-averaged F1: 0.93429 
[main] INFO edu.stanford.nlp.classify.ColumnDataClassifier - Average macro-averaged F1: 0.92247 
+0

Понятно, что печатает среднюю микро и макро F1 непосредственно под последней складки. Есть ли способ получить средние значения других мер (точность, отзыв)? Или, по крайней мере, вывести все меры в csv? – tkja

+0

Я думаю, что этот вывод принадлежит последней складке. Это не средний размер складок. – hrzafer