Я понимаю, что F1-мера является гармоническим средством точности и запоминания. Но какие значения определяют, насколько хороший/плохой показатель F1? Кажется, я не могу найти ссылок (google или академических) на мой вопрос.Что такое плохой, приличный, хороший и отличный диапазон F1-мер?
ответ
Вы не нашли ссылки на диапазон измерения f1, потому что нет никакого диапазона. Метка F1 представляет собой комбинированную матрицу точности и запоминания.
Предположим, у вас есть два алгоритма, один имеет более высокую точность и более низкий уровень отзыва. По этому наблюдению вы не можете сказать, какой алгоритм лучше, если только ваша цель не заключается в максимизации точности.
Таким образом, учитывая эту двусмысленность в отношении того, как выбрать превосходный алгоритм среди двух (один с более высоким отзывом и другой с более высокой точностью), мы используем f1-меру, чтобы выбрать главный из них.
f1-measure - относительный термин, поэтому нет абсолютного диапазона для определения того, насколько лучше ваш алгоритм.
Хотя если классификация класса А имеет 0,9 F1, а классификация класса B равна 0,3. Независимо от того, как вы играете с порогом точности и отзыва компромисса, 0,3 никогда не достигнут 0,9. Итак, в этом гипотетическом случае мы не можем быть уверены, что производительность для классификации класса A намного лучше, чем классификация класса B, используя только оценку F1? – KubiK888
мы сравниваем точность, отзыв и оценку f1 между двумя алгоритмами/подходами, а не между двумя классами. –
То, что считается хорошим или плохим, зависит от того, насколько сложна задача. – Aaron