0

Я смущен, как сделать нормализацию z-score. Я нашел уравнение для этого, потребовал среднего и стандартного отклонения, но я не уверен, как это можно сделать, учитывая мою ситуацию.Как выработать нормализацию z-score?

У меня есть 2 классификатора в моей системе. Чтобы использовать оценки вместе, я знаю, что мне нужно их нормализовать, потому что они будут различаться по масштабам и т. Д. Я хочу использовать для этого нормализацию z-score. Мой вопрос заключается в том, что, учитывая 2 оценки из двух классификаторов, что мне нужно делать с оценками, чтобы z-score нормализовал их? Я хочу объединить/сравнить их.

Мое (возможно, ошибочное!) Понимание состоит в том, что для набора баллов классификатора мы используем среднее и стандартное отклонение. Но мы не всегда можем предположить, что у нас уже будет счет, чтобы получить среднее и стандартное отклонение, не так ли?

ответ

-1

Чтобы вычислить z-баллы заданного набора чисел, вам нужно вычислить среднее значение выборки и отклонение выборки. Из каждого балла вычесть среднее и делить стандартное отклонение. Рассмотрим набор чисел ниже, где каждое наблюдение тестов в диапазоне от 0 до 100.

{40, 50, 60, 55, 70, 80, 90} 

Если вы хотите, чтобы сравнить их другой набор тестов, где результаты тестов в диапазоне от 0 до 250, таких как:

{100, 115, 214, 50, 200, 80, 90} 

Вы не смогли сравнить цены. То есть оценка 80 во втором сете явно хуже, чем 80 в первом наборе (80/250 против 80/100). Один из способов сделать это - использовать z-баллы. Они вычисления следующим образом:

  1. найти средний

    среднего значения первого набора является: 63,57143 среднего значения второго набора: 121,2857

  2. Вычесть выборочное среднее от каждого счета. Это даст вам набор чисел, центрированных на ноль.

    {-23,571429, -13,571429, -3,571429, -8,571429, 6,428571, 16,428571, 26,428571} { -21,285714, -6,285714, 92,714286, -71,285714, 78,714286, -41,285714, -31,285714}

  3. Вычислительный стандартное отклонение от исходного набора и разделить "сосредоточенных" баллы по этому номеру:

    Set 1 сигма = 17,49149

    Set 2 сигма = 61,98041

Эта цифра составляет:

{-1.3475937, -0.7758873, -0.2041809. -0,4900341, 0,3675256, 0,9392320, 1,5109384} { -0,3434265, -0,1014145, 1,4958643, -1,1501330, 1,2699865, -0,6661091, -0,5047678}

Теперь у вас есть два набора чисел сопоставимы. Значение нуля означает, что оно является средним значением множества. Значение 1 стандартного отклонения выше среднего. Значение -1 означает, что это одно стандартное отклонение ниже среднего и так далее.

+0

Спасибо. Но в моей проблеме я спрашиваю, как я могу это сделать, учитывая, что я получаю 2 оценки классификатора?Как я могу вычислить среднее значение из двух оценок классификатора? Я не могу сгенерировать оценки * n *, чтобы нормализовать их, я хочу сразу сравнить 2 оценки. – mino