2014-02-03 5 views
0

Я работаю над проектом по загрузке данных из файла и вычислению базовой статистики (среднее значение, дисперсия).Как убедиться, что вычисление среднего значения и дисперсии, считанное из файла, является правильным?

Файл имеет 20k строк, и каждая строка имеет 23 столбца. Файл выглядит следующим образом:

person_id range1 value1 range2 value2 ... range11 value11 

person_id может или не может иметь значение в диапазоне, и то же person_id могут появляться в разных строках файла, потому что он может иметь разные значения в том же диапазоне.

Мне нужно рассчитать среднее значение и дисперсию для каждого человека в каждом диапазоне. Результат должен быть

person_id range1_mean range1_variance range2_mean range2_variance ... 

Мой вопрос:

После выполнения расчета, как убедиться в том, что я не пропустить какие-либо данные, а также получить правильные результаты для среднего и дисперсии?

Я считаю, что некоторые лица (более 20) имеют разные средние значения, но та же дисперсия.

+0

Вы можете создать тестовые примеры и убедиться, что ваш расчет соответствует их вычислению вручную. –

+0

@Dan Getz, это невозможно сделать вручную, потому что может быть сотни значений для one person_id. Благодаря ! – user2420472

ответ

0

Если вы хотите проверить, что формулы, которые вы закодировали на C#, верны, при проверке результатов для одного заданного файла я предлагаю вам использовать другой инструмент. Используйте тот, который известен как надежный, для того чтобы перекрестно проверил вычисленную статистику.

Например, вы можете использовать Excel в качестве ссылок.

+0

Если я использую Excel, как убедиться, что файл Excel действительно получает правильные результаты? Если инструмент Excel и инструмент C# имеют разные результаты, как теперь, какой из них правильный? если они такие же, как знать, что оба правильны? Благодаря !!! – user2420472

+0

Что вы хотите точно проверить? Я думал, вы хотите проверить правильность ваших формул C# для среднего и дисперсии. Если это верно, вы можете доверять Excel для формул среднего значения и дисперсии, использовать его в качестве вашего ** справочного ** инструмента. – RawBean