У меня есть несбалансированный числовой набор данных, который выглядит следующим образом:Binning Imbalanced данные
.
Мне нужно записать данные в 8 ящиков, однако, если бы я установил бинды одинакового размера, я бы получил все свои данные только в два ящика, а остальные в середине были бы пустыми.
Есть ли статистический или математический метод, который дискретизирует данные с мелкозернистыми бункерами, когда есть много точек данных, а затем сделать их более крупнозернистыми бункерами, когда имеется несколько точек данных?
это x -> x функция, так зачем вам нужен bucketing? – eliasah
Сюжет просто для визуализации того, как выглядят мои данные, у меня есть вектор числовых значений: (длина = 4964, min = 1, max = 7478, mean = 5.045, stdDev = 106.6), и я хочу дискретизировать их в 8 бункера. –