У меня есть кадр данных pandas с 7 столбцами. Для одного из этих столбцов я хочу разделить его содержимое на n-ведра в зависимости от значений. Итак, если моя колонка имеет значения 1, 3, 5 ... (2*n+1)
, я добавляю новый столбец с ведрами как 1,2,3...n
.Разделение столбцов данных данных pandas на n кодов
Кроме того, я не хочу нормализовать в том смысле, что даже если у меня есть 100 3 в столбце, я хочу, чтобы они были в одном ведре. Итак, если у меня есть 1, 3, 3, 3, 5, ... (2*n+1)
, мой вывод будет 1, 2, 2, 2, 3, .. n
.
Может кто-нибудь, пожалуйста, назовите меня, как это сделать.
--edit--
Мои фактические данные более чем миллион строк. Итак, если я использую ранг, я получаю звание от 1 до миллиона. Я хочу разделить ряды на ведра. Так, например, если у меня 3 миллиона строк и в конечном итоге с рангом от 1 до 1,5 миллиона. Если я хочу разделить его на 3 ведра, я получаю первое ведро с первым 0,5 млн. Ранга, второе ведро со следующими полумиллионами и так далее. Точно так же, если я хочу разделить его на 7 ведер.
С уважением
К сожалению, для меня это немного неясно. Можете ли вы добавить еще один образец с нужным выходом? – jezrael
@jezrael, конечно. Поэтому, если входной столбец «1,5,3,9,5,3,7,10», то выходной столбец должен иметь «1,3,2,5,3,2,4,6' в качестве вывода – nimbus3000