Возможно ли создать новый столбец в фрейме данных, где ячейки для «Х» основаны на значении другого столбца (ов). Пример ниже.Условно уносятся
Бутылки для AR1, PO1 и RU1 отличаются друг от друга.
До сих пор я могу получить только ячейки для всех значений в 'X'.
import pandas as pd
import numpy as np
import string
import random
N = 100
J = [2012,2013,2014]
K = ['A','B','C','D','E','F','G','H']
L = ['h','d','a']
S = ['AR1','PO1','RU1']
np.random.seed(0)
df = pd.DataFrame(
{'X': np.random.uniform(1,10,N),
'Y': np.random.uniform(1,10,N),
'J':np.random.choice(J, N),
'R':np.random.choice(L, N),
'S':np.random.choice(S,N)
})
df['bins_X'] = pd.qcut(df['X'], 10)
print(df.head())
Выход я хотел бы иметь:
EDIT;
На моих реальных данных я получаю ValueError: ребра не уникальны. Могу ли я решить это с помощью ранга? Как бы добавить это к предлагаемому решению?
Я получаю сообщение об ошибке при выходе от аргумента метки : 'ValueError: несовместимые категории в категорическом concat'. Любая идея почему? – lmo
Возможно, вы используете старую версию панд. Я нашел [эту ссылку] (http://pandas.pydata.org/pandas-docs/version/0.15.2/categorical.html), которая описывает ошибку в pandas 0.15. Вы можете обновить (если я даже прав, что это проблема) – piRSquared
Спасибо, что нашли ссылку. Я взгляну. – lmo