`импорт панд импорта NumpyКак классифицировать значения с плавающим в питоне с помощью панд библиотеки
#importing the dataset
data=pandas.read_csv('gapminder.csv',low_memory=False)
#setting variables to be worked with to numeric
data['urbanrate']=data['urbanrate'].convert_objects(convert_numeric=True)
data['femaleemployrate']=data['femaleemployrate'].convert_objects(convert_numeric=True)
data['lifeexpectancy']=data['lifeexpectancy'].convert_objects(convert_numeric=True)
print("Count for urbanrate")
chk8=data['urbanrate'].value_counts(sort=False,dropna=False)
print(chk8)
sub1=data[['urbanrate','femaleemployrate','lifeexpectancy']]
print (sub1.head(25))
===========================================================================
def urban (row):
if (row['urbanrate']<25.0):
return 1
if (data[['urbanrate']>=25.0 & data['urbanrate']<75.0]):
return 2
if (data['urbanrate']>75.0):
return 3
sub1['urban']=sub1.apply(lambda row: urban (row),axis=1)
print (sub1.head(25))
============================================================================`
Я хочу, чтобы классифицировать все значения urbanrate
(которые все числа с плавающей точкой, как 24.56
, 88.98
, 77.65
) в 3 разные категории (одна - значения для <25
, другая для >=25 and <75
и последняя для >=75
) и сохраняйте эти значения в новой переменной (например, городской). Как я могу это сделать? Я дал свой код. Я выполнил это, и его дает мне ошибки как:
TypeError: ('cannot compare a dtyped [float64] array with a scalar of type [bool]', 'occurred at index 1'))
Пожалуйста, помогите мне
'sUB1 [ 'городской'] = sUB1 [ 'городской'] применяются (городской)' Теперь показывает ошибку в этой строке, KeyError: urban.I я не в состоянии выясните это. – user3400176
Hmm try 'sub1 ['urban'] = sub1 ['urbanrate'] применить (городской)' – EdChum