У меня есть столбец в области данных, который имеет категориальные данные, но некоторые данные отсутствуют, то есть NaN. Я хочу провести линейную интерполяцию по этим данным, чтобы заполнить недостающие значения, но я не уверен, как это сделать. Я не могу отказаться от NaN, чтобы превратить данные в категориальный тип, потому что мне нужно их заполнить. Простой пример, демонстрирующий, что я пытаюсь сделать.Pandas - Обработка NaNs в категориальных данных
col1 col2
5 cloudy
3 windy
6 NaN
7 rainy
10 NaN
Скажем, я хочу, чтобы преобразовать col2
категорических данных, но сохранить и пренебрежимо малых заполнить их с помощью линейной интерполяции, как я идти об этом. Допустим, после преобразования столбец категорического данных выглядит как этот
col2
1
2
NaN
3
NaN
Тогда я могу сделать линейной интерполяции и получить что-то вроде этого
col2
1
2
3
3
2
Как я могу добиться этого?
Работает отлично. Есть ли способ преобразовать данные обратно в исходную форму после интерполяции, т. Е. Вместо 1,2 или 3 вы снова будете «облачно», «ветреный» и «дождливый»? –
@WasswaSamuel, я обновил свой ответ - пожалуйста, проверьте – MaxU
Его удивительный, сколько можно узнать, пройдя эти ответы. Сегодняшние принимают home factorize() и интерполируют() :) – Vaishali