Эффективный способ чтения непустых ячеек в столбце в CSV-файле

У меня есть большой файл python (> 500 000 строк) и хотелось бы читать непустые ячейки в столбце в dataframe (panda). Сейчас я делаю это:Эффективный способ чтения непустых ячеек в столбце в CSV-файле

df = pd.read_csv(filename) 

myiter = []  

    for xiter, x in enumerate(df['Column_name']): 

     if (np.isnan(x) == False): 
      myiter.append(xiter)

Есть ли более эффективный способ сделать то же самое?

источник

2016-10-05 Piyush

Отмечены ли они как NaN в вашем df?

если да, то сделать

df.dropna()

источник

2016-10-05 17:46:48

Я понял, что отбрасывает все строки, даже если данный столбец не имеет значение NaN (как и другие столбцы могут также иметь NaN). Есть ли способ удалить только строки с NaN в указанном столбце? – Piyush

, что было бы невозможно, как бы вы сбросили значение col 1, если хотите сохранить значение col 2 и сохранить индекс? если вы хотите создать df из столбца без na, вы можете сделать 'newdf = df ['Column_name']. dropna()' –

weird ... показать нам, что вы пробовали – MMF

Эффективный способ чтения непустых ячеек в столбце в CSV-файле

ответ

Смежные вопросы