У меня есть большой файл csv 3.5 go, и я хочу его прочитать с помощью pandas.Ошибка данных для токенизации. C ошибка: из памяти pandas python, большой файл csv
Это мой код:
import pandas as pd
tp = pd.read_csv('train_2011_2012_2013.csv', sep=';', iterator=True, chunksize=20000000, low_memory = False)
df = pd.concat(tp, ignore_index=True)
Я получаю эту ошибку:
pandas/parser.pyx in pandas.parser.TextReader.read (pandas/parser.c:8771)()
pandas/parser.pyx in pandas.parser.TextReader._read_rows (pandas/parser.c:9731)()
pandas/parser.pyx in pandas.parser.TextReader._tokenize_rows (pandas/parser.c:9602)()
pandas/parser.pyx in pandas.parser.raise_parser_error (pandas/parser.c:23325)()
CParserError: Error tokenizing data. C error: out of
Емкость моей памяти составляет 8 Go.
насчет просто 'pd.read_csv ('train_2011_2012_2013.csv', sep = ';') '? – Boud
В дополнение к любым другим предложениям, вы также должны указать 'dtypes'. – 3novak
@Boud мой компьютер не поддерживает его –