2016-04-02 2 views
1

Я действительно новый в keras-библиотеке, а также Python. Я пытаюсь импортировать файл excel с помощью pandas и преобразовывать его в numpy.ndarray с использованием функции pansas as_matrix(). Но это швы, чтобы прочитать мой файл неправильно. Например, у меня есть набор данных 90x1049 в файле Excel. Но когда я пытаюсь преобразовать его в массив numpy, он считывает мои данные как 89x1049. Я использую следующий код, который не работает:Как преобразовать данные файла excel в массив numpy с помощью pandas?

training_data_x = pd.read_excel("/home/workstation/ANN/new_input.xlsx") 
X_train = training_data_x.as_matrix() 
+0

Я предполагаю, что ваш файл excel не имеет строки заголовка в качестве первой строки. Не могли бы вы включить образец результирующего 'pandas.DataFrame'? –

ответ

1

Возможно, что происходит, что ваш файл Excel не имеет строки заголовка и так pandas.read_excel потребляющее свой первый ряд данных как таковые.

Я попытался созданием XLSX, содержащего

1 2 3 
2 3 4 
3 4 5 
4 5 6 
5 6 7 
6 7 8 
7 8 9 
8 9 10 
9 10 11 
10 11 12 

Чтения, что привело к

In [3]: df = pandas.read_excel('test.xlsx') 

In [4]: df 
Out[4]: 
    1 2 3 
0 2 3 4 
1 3 4 5 
2 4 5 6 
3 5 6 7 
4 6 7 8 
5 7 8 9 
6 8 9 10 
7 9 10 11 
8 10 11 12 

Как можно видеть, первый ряд данных, был использован в качестве меток для столбцов.

Чтобы избежать использования первой строки данных в качестве заголовков, перейдите headers=None в read_excel. Интересно, что documentation не упоминает это использование:

заголовка: Int, список целых чисел, по умолчанию 0

Row (0 индексированные) использовать для меток столбцов разобранного DataFrame. Если список целых чисел пропускают эти позиции строки будут объединены в мультииндексных

0

Если у вас нет заголовка, попробуйте следующее:

training_data = pd.read_excel("/home/workstation/ANN/new_input.xlsx", header=None) 

X_train = training_data_x.as_matrix() 

Смотрите также ответы от previous question.

 Смежные вопросы

  • Нет связанных вопросов^_^