2013-04-15 1 views
4

Я пытаюсь реализовать распознавание лиц с помощью анализа основных компонентов (PCA) с использованием python. Я следую инструкциям, приведенным в данном руководстве: http://onionesquereality.wordpress.com/2009/02/11/face-recognition-using-eigenfaces-and-distance-classifiers-a-tutorial/Анализ основных компонентов (PCA) с использованием python

Вот мой код:

import os 
from PIL import Image 
import numpy as np 
import glob 
import numpy.linalg as linalg 


#Step1: put database images into a 2D array 
filenames = glob.glob('C:\\Users\\Karim\\Downloads\\att_faces\\New folder/*.pgm') 
filenames.sort() 
img = [Image.open(fn).convert('L').resize((90, 90)) for fn in filenames] 
images = np.asarray([np.array(im).flatten() for im in img]) 


#Step 2: find the mean image and the mean-shifted input images 
mean_image = images.mean(axis=0) 
shifted_images = images - mean_image 


#Step 3: Covariance 
c = np.cov(shifted_images) 


#Step 4: Sorted eigenvalues and eigenvectors 
eigenvalues,eigenvectors = linalg.eig(c) 
idx = np.argsort(-eigenvalues) 
eigenvalues = eigenvalues[idx] 
eigenvectors = eigenvectors[:, idx] 


#Step 5: Only keep the top 'num_eigenfaces' eigenvectors 
num_components = 20 
eigenvalues = eigenvalues[0:num_components].copy() 
eigenvectors = eigenvectors[:, 0:num_components].copy() 


#Step 6: Finding weights 
w = eigenvectors.T * np.asmatrix(shifted_images) 


#Step 7: Input image 
input_image = Image.open('C:\\Users\\Karim\\Downloads\\att_faces\\1.pgm').convert('L').resize((90, 90)) 
input_image = np.asarray(input_image) 


#Step 8: get the normalized image, covariance, eigenvalues and eigenvectors for input image 
shifted_in = input_image - mean_image 
cov = np.cov(shifted_in) 
eigenvalues_in, eigenvectors_in = linalg.eig(cov) 

Я получаю сообщение об ошибке: Traceback (most recent call last): File "C:/Users/Karim/Desktop/Bachelor 2/New folder/new3.py", line 47, in <module> shifted_in = input_image - mean_image ValueError: operands could not be broadcast together with shapes (90,90) (8100)

Я пытался удалить .flatten() с шага 1, но этот сгенерированный другой ошибка при расчете собственных значений и собственных векторов: Traceback (most recent call last): File "C:/Users/Karim/Desktop/Bachelor 2/New folder/new3.py", line 25, in <module> eigenvalues,eigenvectors = linalg.eig(c) File "C:\Python27\lib\site-packages\numpy\linalg\linalg.py", line 1016, in eig _assertRank2(a) File "C:\Python27\lib\site-packages\numpy\linalg\linalg.py", line 155, in _assertRank2 'two-dimensional' % len(a.shape)) LinAlgError: 4-dimensional array given. Array must be two-dimensional

Я также попытался добавить .flatten() в Шаг 7 b ut также он породил другую ошибку при вычислении собственных значений и собственных векторов входного изображения: Traceback (most recent call last): File "C:/Users/Karim/Desktop/Bachelor 2/New folder/new3.py", line 49, in <module> eigenvalues_in, eigenvectors_in = linalg.eig(cov) File "C:\Python27\lib\site-packages\numpy\linalg\linalg.py", line 1016, in eig _assertRank2(a) File "C:\Python27\lib\site-packages\numpy\linalg\linalg.py", line 155, in _assertRank2 'two-dimensional' % len(a.shape)) LinAlgError: 0-dimensional array given. Array must be two-dimensional

Любой может помочь?

ответ

3

Я наконец посмотрел учебник, который вы предоставили, и кажется, что автор предлагает вам сгладить изображения. На данный момент вы можете продолжить работу с сплющенными массивами, поскольку он лучше подходит для этого учебника.

Я считаю, что место для исправления находится на шаге 7, где у вас есть ковариация входного изображения. Однако ковариационная матрица входного изображения будет скаляром, и вы не сможете найти собственные значения и собственные векторы. Вы можете спроектировать его как 2d-матрицу размером (1,1), но тогда ваше собственное значение будет просто ковариацией, а собственный вектор будет [[1]].

То есть, например,

In [563]: input_image = np.random.rand(90,90).flatten() 

In [564]: c = np.cov(input_image) 

In [565]: c 
Out[565]: array(0.08280644230318886) 

In [566]: c.shape 
Out[566]:() 

In [567]: c.ndim 
Out[567]: 0 

Таким образом, мы перекроить c быть 2d:

In [568]: cmat = c.reshape(1,1) # equivalent to cmat = c[...,np.newaxis,np.newaxis] 

In [569]: cmat 
Out[569]: array([[ 0.08280644]]) 

In [570]: cmat.shape 
Out[570]: (1, 1) 

In [571]: cmat.ndim 
Out[571]: 2 

Так что теперь мы можем найти собственные годы:

In [572]: ceigval, ceigvec = linalg.eig(cmat) 

Но для одноэлектронной матрицей, существует только одно собственное значение и один собственный вектор, а собственное значение - элемент m atrix, а собственный вектор является единичным вектором длины 1, поэтому я не уверен, что это действительно то, что вы хотите сделать для распознавания лица.

In [573]: ceigval 
Out[573]: array([ 0.08280644]) 

In [574]: ceigvec 
Out[574]: array([[ 1.]]) 

In [576]: np.isclose(c, ceigval) 
Out[576]: True 

Кстати, именно поэтому мы должны были сделать c 2d:

In [577]: linalg.eig(c) 
--------------------------------------------------------------------------- 
LinAlgError: 0-dimensional array given. Array must be two-dimensional 

С другой стороны, вы могли бы получить ковариации оон-сплющенные input_image, то вам будет иметь N собственных значений и собственные векторы N:

In [582]: input_image = np.random.rand(90,90) 

In [583]: c = np.cov(input_image) 

In [584]: c.shape 
Out[584]: (90, 90) 

In [585]: ceigval, ceigvec = linalg.eig(c) 

In [586]: ceigval.shape 
Out[586]: (90,) 

In [587]: ceigvec.shape 
Out[587]: (90, 90) 
+1

вы правы ковариации т он ввод изображение. Спасибо за это полезное замечание, но, судя по всему, я не понял, что вы имеете в виду, проецируя его на 2d-матрицу. – user2229953

+1

@ user2229953 Я пояснил это на примере. – askewchan