2013-04-15 4 views
2

Я пытаюсь реализовать распознавание лиц с помощью анализа основных компонентов (PCA) с использованием python. Я следую инструкциям, приведенным в данном руководстве: http://onionesquereality.wordpress.com/2009/02/11/face-recognition-using-eigenfaces-and-distance-classifiers-a-tutorial/Ошибка - вычисление евклидова расстояния для PCA в python

Вот мой код:

import os 
from PIL import Image 
import numpy as np 
import glob 
import numpy.linalg as linalg 


#Step1: put database images into a 2D array 
filenames = glob.glob('C:\\Users\\Karim\\Downloads\\att_faces\\New folder/*.pgm') 
filenames.sort() 
img = [Image.open(fn).convert('L').resize((90, 90)) for fn in filenames] 
images = np.asarray([np.array(im).flatten() for im in img]) 


#Step 2: find the mean image and the mean-shifted input images 
mean_image = images.mean(axis=0) 
shifted_images = images - mean_image 


#Step 3: Covariance 
c = np.cov(shifted_images) 


#Step 4: Sorted eigenvalues and eigenvectors 
eigenvalues,eigenvectors = linalg.eig(c) 
idx = np.argsort(-eigenvalues) 
eigenvalues = eigenvalues[idx] 
eigenvectors = eigenvectors[:, idx] 


#Step 5: Only keep the top 'num_eigenfaces' eigenvectors 
num_components = 20 
eigenvalues = eigenvalues[0:num_components].copy() 
eigenvectors = eigenvectors[:, 0:num_components].copy() 


#Step 6: Finding weights 
w = eigenvectors.T * np.asmatrix(shifted_images) 


#Step 7: Input image 
input_image = Image.open('C:\\Users\\Karim\\Downloads\\att_faces\\1.pgm').convert('L').resize((90, 90)) 
input_image = np.asarray(input_image).flatten() 


#Step 8: get the normalized image, covariance, eigenvalues and eigenvectors for input image 
shifted_in = input_image - mean_image 
c = np.cov(input_image) 
cmat = c.reshape(1,1) 
eigenvalues_in, eigenvectors_in = linalg.eig(cmat) 


#Step 9: Fing weights of input image 
w_in = eigenvectors_in.T * np.asmatrix(shifted_in) 
print w_in 
print w_in.shape 

#Step 10: Euclidean distance 
d = np.sqrt(np.sum((w - w_in)**2)) 
idx = np.argmin(d) 
match = images[idx] 

Я Хавин проблемы в шаге 10, как я получаю эту ошибку: Traceback (most recent call last): File "C:/Users/Karim/Desktop/Bachelor 2/New folder/new3.py", line 59, in <module> d = np.sqrt(np.sum((w - w_in)**2)) File "C:\Python27\lib\site-packages\numpy\matrixlib\defmatrix.py", line 343, in __pow__ return matrix_power(self, other) File "C:\Python27\lib\site-packages\numpy\matrixlib\defmatrix.py", line 160, in matrix_power raise ValueError("input must be a square array") ValueError: input must be a square array

Любой человек может помочь ??

+1

Я вижу, что вы решили взять собственный из матрицы ковариации 1x1. Вероятно, вы должны убедиться, что это действительно то, что вы хотите сделать. Ковариация находит, как коррелируются два или более набора данных, и когда вы запускали свои обучающие образы, вы обнаружили, насколько хорошо они коррелируют друг с другом. Когда вы запускаете его на входном изображении, вы получаете его значение корреляции, которое может быть не таким, каким вы хотите. Мне нужно будет более внимательно изучить учебник и подумать об этом больше, но я хотел предупредить вас, чтобы я не вводил вас в заблуждение своим предыдущим ответом. – askewchan

+0

@askewchan Спасибо за ваш совет. Мне интересно, что я мог бы выполнить свою работу, используя класс 'PCA', встроенный в' matplotlib'. Вы знаете, как это работает? – user2229953

+0

Нет, к сожалению, у меня нет опыта с этим, но если вы попытаетесь изучить его, вы всегда можете задать свои вопросы здесь :) – askewchan

ответ

2

Я думаю, что вы хотите изменить строку, где вычислить d к чему-то вроде этого:

#Step 10: Euclidean distance 
d = np.sqrt(np.sum(np.asarray(w - w_in)**2, axis=1) 

Это дает вам список длиной M (количество тренировочными образами) из квадратов, суммируются, укорененное расстояния между пикселями изображений. Я считаю, что вам не нужен матричный продукт, вам нужен квадрат по каждому квадрату, поэтому np.asarray сделать его не матрицей. Это дает вам «евклидовую» разницу между w_in и каждой из матриц w.

1

Когда вы идете (w - w_in), результат не является квадратной матрицей. Чтобы умножить матрицу сама по себе, она должна быть квадратной (это просто свойство матричного умножения). Таким образом, либо вы построили свои матрицы и w_in, либо то, что вы на самом деле хотели сделать, - это квадрат каждого элемента в матрице (w - w_in), который является другой операцией. Найдите умножение по типу, чтобы найти синтаксис numpy.

+1

Я хочу, чтобы квадрат был '(W - W_in)' не каждый элемент в матрице, так что, возможно, проблема заключается в построении 'W' и' W_in' – user2229953

 Смежные вопросы

  • Нет связанных вопросов^_^