2013-04-16 4 views
4

Я пытаюсь сделать распознавание лиц Анализ основных компонентов (PCA) с использованием python.Распознавание лиц - Python

Теперь я могу получить минимальное эвклидовое расстояние между учебными изображениями images и входным изображением input_image. Вот мой код:

import os 
from PIL import Image 
import numpy as np 
import glob 
import numpy.linalg as linalg 

#Step1: put database images into a 2D array 
filenames = glob.glob('C:\\Users\\me\\Downloads\\/*.pgm') 
filenames.sort() 
img = [Image.open(fn).convert('L').resize((90, 90)) for fn in filenames] 
images = np.asarray([np.array(im).flatten() for im in img]) 

#Step 2: find the mean image and the mean-shifted input images 
mean_image = images.mean(axis=0) 
shifted_images = images - mean_image 

#Step 3: Covariance 
c = np.asmatrix(shifted_images) * np.asmatrix(shifted_images.T) 

#Step 4: Sorted eigenvalues and eigenvectors 
eigenvalues,eigenvectors = linalg.eig(c) 
idx = np.argsort(-eigenvalues) 
eigenvalues = eigenvalues[idx] 
eigenvectors = eigenvectors[:, idx] 

#Step 5: Only keep the top 'num_eigenfaces' eigenvectors 
num_components = 20 
eigenvalues = eigenvalues[0:num_components].copy() 
eigenvectors = eigenvectors[:, 0:num_components].copy() 

#Step 6: Finding weights 
w = eigenvectors.T * np.asmatrix(shifted_images) 
# check eigenvectors.T/eigenvectors 

#Step 7: Input image 
input_image = Image.open('C:\\Users\\me\\Test\\5.pgm').convert('L').resize((90, 90)) 
input_image = np.asarray(input_image).flatten() 

#Step 8: get the normalized image, covariance, 
# eigenvalues and eigenvectors for input image 
shifted_in = input_image - mean_image 
c = np.cov(input_image) 
cmat = c.reshape(1,1) 
eigenvalues_in, eigenvectors_in = linalg.eig(cmat) 

#Step 9: Find weights of input image 
w_in = eigenvectors_in.T * np.asmatrix(shifted_in) 
# check eigenvectors/eigenvectors_in 

#Step 10: Euclidean distance 
d = np.sqrt(np.sum(np.asarray(w - w_in)**2, axis=1)) 
idx = np.argmin(d) 
print idx 

Моя проблема сейчас в том, что я хочу, чтобы вернуть изображение (или его индекс в массиве images) с минимальным евклидовым расстоянием не его индексом в массиве расстояний d

ответ

1

Я не верю, что вы изменили порядок, что изображения хранятся в w по сравнению с в images, поэтому idx из np.argmin(d) должен быть одинаковым индексом images списка, так

images[idx] 

должно быть изображение, которое вы хотите.

Конечно,

images[idx].shape 

(1800,) даст, потому что она по-прежнему выравнивают. Если вы хотите развязать его, вы можете сделать:

images[idx].reshape(90,90) 
+0

Я не думаю, что это правда. Потому что 'images' состоит из 30 изображений (3 лица, по 10 изображений). И 'd' состоит из 20 расстояний, поэтому максимальное значение' idx' = 20, поэтому, если тестовое изображение 'input_images' содержит третье изображение (выход должен быть между 21-30), я бы никогда не получил правильный результат. – user2229953

+0

Я вижу, что в сделанных данных я использую это не так :-P – askewchan