Лично я бы посоветовал использовать машинное обучение для этого проекта. В высоких понятиях, что бы вы сделали, это питание программы python тысячами изображений разных покемонов. Программа проанализирует их и найдет шаблоны и сохранит эти шаблоны.
Затем вы можете отправить другие изображения pokemon, и скрипт python вернет вероятный капюшон того, что такое покемон.
Используемая вами библиотека называется tensorflow. В Google есть отличное руководство для использования распознавания изображений с помощью тензорного потока. Там они объясняют весь код, используемый для распознавания изображений, и все шаги по настройке tensorflow. Вот link.
Хорошая вещь с тензорным потоком заключается в том, что создание разных объектов для разных покемонов не сложно. Все, что вам нужно сделать, это создать папку и назовите ее потом именем покемонов. Затем просто перетащите изображения покемонов с разных ракурсов. Для этого вам понадобятся БОЛЬШИЕ изображения, чтобы это работало и часы свободного времени. Tensorflow требует времени, чтобы изучить шаблоны, особенно, так как у вас будет много покемонов, вам понадобится много изображений.
Если вы хотите ускорить процесс, убедитесь, что у вас быстрый компьютер!
Получайте удовольствие от тензорного потока! и удачи в вашем проекте!