32

Мне интересно написать какое-то базовое приложение для компьютеризированного распознавания объектов, поэтому я считаю, что мне нужна теоретическая основа в алгоритмах обработки изображений, а также некоторые ИИ для принятия решений.С чего начать изучение обработки изображений и распознавания объектов?

Я выпускник компьютерных наук, и однажды я планирую получить степень магистра, надеюсь, в одном из этих полей. Между тем, я хотел бы получить начало и сделать самообучение.

Так что мой вопрос: с чего начать? Я был бы признателен за стрелу в правильном направлении, если возможно, несколько ссылок.

+0

вы заинтересованы в компьютерном зрении? – BobbyShaftoe

+0

В принципе, да, это конечный результат. Хотя я не пытаюсь построить робота-убийцы или чего-то еще;;) – Yuval

ответ

13

Возможно взглянуть на: OpenCV. Действительно хорошая библиотека для обработки изображений, и когда вы будете знать, что использовать для какой цели, вы можете взглянуть «под капотом», чтобы знать, как она работает :)

+0

хороший ответ rky! – Murko

7

Добро пожаловать в мир развлечений компьютерного зрения, который в основном относится к области обработки изображений с алгоритмами AI для распознавания/отслеживания/сегментации и т. д. Не будучи исчерпывающим, вся сделка включает в себя сбор изображений, обработку изображений, сегментацию изображений, распознавание изображений.

Самый простой способ начать - это, вероятно, OpenCV. Однако в большинстве приложений использование OpenCV, вероятно, слишком велико, так как это действительно не так сложно начинать с нуля. Как только вы закончите загрузку изображения (вы, вероятно, захотите рассмотреть BMP, так как это проще всего разобрать), вы можете реализовать множество базовых алгоритмов обработки изображений, если бы у вас была только математическая формула. Есть и другая библиотека, которую вы, вероятно, можете попробовать, такие вещи, как torchvision, AForge (.NET) - хороший выбор.

Когда дело доходит до части ИИ, здесь все становится интересным. Вероятно, вы захотите использовать SVM, где есть хост библиотеки, которую вы можете использовать, например. libsvm, SVMlight и т. д.

3

Если вас интересуют книги, я бы рекомендовал «Введение в обработку и анализ изображений» Джона Русса на вводном уровне. Я также использовал ImageJ как хорошее, бесплатное приложение для анализа изображений - хорошо для прототипирования и тестирования. Как говорили другие, библиотека OpenCV тоже стоит посмотреть.

0

SDK с открытым исходным кодом, реализованный на C# & C++ был недавно выпущен Microsoft с использованием очень примитивного интерфейса веб-камеры и анализа изображений. Возможно, стоит взять browse around the extremely well documented code, чтобы начать работу.

1

Хорошие ответы. Надеюсь, ты не математик-фобик. Моя любимая техника в наши дни - Марков-Цейн Монте-Карло (Google Spiegelhalter). Распознавание - это проблема оптимизации, и MCMC - это общий способ справиться с ними через байесовский вывод.

2

Я написал несколько OpenCV изображения обработки/компьютерное зрение учебников с бесплатным исходным кодом, так что вы можете захотеть взглянуть на некоторых из них, чтобы помочь получить старт: http://www.shervinemami.co.cc/openCV.html