2011-02-03 4 views
9

Мне нужно распознать цифры с изображения камеры на iPhone в режиме реального времени. Я знаю, что на изображении будет не более 5 цифр.Возможно ли распознавание номера на iPhone в режиме реального времени?

Является ли эта проблема реалистичной для решения данных вычислительных характеристик iPhone? У кого-нибудь есть опыт использования библиотеки OCR Tesseract, и считаете ли вы, что ее можно решить, используя ее?

+0

возможно дубликат: http://stackoverflow.com/questions/3140455/training-tesseract-to-use-with-iphone –

+0

@Daniel: В то время как этот вопрос спрашивает, как используйте Tesseract для чтения чисел в любом неподвижном изображении, это исследует возможность делать такую ​​обработку из потокового видеопотока. Я считаю, что здесь достаточно разницы, чтобы оправдать новый вопрос. –

ответ

1

Это должно быть возможно с вычислительной точки зрения. Есть приложения, которые могут получить штрих-код в режиме реального времени, а также приложение, которое выполняет трансляцию в реальном времени. (Word Lens). Однако я не знаю, какие библиотеки они используют.

11

В зависимости от вашего определения «в реальном времени», но да, должно быть возможно сделать относительно быстрое распознавание цифр 0-9 на iPhone 4, особенно если вы можете использовать шрифты, условия освещения и т. Д. что они появятся.

Я настоятельно рекомендую прочитать статью на how Sudoku Grab does its recognition of puzzles с помощью камеры iPhone. В их случае для идентификации цифр использовалась обученная нейронная сеть, которая должна быть достаточно простой и быстрой на современном оборудовании iOS.

Текущие библиотеки распознавания, такие как OpenCV, будут использовать процессор iPhone для выполнения обработки. Я слышал, что они могут выполнять еще более сложные задачи, такие как распознавание лица, достаточно быстро, чтобы использовать их с видеоисточниками, показывая минимальное количество заикания.

Для повышения производительности я считаю, что в программируемых графических процессорах на новых устройствах iOS имеется большой потенциал. В my benchmarks я видел ускорение 14X - 28X при использовании графического процессора iPhone 4 для простой обработки изображений. Пока мало кто смотрит на это прямо сейчас, что-то вроде нейронной сети Sudoku Grab должно быть достаточно параллельным процессом, чтобы выиграть от работы на графическом процессоре.

+0

Полезная работа http://www.benjaminloulier.com – iCoder86

0

Да. Bender может помочь вам в этом. Он позволяет создавать и запускать нейронные сети на iOS. Поскольку он использует Металл под капотом, он работает быстро и плавно. Он также поддерживает прямое использование моделей TensorFlow.

Таким образом, вы можете запустить в Бендерах существующей модели в TensorFlow обученную для распознавания цифр Handwritten Digit Recognition using Convolutional Neural Networks in Python with Keras, если вам нужна помощь

Отказа от ответственности: Я работал над этим проектом.

0

Для этого есть бесплатный SDK: http://rtrsdk.com/ Поддерживает как iOS, так и Andorid, работает в режиме реального времени, помогает захватывать любой текст, цифры не должны быть проблемой.

Отказ от ответственности: Я работаю для ABBYY