3

Я только что запустил код для обучения модели MNIST. Как мы можем применить его для распознавания рукописного ввода в реальном изображении? Я новичок и только начал изучать эту часть. Я искал и не мог найти информацию об этом.Как мы узнаем текст на реальном изображении после обучения MNIST с TensorFlow?

+0

Что вы пробовали? Набор MNIST настраивает вашу модель для распознавания одного символа в изображении фиксированного размера (размер ввода модели). Как есть, он может найти некоторые символы в неизвестных изображениях того же размера и предположения о единственном символе внутри него. Соответствует ли ваш «реальный образ» этим условиям? Если да, просто подайте его на модель. Если нет, вам нужна либо более сложная модель, либо используйте модель для «сканирования» изображения по размеру блоков, чтобы он соответствовал его вводу, пока не найдет символ или не остановится. Эта идея остается грубой, но, возможно, идея для начала. Это действительно зависит от того, что вы пытаетесь сделать. –

ответ

3

Это зависит от вашей конкретной задачи. Модель MNIST может классифицировать цифры символов и, таким образом, это данные, необходимые для ее подачи.

Если вы настаиваете на использовании модели MNIST (особенно для RNN LSTMs - это гораздо лучший вариант, который используют большинство OCR). Один из подходов - запустить скользящее окно над вашим письменным текстовым изображением и создать текстовый файл символа предсказанный вашей моделью. Но это представляет собой собственный набор проблем, таких как обнаружение новизны и размер окна слайда. Его избыток

0

Необходимо учитывать, что набор данных MNIST очень «набор данных игрушек», это всего лишь «Привет, мир!». распознавания изображений, и, следовательно, он не очень полезен для проблем реальной жизни. Если вы воссоздаете условия тренировочных образов и попытаетесь предсказать , что, вы получите хорошие результаты, но опять же, это не проблема в реальной жизни, но, возможно, это забавный проект для начала.

С учетом сказанного, может быть, вы еще не знакомы с извлечением признаков, которое использует современные сверточные нейронные сети. Используя это возможно, у вас может быть что-то полезное из подготовленной модели MNIST. Tensorflow's CNN tutorial было бы очень полезно в этом смысле. Чтобы лучше понять это tecniques я очень рекомендую chapter 6 of Michael Nielsen's Deep Learning online book

Надеются, что это помогает

1

нейронная сеть, по существу, очень хорошо распознает «материал», что вы кормите его. Для примера MNIST вы загружаете много 28х28х1 изображений рукописных цифр.

Поэтому, в качестве расширения, если вы хотите использовать ту же самую модель для рукописного ввода (я предполагаю, что вы имеете в виду персонажи из A-Z сейчас), вам тогда придется кормить много изображений рукописных символов 28x28x1.

 Смежные вопросы

  • Нет связанных вопросов^_^