0

Я искал вокруг какое-то время, но не смог найти кого-то, описывающего, что именно я хочу выполнить.Автоматически переориентировать и обрезать похожие изображения

В настоящее время у меня есть около 25 000 изображений старых машинописных документов, которые я ищу для создания базы данных. Первоначально я решил, что просто смогу запустить эти изображения с помощью программного обеспечения OCR в одной партии и работать с данными оттуда. Однако формат изображений не позволяет мне конвертировать их с помощью программного обеспечения OCR без потери большей части данных в документах. Ориентация и размещение соответствующей информации на каждой фотографии различны, и это не позволяет мне использовать один шаблон, чтобы сообщить программе OCR, какую информацию следует читать. Каждая фотография состоит из листа бумаги с таблицей информацию об этом, и вы можете увидеть некоторые фон вокруг края листа бумаги.

Что мне интересно делать, это найти способ автоматически переориентировать и обрезать каждое изображение, чтобы каждая таблица информации имела одинаковое положение и ориентацию. Таким образом, я смог бы конвертировать все изображения в фактические данные с помощью программного обеспечения OCR. Если нет возможности сделать это автоматически, для обработки каждого документа потребуется много часов.

Я думаю, что это может быть способ сделать это с помощью компьютерных технологий видения, но я действительно не знаю, насколько это возможно. These slides описать что-то похожее на то, что я хочу сделать, но не совсем. Я был бы признателен за любые советы о том, как я могу это сделать.

ответ

1

Я действительно не знаю, как писать автоматическое программное обеспечение - это путь, поверьте мне, вам потребуется гораздо меньше времени на ручную организацию всех документов, чем написание кода для него. Насколько я могу судить, можно использовать какую-то технику автоматического бокса, используя PCA или что-то подобное. Однако, если вы не студент компьютерного зрения или потенциальный ученик поля, я настоятельно рекомендую ручной метод.

Извините за обескураживающий ответ, но иногда вам нужно принимать кислое лекарство. :-(