Я искал вокруг какое-то время, но не смог найти кого-то, описывающего, что именно я хочу выполнить.Автоматически переориентировать и обрезать похожие изображения
В настоящее время у меня есть около 25 000 изображений старых машинописных документов, которые я ищу для создания базы данных. Первоначально я решил, что просто смогу запустить эти изображения с помощью программного обеспечения OCR в одной партии и работать с данными оттуда. Однако формат изображений не позволяет мне конвертировать их с помощью программного обеспечения OCR без потери большей части данных в документах. Ориентация и размещение соответствующей информации на каждой фотографии различны, и это не позволяет мне использовать один шаблон, чтобы сообщить программе OCR, какую информацию следует читать. Каждая фотография состоит из листа бумаги с таблицей информацию об этом, и вы можете увидеть некоторые фон вокруг края листа бумаги.
Что мне интересно делать, это найти способ автоматически переориентировать и обрезать каждое изображение, чтобы каждая таблица информации имела одинаковое положение и ориентацию. Таким образом, я смог бы конвертировать все изображения в фактические данные с помощью программного обеспечения OCR. Если нет возможности сделать это автоматически, для обработки каждого документа потребуется много часов.
Я думаю, что это может быть способ сделать это с помощью компьютерных технологий видения, но я действительно не знаю, насколько это возможно. These slides описать что-то похожее на то, что я хочу сделать, но не совсем. Я был бы признателен за любые советы о том, как я могу это сделать.