Я использую API Google Vision, в первую очередь для извлечения текстов. Я отлично работаю, но для конкретных случаев, когда мне понадобится API для сканирования строки ввода, выплевывает текст перед переходом на следующую строку. Тем не менее, похоже, что API использует какую-то логику, которая позволяет сканировать сверху вниз с левой стороны и перемещаться вправо и делать сканирование сверху вниз. Мне бы понравилось, если бы API читал влево-вправо, двигался вниз и так далее.Извлечение текста - строка за строкой
Для примера рассмотрим изображение:
API-интерфейс возвращает текст, как это:
“ Name DOB Gender: Lives In John Doe 01-Jan-1970 LA ”
В то время как я ожидал бы что-то вроде этого:
“ Name: John Doe DOB: 01-Jan-1970 Gender: M Lives In: LA ”
Я предполагаю, что существует способ определить размер блока или ma rgin (?) для чтения изображения/сканирования по строкам?
Благодарим за помощь. Alex
Спасибо, что одна возможность. –