2010-09-03 7 views
2

Я чувствую, что мне не хватает чего-то простого здесь (как обычно).Как читать изображения PGM в Java?

Я пытаюсь читать изображения PGM с помощью Java. Matlab делает это просто отлично - вывод пикселов изображения (например, небольшое 32х32 изображения) в Matlab дает мне что-то вроде этого:

1 0 11 49 94 118 118 106 95 88 85 96 124 143 142 133

Моих Java читателя, однако, выводит это:

1 0 11 49 94 118 118 106 95 88 85 96 124 65533 65533 65533

Похоже, что значения пикселей выше 127 заполнены с помощью 65533, хотя некоторые неверные значения неверны и даже присваивают почти всю нижнюю строку значению -1.

Вот код, я использую:

filePath = 'imagepath.pgm'; 
FileInputStream fileInputStream = new FileInputStream(filePath); 
BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(fileInputStream)); 

// read the header information ... 

int [][] data2D = new int [picWidth] [picHeight]; 

for (int row = 0; row < picHeight; row++) { 
    for (int col = 0; col < picWidth; col++) { 
    data2D[row][col] = bufferedReader.read(); 
    System.out.print(data2D[row][col] + " "); 
    } 
    System.out.println(); 
} 

fileInputStream.close();

Любые идеи, было бы весьма признателен.

Редактировать Вот беззнаковых значений PGM:

  1  0 11 49 94 118 118 106 95 88 85 96 124 143 142 133 
    30 26 29 57 96 122 125 114 102 94 91 101 127 146 145 136 
    96 85 70 75 101 128 136 126 111 106 106 112 131 149 153 147 
    163 147 114 93 99 120 132 123 110 113 124 129 137 154 166 168 
    215 195 149 105 88 99 114 111 106 123 148 158 160 174 191 197 
    245 224 173 115 81 82 100 109 117 144 179 194 194 205 222 230 
    235 217 170 115 78 78 113 117 100 83 80 212 214 226 244 253 
    178 167 135 93 68 78 123 129 106 77 69 202 204 222 244 255 
    114 110 92 64 54 81 107 105 83 59 56 182 184 201 222 231 
    79 80 71 52 55 97 67 55 41 33 42 184 179 181 185 183 
    62 66 65 52 63 115 29 16 12 17 30 209 197 174 150 132 
    40 47 52 44 55 109 171 196 188 186 208 229 218 179 136 107 
    31 38 44 37 43 89 145 167 158 159 191 223 219 179 133 105 
    48 52 56 51 57 91 128 133 117 120 157 196 200 168 128 105 
    64 67 70 73 87 114 127 107 79 81 118 159 173 154 123 104 
    63 67 73 83 107 132 129 91 54 54 88 130 153 146 123 106

Заголовок выглядит следующим образом:

P5 
# MatLab PGMWRITE file, saved 27-Jun-2002 
16 16 
255

Edit # 2

Вот полный выход к доказательству кода концепции ниже:

 
Skipping unknow token: "" 
Skipping unknow token: "1^vvj_XU`|���" 
Skipping unknow token: "" 
Skipping unknow token: "9`z}rf^[e���`UFKe��~ojjp������r]cx�{nq|������ÕiXcroj{��������sQRdmu��������٪sNNqudSP�����]DN{�jME�����rn\@6QkiS;8�����OPG47aC7)!*�����>BA4?s" 
Skipping unknow token: "" 
Skipping unknow token: "" 
Skipping unknow token: "�Ů��(/4,7m�ļ���ڳ�k" 
Skipping unknow token: "&,%+Y������۳�i04839[��ux��Ȩ�[email protected]���{h?CISk��[66X���{j" 
Exception in thread "main" java.util.NoSuchElementException 
    at java.util.Scanner.throwFor(Scanner.java:838) 
    at java.util.Scanner.next(Scanner.java:1347) 
    at Test.main(Test.java:49) 

Line 49 упоминается в заброшенном исключением является:

System.out.println(String.format("Skipping unknow token: \"%s\"", scan.next())); 

Проблема, я уверен, что-то делать с тем, что эти файлы изображения состоят из двух ASCII текста/номера, а также как данные двоичного изображения. Но если у Java нет проблем с чтением PNG, почему отсутствие поддержки для PGM?

Редактировать 3

Хорошо, я нашел реализацию, которая работает ... к сожалению, это устаревшее:

filePath = "imagepath.pgm" 
    FileInputStream fileInputStream = new FileInputStream(filePath); 
    DataInputStream dis = new DataInputStream(fileInputStream); 
    StreamTokenizer streamTokenizer = new StreamTokenizer(dis); 

    // read header text using StreamTokenizer.nextToken() 

    data2D = new int [picWidth] [picHeight]; 
    for (int row = 0; row < picHeight; row++) { 
    for (int col = 0; col < picWidth; col++) { 
     data2D[row][col] = dis.readUnsignedByte(); 
     System.out.print(data2D[row][col] + " "); 
    } 
    System.out.println(); 
    } 

Согласно документации Java, то StreamTokenizer(InputStream) конструктор является устаревшим, так как DataInputStream.readLine() метод неправильно преобразовывает необработанные байты в символы. Однако, похоже, он работает в этом конкретном случае в заголовке и, очевидно, работает для последующих двоичных данных изображения.

К сожалению, это все-таки не рекомендуется, и кажется, что смешивани BufferedReader как документация предполагает только результаты в EOFException с после прочтения заголовка и пытается использовать DataInputStream для чтения необработанных байтов. Все еще ищете решение ...

+0

Сделано и сделано, дайте мне знать, что еще вам может понадобиться. – Magsol

ответ

6

Проблема с вашим кодом заключается в том, что вы используете неправильный класс для чтения необработанных данных из файла.Поскольку документация BufferedReader говорит:

public int read() throws IOException

читает один символ.

Возвращает: считанный символ, как целое число в диапазоне от 0 до 65535 (0x00-0xffff), или -1, если конец потока был достигнут

Таким образом, каждый вызов метода read() из BufferedReader фактически потребляет один или два байта (на основе кодировки символов) из входного потока, который не является тем, что вы хотите. Это также объясняет, почему вы получаете много -1: поток закончился намного раньше, чем вы думали.

Поскольку PGM содержит значения как ASCII-десятичные числа, их легко разобрать, используя класс Scanner.

Вот почти непроверенных кода, который показывает, как читать PGM изображение при условии, что:

  • содержит один комментарий после того, как магическое число (т.е. он не имеет строки, начинающиеся с символа #, за исключением второй)
  • Файл PGM имеет длину 4 строки.

Вот код:

String filePath = "image.pgm"; 
fileInputStream = new FileInputStream(filePath); 
Scanner scan = new Scanner(fileInputStream); 
// Discard the magic number 
scan.nextLine(); 
// Discard the comment line 
scan.nextLine(); 
// Read pic width, height and max value 
int picWidth = scan.nextInt(); 
int picHeight = scan.nextInt(); 
int maxvalue = scan.nextInt(); 

fileInputStream.close(); 

// Now parse the file as binary data 
fileInputStream = new FileInputStream(filePath); 
DataInputStream dis = new DataInputStream(fileInputStream); 

// look for 4 lines (i.e.: the header) and discard them 
int numnewlines = 4; 
while (numnewlines > 0) { 
    char c; 
    do { 
     c = (char)(dis.readUnsignedByte()); 
    } while (c != '\n'); 
    numnewlines--; 
} 

// read the image data 
int[][] data2D = new int[picHeight][picWidth]; 
for (int row = 0; row < picHeight; row++) { 
    for (int col = 0; col < picWidth; col++) { 
     data2D[row][col] = dis.readUnsignedByte(); 
     System.out.print(data2D[row][col] + " "); 
    } 
    System.out.println(); 
} 

Необходимость реализации: поддержка строк комментария, значения для каждого элемента должны быть разделены maxvalue, проверка ошибок для некорректных файлов, обработка исключений. Я тестировал его в PGM-файле, используя конечные строки UNIX, но он тоже должен работать на Windows.

Подчеркну, что это не надежная и полная реализация парсера PGM. Этот код предназначен как доказательство концепции, которая может быть выполнена достаточно для ваших нужд.

Если вам действительно нужен надежный парсер PGM, вы можете использовать инструменты, предоставляемые Netpbm.

+0

Это хорошо работает, но это порождает новую проблему: анализ файла заголовка. Я использовал BufferedReader/StreamTokenizer для чтения символов заголовка, и по какой-то причине после его завершения первый вызов dis.readByte() вызывает исключение EOFException. Если я удаляю заголовок из файла и просто читаю прямо из двоичного файла, у меня возникает другая проблема: первые 55 байтов, которые он читает, являются ненужными номерами; 56-й байт - это «1», который отображается первым в моем исходном сообщении, за которым следуют все соответствующие номера (до 55 байтов, из-за нежелательной записи). Есть предположения? – Magsol

+0

Простите, проигнорируйте бит около 55 байт; он отлично работает, если я удаляю заголовок (и, следовательно, BufferedReader/StreamTokenizer и имеет один дескриптор файла - DataInputStream - чтение из файла). – Magsol

+0

Неплохо, я не читал спецификацию формата файла PGM. Я постараюсь сделать это за несколько минут. –