У меня есть SOAP-WebService, предоставляющий метод, при котором вызывающий может загрузить файл PDF, JPG, PNG или BMP. Для правильной обработки мне нужно получить MIME-тип из DataHandler. Я пытался получить MIME-тип с Apache Тика:Обнаружение MIME-типа из DataHandler
Tika tika = new Tika();
InputStream stream = dataHandler.getInputStream();
String mimeType = tika.detect(stream);
Теперь моя проблема:
В большинстве случаев Тика определяет правильные MIME-типов, но в некоторых случаях загружаемых JPGs он обнаруживает plain/text
вместо image/jpeg
. Как я могу это решить?
Спасибо заранее!
Какую версию Apapche Tika вы используете? Что произойдет, если вы обновите? О, и у вас есть имя файла? Тика может догадаться, когда дано имя файла тоже – Gagravarr
У меня есть текущая версия 1.13. К сожалению, у меня нет имени файла, это одна из причин, по которым мне нужен MIME-тип ;-) – VenoxX
Допустимые файлы jpeg не должны распознаваться как текст. Предполагая, что вы получаете ту же самую проблему в недавней ночной сборке, можете ли вы открыть новую ошибку Tika и загрузить файл, который показывает проблему? – Gagravarr