2017-02-06 7 views
1

У меня есть случайный лесной эксперимент, развернутый на лазурной ML, где я пытаюсь забить документы на основе слов, которые они содержат. Документы представлены в виде PDF-файлов. Когда я развертываю этот эксперимент в качестве веб-службы, он не позволяет мне вводить PDF-файлы. Есть ли способ ввода PDF-файлов в веб-службу?Обучение Azure Machine неспособно принимать PDF-файлы в качестве входных данных для веб-службы

ответ

0

Вот несколько возможных подходов:

  • сериализовать данные байтов для PDF перед вызовом веб-службы. В модуле Execute R/Python Script внутри вашего эксперимента десериализуйте данные и извлеките текст из PDF с помощью сторонних пакетов (например, pickle и pdfminer для Python).
  • Предоставление URI в PDF как вход в веб-службу. Используйте модуль Execute R/Python Script для извлечения файла PDF из этого URI и извлеките текст с использованием сторонних пакетов (например, urllib.requests и pdfminer для Python).

 Смежные вопросы

  • Нет связанных вопросов^_^