Я попытался индексировать общедоступный URL-адрес документа Google, но кажется, что он не работает. Есть ли способ обхода документов Google с помощью nutch и сделать их индекс, используя solr?Можем ли мы сканировать и индексировать документы Google Диск с помощью nutch и solr?
3
A
ответ
2
Использование Google Drive API для чтения/управления файлами
https://developers.google.com/drive/web/about-sdk
страница Drive Public URL не будет иметь прямые ссылки на подкаталоги, так что вы ничего не получите, если вы просканировать эти страницы.