В настоящее время elasticsearch hadoop преобразует набор данных/rdd в документы с отображением от 1 до 1, то есть 1 строка в наборе данных преобразуется в один документ. В нашем случае мы делаем что-т
Я прочитал, возможно, Stackoverflow, что проекты es-hadoop/es-spark используют объемную индексацию. Если это так, то пакет Batchsize по умолчанию соответствует BulkProcessor (5Mb). Есть ли какая-либо
Я читаю данные json из очереди Kafka с использованием искровой структурированной потоковой передачи, но мне нужно записать данные json в Elasticsearch. Однако я не могу получить sparkContext внутри Fo
Я очень новичок в ElasticSearch: Я пытаюсь прочитать данные из индекса, используя Spark в Java. У меня есть рабочий фрагмент кода, но он возвращает документ внутри набора данных, где столбцы представл