Я пытаюсь использовать Apache Drill (в первый раз) на JSON файл, который выглядит следующим образом:Как запросить HTML, встроенный внутри строки в файл JSON с помощью Apache Drill?
{
"Key1": {
"htmltags": "<htmltag attr1='bravo' /><htmltag attr2='delta' /><htmltag attr3='charlie' />"
},
"Key2": {
"htmltags": "<htmltag attr1='kilo' /><htmltag attr2='lima' /><htmltag attr3='mike' />"
},
"Key3": {
"htmltags": "<htmltag attr1='november' /><htmltag attr2='foxtrot' /><htmltag attr3='sierra' />"
}
}
Мой первоначальный запрос был привет мир сверла: SELECT * FROM DataFile.json
, и дал мне столбцы Key1
, Key2
, Key3
. У них был только один ряд, и в нем содержалась запись: "<htmltag attr1='bravo' /><htmltag attr2='delta' /><htmltag attr3='charlie' />"
[, т. Е. только запись Key1.htmltags
].
У меня есть два вопроса:
- Почему там только одна строка, возвращенная, когда было три по-разному значных записей для каждого ключа?
- После использования функций KVGEN/FLATTEN, чтобы получить мои строки внутри «htmltags» выше, есть ли способ развернуть HTML-теги (анализировать и извлекать данные)?
Не удалось проверить отправленный json или получить результат от Drill, выполняющего ваш приветственный запрос. Пожалуйста, проверьте json, который вы использовали против сообщения. – catpaws
@catpaws это было репрезентативным оригиналом, жаль, что я не проверял на достоверность. Я исправлю это. –
@catpaws отредактирован, спасибо, что указали его. –