Я хочу создать правильное чтение фрейма данных из json-файла. Я могу правильно просмотреть созданный фрейм данных, но dplyr
функция group_by
не работает на нем. Вероятно, потому, что когда я создаю str()
созданного фрейма данных, он дает каждому столбцу список строк, а не вектор строк. Я пытаюсь следующее:Создание Dataframe из json-файла
require(jsonlite)
train_file = 'train.json'
train_data <- fromJSON(train_file)
rb = data.frame(sapply(train_data,c), stringsAsFactors = FALSE)
rbs = rb %>% slice(1:10)
rbsg = rbs %>%
group_by(colname)
Это дает следующее сообщение об ошибке:
Error: cannot group column colname, of class 'list'
Очень определенно, файл, который я пытаюсь прочитать это файл train.json в этом kaggle конкурсе:
https://www.kaggle.com/c/two-sigma-connect-rental-listing-inquiries/data
Является ли файл JSON глубоко вложенным? –
Посмотрите на пакет 'tidyjson', отлично подходящий для таких вещей. –
Да, файл json глубоко вложен. Я даю tidyjson взгляд. Я попробовал jsonlite, JSONRIO и многие другие. Все это привело к одной и той же проблеме. –