Я не думаю, что это было задано, но есть ли способ объединить информацию из списка с несколькими уровнями и неравномерной структурой в кадре данных «длинного» формата?преобразование неравномерного иерархического списка в кадр данных
В частности:
library(XML)
library(plyr)
xml.inning <- "http://gd2.mlb.com/components/game/mlb/year_2009/month_05/day_02/gid_2009_05_02_chamlb_texmlb_1/inning/inning_5.xml"
xml.parse <- xmlInternalTreeParse(xml.inning)
xml.list <- xmlToList(xml.parse)
## $top$atbat
## $top$atbat$pitch
## des id type x y
## "Ball" "310" "B" "70.39" "125.20"
Где следующая структура:
> llply(xml.list, function(x) llply(x, function(x) table(names(x))))
$top
$top$atbat
.attrs pitch
1 4
$top$atbat
.attrs pitch
1 4
$top$atbat
.attrs pitch
1 5
$bottom
$bottom$action
b des event o pitch player s
1 1 1 1 1 1 1
$bottom$atbat
.attrs pitch
1 5
$bottom$atbat
.attrs pitch
1 5
$bottom$atbat
.attrs pitch runner
1 5 1
$bottom$atbat
.attrs pitch runner
1 7 1
$.attrs
$.attrs$num
character(0)
$.attrs$away_team
character(0)
$.attrs$
То, что я хотел бы иметь это кадр данных от имени вектора из категории шаг, вдоль с надлежащим (наверх, atbat, низ). Поэтому мне нужно будет игнорировать уровни, которые не будут вписываться в data.frame из-за разного количества столбцов. Что-то вроде этого:
first second third des x
1 top atbat pitch Ball 70.29
2 top atbat pitch Strike 69.24
3 bottom atbat pitch Out 67.22
Есть ли элегантный способ сделать это? Благодаря!
связанный с этим вопрос: http://stackoverflow.com/questions/2067098/how-to-transform-xml-data-into-a-data-frame – apeescape