Я работаю с довольно большими наборами данных (около 4 миллионов строк в месяц с 25 числовыми атрибутами и 4 факторами). Я хотел бы создать график, который содержит в месяц (за последние 36 месяцев) коробку для каждого числового атрибута для каждого продукта (один из 4-х факторных атрибутов).Можно ли объединить отдельные сводки ячеек в один и создать объединенный график?
Так как пример для продукта А:
-
_ | -
_|_ | _|_
| | | | |
| | _|_ | |
| | | | |---|
| | |---| | |
|---| | | | |
|_ _| | | |_ _|
| |_ _| |
| | |
- | -
-
--------------------------------------------------------------
jan '10 feb '10 mar '10 ................... feb '13
Но так как это довольно большие наборы данных я буду работать с I хотел бы несколько советов, чтобы начать работу, как подойти. Моя идея (но я не уверен, если это возможно), чтобы
- а) извлечение данных в месяц за продукт
- б) создать boxplot для этого конкретного месяца (так скажем jan'10 для продукт А)
- с) хранить сводные данные boxplot где
- д) повтор переменного тока для всех месяцев до февраля '13
- е) объединить все сохраненное boxplot сводные данные в одну
- е) построить комбинированный boxplot g) повторить af для всех других продуктов
Так что мой главный вопрос: Можно ли комбинировать отдельные сводки в одном и создать комбинированный график, как указано выше?
Любая помощь будет оценена,
Спасибо
Чтобы начать работу, вы можете делать такие вещи, как 'result <- boxplot (1: 10, plot = FALSE)', а затем 'bxp (result)' See '? Boxplot' и'? Bxp' – thelatemail