2017-02-15 15 views
1

Я новичок, когда дело доходит до Р. Но, я хочу узнать больше. Я пытаюсь сделать анализ рынка.Данные (csv) в корзину для арулов, удаляя дубликаты?

Это мой исходные данные, и я хочу, чтобы преобразовать это в формат сделки корзины:

Image

Это то, что я пытаюсь достичь:

Image 2

У меня есть проверено:

trans <- as(split(a[,"Game.played"],a[,"sessionid"]),"transactions") 

Но вместо названия игры номер игры отображается только. Может ли кто-нибудь сказать мне, почему это происходит? Кроме того, у меня есть перекрестные проверки фактических данных, и ассоциация sessionid с игрой неверна!

Я также попытался что-то вроде

q=read.transactions("a.csv", format = "basket", sep=",", rm.duplicates=TRUE). 

Но это не получается либо.

+1

Пожалуйста, потратьте немного времени и включать все соответствующие данные в этой должности, но не в виде изображения. Предпочтительно в качестве небольшого [воспроизводимого примера] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) вместе с желаемым результатом и тем, что вы пробовали так далеко. –

ответ

0

данные в корзину для arules, удаляя дубликаты?

Вот пример того, как можно удалить дубликаты:

set.seed(1) 
df <- data.frame(
    cat=rep(LETTERS[1:3], 2:4), 
    val=sample(letters[1:5], 9, T), 
    stringsAsFactors = FALSE 
) 
df 
# cat val 
# 1 A b 
# 2 A b 
# 3 B c 
# 4 B e 
# 5 B b 
# 6 C e 
# 7 C e 
# 8 C d 
# 9 C d 
(lst <- lapply(split(df$val, df$cat), unique)) 
# $A 
# [1] "b" 
# 
# $B 
# [1] "c" "e" "b" 
# 
# $C 
# [1] "e" "d" 
library(arules) 
as(lst, "transactions") 
# transactions in sparse format with 
# 3 transactions (rows) and 
# 4 items (columns)