Я хотел бы повторить все строки в моем наборе данных с вероятностью. Вероятность повторения значения в строках зависит от начальной строки. Как я могу определить для каждого элемента в рядах вероятность повторения?Сэмплированные данные в R, как заменить случайно выбранные элементы на 0
Вот небольшой пример кадра данных.
data <- data.frame(id = rep(c("01", "02", "03"),4),
X1 = c(100,60,90,0,60,90,0,60,0,100,60,0),
X2 = c(0,60,90,0,60,0,0,0,90,0,0,90))
head(data)
id X1 X2
1 01 100 0
2 02 60 60
3 03 90 90
4 01 0 0
5 02 60 60
6 03 90 0
Первый столбец и столбец со значением = 0 следует повторить. Числовое значение в строке должно повторяться со случайностью 9/10. (Я ожидаю новый фрейм данных с повторными id
столбцов и 0-значения элементами)
возможным примером вывод:
head(rep)
id X1 X2
1 01 0 0
2 02 60 60
3 03 90 0
4 01 0 0
5 02 0 60
6 03 90 0
У меня проблемы с определением аргумента prob=
в sample()
для строк.
Любая идея?