1
кажется, что для больших N
(скажет 2e6
) cut2
функции в Hmisc
пакета выдает ошибкуИспользование cut2 в пакете Hmisc для большого N
y = cut2(rnorm(2000000,0,1),m=sqrt(2000000))
Error in if (cj == upper) next : missing value where TRUE/FALSE needed
In addition: Warning message:
In (1:g) * nnm : NAs produced by integer overflow
Я пытаюсь получить квантили моих данных, с m
точек в каждом квантиле, а также записывать конечные точки каждого квантиля. cut2
делает, но не очень хорошо для большой N
. Есть ли лучшие альтернативы?
Есть некоторые незначительные различия, как и я начинаю видеть. 'cut2' использует' m' как минимальное количество наблюдений в каждом бункере, тогда как 'cut3' заставляет каждый ящик иметь точно такое же количество наблюдений. Последнее приводит к тому, что некоторые наблюдения не помещаются в бункеры. Можно ли изменить это с помощью 'quantile' и' cut'? – stats134711