Я предполагаю, что если у меня есть 2 идентичных кадра данных, функция дайджеста R должна вернуть тот же результат. Рассмотрим эти два кадра данных.Почему дайджест data.frame изменился после использования dplyr в R?
library(digest)
library(dplyr)
df1 <- tibble(a =1:5, b=11:15)
df2 <- df1 %>%
mutate(c=b-1) %>%
select(-c)
Оба data.frames идентичны при печати,
> df1
# A tibble: 5 × 2
a b
<int> <int>
1 1 11
2 2 12
3 3 13
4 4 14
5 5 15
или по сравнению:
> df1 ==df2
a b
[1,] TRUE TRUE
[2,] TRUE TRUE
[3,] TRUE TRUE
[4,] TRUE TRUE
[5,] TRUE TRUE
Однако функция возвращает переваривать различные результаты:
> digest(df1)
[1] "4f82aa1035792a0acf304242ce6ad3ec"
> digest(df2)
[1] "3b7e697af67e8e36ba9b59aef69db304"
I ожидал бы est, чтобы получить тот же результат !! Есть ли лучший способ сравнить идентичные data.frames?
Спасибо! 'All_equal()' должен сделать трюк на данный момент! Нарезка data.frame, вероятно, помогает, потому что порядок атрибутов изменяется, как указал Axeman. – Mathias