Я загрузил UTF-8 CSV файл с японскими иероглифами в нем, его ул, как это:R участки Х11 не могут показать CJK шрифты
> str(purchases)
'data.frame': 168996 obs. of 7 variables:
$ ITEM_COUNT : int 1 1 1 1 1 1 2 2 1 1 ...
$ I_DATE : Date, format: "2012-03-28" "2011-07-04" ...
$ SMALL_AREA_NAME: Factor w/ 55 levels "キタ","ミナミ他",..: 6 47 26 26 26 26 26 35 35 26 ...
$ USER_ID_hash : Factor w/ 22782 levels "0000b53e182165208887ba65c079fc21",..: 19467 7623 7623 7623 7623 7623 7623 7623 7623 7623 ...
$ COUPON_ID_hash : Factor w/ 19368 levels "000eba9b783cec10658308b5836349f6",..: 3929 8983 5982 5982 5982 5982 5982 2737 18489 5018 ...
$ category : Factor w/ 13 levels "Beauty","Delivery service",..: 2 3 2 2 2 2 2 7 2 3 ...
Так что я думаю, что нет ничего плохого в моей кодировке или локали (en_US.UTF-8)? Но когда я занимаюсь с
> barplot(table(purchases$SMALL_AREA_NAME))
Почему японские символы превращаются в маленькие блоки?
Я думаю, что у меня есть шрифт для отображения символов японского
> names(X11Fonts())
[1] "serif" "sans" "mono" "Times" "Helvetica"
[6] "CyrTimes" "CyrHelvetica" "Arial" "Mincho"
Дополнительная информация:
> sessionInfo()
R version 3.2.2 (2015-08-14)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
Running under: OS X 10.10.5 (Yosemite)
locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] ggplot2_1.0.1