2015-09-21 8 views
0

Я загрузил UTF-8 CSV файл с японскими иероглифами в нем, его ул, как это:R участки Х11 не могут показать CJK шрифты

> str(purchases) 
'data.frame': 168996 obs. of 7 variables: 
$ ITEM_COUNT  : int 1 1 1 1 1 1 2 2 1 1 ... 
$ I_DATE   : Date, format: "2012-03-28" "2011-07-04" ... 
$ SMALL_AREA_NAME: Factor w/ 55 levels "キタ","ミナミ他",..: 6 47 26 26 26 26 26 35 35 26 ... 
$ USER_ID_hash : Factor w/ 22782 levels "0000b53e182165208887ba65c079fc21",..: 19467 7623 7623 7623 7623 7623 7623 7623 7623 7623 ... 
$ COUPON_ID_hash : Factor w/ 19368 levels "000eba9b783cec10658308b5836349f6",..: 3929 8983 5982 5982 5982 5982 5982 2737 18489 5018 ... 
$ category  : Factor w/ 13 levels "Beauty","Delivery service",..: 2 3 2 2 2 2 2 7 2 3 ... 

Так что я думаю, что нет ничего плохого в моей кодировке или локали (en_US.UTF-8)? Но когда я занимаюсь с

> barplot(table(purchases$SMALL_AREA_NAME)) 

Почему японские символы превращаются в маленькие блоки? R Plot

Я думаю, что у меня есть шрифт для отображения символов японского

> names(X11Fonts()) 
[1] "serif"  "sans"   "mono"   "Times"  "Helvetica" 
[6] "CyrTimes"  "CyrHelvetica" "Arial"  "Mincho"  

Дополнительная информация:

> sessionInfo() 
R version 3.2.2 (2015-08-14) 
Platform: x86_64-apple-darwin13.4.0 (64-bit) 
Running under: OS X 10.10.5 (Yosemite) 

locale: 
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8 

attached base packages: 
[1] stats  graphics grDevices utils  datasets methods base  

other attached packages: 
[1] ggplot2_1.0.1 

ответ

1

Вы можете посмотреть на showtext пакет, который позволяет использовать разные шрифты в R-графах. Он также поставляется с шрифтом CJK, который можно использовать напрямую.

Попробуйте запустить код ниже:

library(showtext) 
showtext.auto() 
## ... code to generate data 
barplot(table(purchases$SMALL_AREA_NAME))