2016-12-06 1 views
2

У меня есть сценарий, какКак я могу обнаружить негерметичность кодировку UTF-8 в RStudio

a <- 1 
# A very long comment, perhaps copy paste from somewhere containing the word fit. 

и я хочу, чтобы искать, не UTF-8 кодировке. Как я могу сделать это в RStudio?

+0

кодировка без UTF-8 - это буквально все символы ASCII. вы это понимаете? – zerohero

+0

@zerohero ASCII содержится в UTF-8, если вы имеете в виду [это] (http://stackoverflow.com/questions/700187/unicode-utf-ascii-ansi-format-differences). Из wiki: обратная совместимость: однобайтовые коды используются только для значений ASCII с 0 по 127. В этом случае код UTF-8 имеет то же значение, что и код ASCII. Стартовый бит этих кодов всегда равен 0. Это означает, что текст ASCII действителен UTF-8, а UTF-8 может использоваться для парсеров, ожидающих 8-разрядный расширенный ASCII, даже если они не предназначены для UTF-8. Во всяком случае: я нашел решение - см. Ниже ... – Christoph

ответ

1

Я понял, ответ на самом деле прост: просто зайдите в Edit => Find (Strg + F) и найдите [^\x00-\x7F] + с включенным полем Regex в строке поиска.