Я работаю в текстовой обработке с испанскими twitts, моя проблема в том, что у меня есть те же слова, но разными способами (с акцентом и без акцента), например: accion, acción.Уборка акцента в тексте twitter
Я пытался использовать кодировку: unicode «UTF-8», но не работает. моя библиотека библиотека (стринги) библиотеки (щебет) библиотеки (тм) библиотеки (Wordcloud) библиотека (RColorBrewer)
Пожалуйста, прочитайте информацию о [как задать хороший вопрос] (HTTP : //stackoverflow.com/help/how-to-ask) и как дать [воспроизводимый пример] (http://stackoverflow.com/questions/5963269). Это облегчит вам помощь другим людям. – zx8754
Что вы можете сделать, так это создать «базу данных» ударных символов и то, что они переводили. Затем примените это к индивидуальному твиту и «вымыть» символы с акцентом. Например, вы можете использовать 'sub'. –