Я пытаюсь извлечь данные из TXT-файла, который был закодирован в Юникоде, потому что в нем есть акценты (французские имена). Ниже приведена часть моего кода. Вывод строки postalCode имеет в ней странные маленькие квадраты (squareHsquare1square). Мое подозрение в том, что проблема связана с тем, что программа обрабатывает контент как ASCII. Кто-то, пожалуйста, указывайте мне в правильном направлении. Благодаря!Чтение unicode txt в java
Scanner in = new Scanner(new FileReader("postal_codes.txt"));
currentLine = in.nextLine();
//take first 6 char --> store as variable
postalCode = currentLine.substring(0, 5);
Что вы имеете в виду «закодированный в Unicode "? Unicode не является кодировкой. –
@ R.MartinhoFernandes Извините, если это утверждение было неверным; Я не гений. Я думаю, вы можете догадаться, что я имею в виду. – Ishikawa
Дело в том, что я не могу. Я могу сделать несколько образованных догадок, но нет никакого способа точно знать, какой он есть. –