Где-то выше меня, «что-то» произошло, похожее на юникод. Один из симптомов заключается в том, что нижний регистр u umlaut (ü) преобразуется в «¼» (т.е. символ FC преобразуется в C3 BC). Предполагая, что я не контролирую этот процесс восходящего потока, как я могу перепрограммировать то, что происходит? И если это возможно, могу ли я закрутить колбасную машину назад и вернуть исходный текст?Как диагностировать и реверсировать (не предотвратить) Unicode mangling
(Если это помогает понять этот случай, то текст, который я получил, был в виде MySQL дамп. Я думаю, что somwewhere в процессе разгрузки/транспортировки он получил наломать.)
Спасибо - статья Википедии объяснила многое. По сути, у меня была строка (на Java), состоящая из символов, которые каким-то образом пропустили декодирование из UTF-8. Поэтому исправление в конце состояло из замены: x = results.getString ("field"); с x = новая строка (rs.getBytes («поле»), «UTF-8»); Предположительно, я найду более элегантный способ сделать это, но это большой шаг вперед, особенно в моем понимании. Спасибо, оба. –