Как использовать слово в слово diff для текста на человеческом языке (на китайском языке)?git word diff на неэксплуатационный текст
У меня есть простой текст на китайском языке в репозитории git. Текст был отредактирован, и я хотел бы видеть, какие слова были добавлены/удалены. Одна строка в файле представляет собой целый абзац текста, поэтому простой git diff недостаточно: мы знаем, что что-то изменилось в определенном количестве абзацев, но мы не можем видеть, какие предложения/слова были изменены в нем.
Чтобы сделать материю хуже, как я уже сказал, текст на китайском языке. В отличие от английского и других индоевропейских языков, китайский язык не использует пробелы в качестве разделителя слов. Весь параграф вместе с китайскими знаками препинания делает единый блок без какого-либо пространства. Таким образом, git diff -word-diff не помогает вообще.
Есть ли способ иметь удобочитаемый diff между двумя версиями такого текста на китайском языке? Есть ли эквивалент -word-diff для каждого символа?
Спасибо, но в последний раз я проверил, у меня была такая же проблема, как один первоначально упоминалось выше: как я имею дело с многобайтных символов, я получил искаженный код вместо читаемого текста. – augustin