У меня есть куча файлов со смесями кодировок в основном ISO-8859-1 и UTF-8.Поиск файлов ISO-8859-1 в кодировке?
Я хотел бы сделать все файлы UTF-8, но при попытке пакетного кодирования этих файлов с помощью iconv возникают некоторые проблемы. (Файлы сокращения наполовину, и т.д.)
Я supposse причина заключается в том, что Iconv требует, чтобы знать «от» кодирования, так что если команда выглядит так
iconv -f ISO-8859-1 -t UTF-8 in.php -o out.php
но «in.php», если уже кодируется UTF-8, что вызывает проблемы (исправьте меня, если я ошибаюсь)
Есть ли способ, чтобы я мог перечислять все файлы, кодировка которых не UTF-8?
UTF-8 файлов не должны «правильно», есть BOM (хотя на практике они часто делают. И UTF-8 кодировке BOM вполне может существовать начало файла ISO-8859-1 (это означало бы «ï» ¿») ... это, конечно, очень маловероятно. – bobince