2012-07-31 4 views
3

Я пытаюсь преобразовать файл, созданный с mssql в utf-8. Когда я открываю вывод его mssql с помощью notepad ++ в Windows Server 2003 распознает файл как UCS-2LE Я скопировал файл на машину Ubuntu, используя file [file], это показывает, что кодировка UTF-16LE. На самом деле, сбитая с толку, в кодировке должна быть какая-то разница, так как имена разные. Но почему я вижу это в том же файле. Его файл .csv, созданный из запроса mssql.notepad ++ показывает ucs-2LE, а ubuntu FILE [файл] показывает UTF-16LE, я смущен?

+0

Старый вопрос, но я думаю, что ответ от benw правилен и должен быть отмечен как это - или есть ли что-то «открытое» для вас? –

ответ

5

По большей части UTF-16 и UCS-2 - это то же самое. Нет никакой разницы.

Это означает, что каждый символ имеет ширину в два байта. «LE» означает маленький конец, то есть каждый двухбайтовый символ сохраняется с младшим байтом.

Если вы хотите конвертировать в UTF-8, в Notepad ++ нажмите Convert to UTF-8 в меню Encoding, а затем сохраните.

Если ваши другие программы задушили файл после этого, или вы увидите два символа мусора в начале файла, а затем нажмите Convert to UTF-8 without BOM.

+0

Знаки UTF-16 также имеют ширину 2 байта. Почему 'файл [файл]' в Ubuntu показывает мне Utf-16LE? когда я вижу список кодировок 'iconv -l' распознает, я вижу оба доступных кодировки. Теперь я хочу знать, когда я конвертирую из этой кодировки в кодировку 'utf-8', какую кодировку я должен использовать в качестве кодировки входного файла? – tough

+0

Спасибо за ответ и редактирование, но я пытаюсь конвертировать в машину Ubuntu. Если вы внимательно прочитаете мое объяснение, вы увидите, что мне нужно выбрать один из двух кодировок, чтобы поместить его во входную кодировку для command 'iconv -f [входная кодировка] -t [выходное кодирование] [файл]'. Как бы вы предложили мне в этом случае? – tough

+0

Я преобразовал файл с помощью NOTEPAD ++ в UTF-8 WITHOUT BOM, но позже, когда я открываю файл. Он снова показывает, что кодировка должна быть ANSI вместо UTF-8 без кодировки BOM. – tough

 Смежные вопросы

  • Нет связанных вопросов^_^