Я хочу, чтобы сохранить титул в UTF-8, но страница придумывает много различной кодировки, такие как ГКИ, ISO, Unicode ......Как получить титул веб-страницы с CURL в PHP с веб-сайтов разных CHARSET?
Не мог бы вы дать мне некоторую помощь?
Спасибо.
Я хочу, чтобы сохранить титул в UTF-8, но страница придумывает много различной кодировки, такие как ГКИ, ISO, Unicode ......Как получить титул веб-страницы с CURL в PHP с веб-сайтов разных CHARSET?
Не мог бы вы дать мне некоторую помощь?
Спасибо.
Определить или определить кодировку символов и преобразовать данные в UTF-8, если необходимо.
Для HTML (то есть текст/HTML) есть three ways to specify the character encoding:
- параметр HTTP "кодировка" в поле "Content-Type".
- Объявление
META
с «http-equiv», установленное в «Content-Type» и значение, установленное для «charset».- Атрибут
charset
на элемент, который обозначает внешний ресурс.
Если ни один из них присутствует, вы могли бы сделать некоторое содержание нюхает или переключиться на какую-то символы по умолчанию кодировки (например, ISO 8859-1).
Если обозначенная/обнаруженная кодировка символов не является UTF-8, вы можете преобразовать данные в UTF-8 с iconv
или mb_convert_encoding
.