Здесь я пытаюсь лома данных из Интернета (в URL), который находится в Hindi, но я получаю ответ, как этоткак металлолом хинди текст из Интернета с помощью PHP
\ u093f \ u0938 \
Как декодировать этот юникод? Пожалуйста, предложите мне, что делать с моим скриптом на PHP.
Этот скрипт работает правильно с английским текстом, так что происходит с английским. Я уже скрепил данные с этим скриптом. Я знаю, что это ответ dev nagri unicode, но как его декодировать.
Я новичок в PHP проблемы заранее спасибо
$i= 1;
for($i; $i < 6; $i++)
{
$html file_get_contents("http://www.jagran.com/jokes/child/jokes-1262211".$i.".html");
libxml_use_internal_errors(true);
$dom = new DOMDocument();
$dom->loadHTML($html);
libxml_clear_errors();
$nodes = $dom->getElementsByTagName('p');
$item = array();
$articles = array();
foreach ($nodes as $node) {
$item['msg'] = (strlen($node->nodeValue) > 20 ? $node->nodeValue : '');
$item['cat_id'] = 1;
if($item['msg'] !="")
$articles[] = array_unique($item);
}
$articles = json_encode($articles);
print_r($articles);
}
Место в заголовке –
user1844933
Этот ответ является _not_ юникода, что именно ваша проблема. Он экранирован, поскольку транспортный уровень или какой-либо другой элемент использует другую кодировку. Может ли быть, что ваша собственная система не поддерживает загрузку и настройку многобайтового расширения phps? – arkascha
@ arkascha это код devnagri для слов хинди – mishraoft