php domdocument中文乱码怎么办

  • 来源:网络
  • 更新日期:2020-08-17

摘要:php domdocument中文乱码的解决办法:首先打开相应的文件;然后进行编码声明,语句为“$dom->loadHTML(mb_convert_encoding($profile, 'HTML-ENTITIES','UTF-8')

php domdocument中文乱码的解决办法:首先打开相应的文件;然后进行编码声明,语句为“$dom->loadHTML(mb_convert_encoding($profile, 'HTML-ENTITIES','UTF-8'))”。

推荐:《PHP视频教程》

PHP DOMDocument loadHTML出现乱码的解决方法

DOMDocument::loadHTML默认编码是ISO-8859-1,所以我们需要做编码声明:

$dom->loadHTML(mb_convert_encoding($profile, 'HTML-ENTITIES', 'UTF-8'));

完整测试代码:

$profile = '<div><p>イリノイ州シカゴにて、アイルランド系の家庭に、9</p></div>';
$dom = new DOMDocument();
$dom->loadHTML(mb_convert_encoding($profile, 'HTML-ENTITIES', 'UTF-8'));
echo $dom->saveHTML($dom->getElementsByTagName('div')->item(0));

另一种方法是在loadHTML的字符前加上编码声明:

$dom->loadHTML('<?xml encoding="utf-8" ?>' . $profile);