返回的PHP SimpleXML值使用奇怪的字符代替连字符和撇号

2022-07-16 00:00:00 xml php simplexml

我环顾了四周,似乎找不到解决方案,所以它就在这里。

我有以下代码:

$file = "adhddrugs.xml";
$xmlstr = simplexml_load_file($file);
echo $xmlstr->report_description;

这是简单的版本,但即使尝试这样做,任何连字符或撇号都会变成:^(欧元符号)商标符号。

我尝试的内容包括:

echo = (string)$xmlstr->report_description; /* did not work */
echo = addslashes($xmlstr->report_description); /* yes I know this doesnt work with hyphens, was mainly trying to see if I could escape the apostrophes */
echo = addslashes((string)$xmlstr->report_description); /* did not work */

还有htmlSpecial(我也知道连字符不起作用)、htmlentity和其他一些技巧。

现在的情况是,我从提要获取XML文件,所以我不能更改它们,但它们是非常标准的。带有连字符等的文本被封装在CDATA标记中,编码为UTF-8。如果我检查源代码,我会看到源代码中的连字符和撇号。

现在,为了查看编码是否关闭、标记错误或其他奇怪之处,我尝试查看原始的XML文件,并且确实正确显示了它。

我确信,在我急于寻找答案的过程中,我忽略了一些简单的东西,而事实上这是我第一次使用SimpleXML,我错过了一个非常简单的解决方案。别因为这件事把我拒之门外--我真的试着自己找到了答案。

再次感谢。


解决方案

您知道文档的字符集吗?

如果您尚未打印任何内容,则可以在打印之前header('Content-Type: text/html; charset=utf-8');执行此操作。

相关文章