PHP preg_place-保留指定字符+外语字母

2022-03-22 00:00:00 unicode php preg-replace

我需要一个函数,可以从字符串中删除所有字符(未在模式中列出),但保留外语字母。我知道preg_place有p"模式",但由于某些原因我无法使其工作。

我使用此函数删除字符串中的所有垃圾:

$main_content=preg_replace("/[^a-zA-Z0-9`~!@#$%^&*()-_=+\|,<.>/?;:'"[]s]/", "", $main_content); //remove all symbols that do NOT match these

简单地说,函数应该保留所有标准字母/数字和+-!@#$等标准符号,并删除©™等所有垃圾。如果有比我使用的更好的方式来编写这样的preg_place,请让我知道。

现在,我希望该函数保留外语字母,所以我将其修改为

$main_content=preg_replace("/[^p{L}a-zA-Z0-9`~!@#$%^&*()-_=+\|,<.>/?;:'"[]s]/", "", $main_content); //remove all symbols that do NOT match these

(您会注意到添加了p{L})。不幸的是,它没有像预期的那样工作。当我回显文本时,我看到外语没有被删除(这很好),但它们被转换为�(这很糟糕)。

我如何修复它?


解决方案

p{L}仅带u修饰符:

$main_content=preg_replace("/[^p{L}]/u", "", $main_content);

请注意/

后添加的u

相关文章