用于删除多语言字符串上的特殊字符的正则表达式

2022-03-22 00:00:00 regex php preg-replace

建议用于删除特殊字符的最常见正则表达式似乎是-

preg_replace( '/[^a-zA-Z0-9]/', '', $string );

问题是它还会删除非英文字符。

是否有可删除所有语言上的特殊字符的正则表达式?或者,唯一的解决方案是显式匹配每个特殊字符并将其删除?


解决方案

您可以改用:

preg_replace('/P{Xan}+/u', '', $string );

p{Xan}是Unicode表中任意字母中的数字或字母。
P{Xan}不是数字或字母。它是[^p{Xan}]

的快捷方式

相关文章