用于删除多语言字符串上的特殊字符的正则表达式
建议用于删除特殊字符的最常见正则表达式似乎是-
preg_replace( '/[^a-zA-Z0-9]/', '', $string );
问题是它还会删除非英文字符。
是否有可删除所有语言上的特殊字符的正则表达式?或者,唯一的解决方案是显式匹配每个特殊字符并将其删除?
解决方案
您可以改用:
preg_replace('/P{Xan}+/u', '', $string );
p{Xan}
是Unicode表中任意字母中的数字或字母。
P{Xan}
不是数字或字母。它是[^p{Xan}]
相关文章