如何提取或preg_place字符串中的中文字符?
我当前有一个字符串列表,如下所示
蘋果,香蕉,橙。
榴蓮, 啤梨
鳳爪,排骨,雞排
24個男,2個女,30個老人
我想要做的就是从这些字符串中分解出所有中文和字母数字字符。
如何将,
,
。
/
"
和空格等所有特殊字符替换为-
或_
然后用explode()
LIKE$str = explode("-",$str);
或$str = explode("_",$str);
提取所有汉字?
我目前有这样的RegEx
if(/^S[u0391-uFFE5 w]+S$/.test(value)).....
我将其修改为
$str = preg_replace("/^S[x{0391}-x{FFE5} w]+s+S$/u", "-", $str);
但似乎没有起作用.
在线示例:https://www.regex101.com/r/qR8aA6/1
编辑:我的预期输出(第一个字符串):
首先应替换为
蘋果-香蕉-橙-
或蘋果_香蕉_橙_
然后我可以用$str = explode("-",$str);
使它们最终变成:
Array
(
[0] => 蘋果
[1] => 香蕉
[2] => 橙
)
解决方案
您似乎想要这样的东西,
$txt = <<<EOT
蘋果,香蕉,橙。
榴蓮, 啤梨
鳳爪,排骨,雞排
24個男,2個女,30個老人
EOT;
echo preg_replace('~[^p{L}p{N}
]+~u', '-', $txt);
输出:
蘋果-香蕉-橙-
榴蓮-啤梨
鳳爪-排骨-雞排
24個男-2個女-30個老人
DEMO
说明:
p{L}
匹配来自任何语言的任何种类的字母。p{N}
匹配任何脚本中的任何种类的数字字符。- 将所有内容放入求反的字符类将执行相反的操作。
相关文章