如何提取或preg_place字符串中的中文字符?

2022-03-23 00:00:00 regex php preg-replace

我当前有一个字符串列表,如下所示

蘋果,香蕉,橙。
榴蓮, 啤梨
鳳爪,排骨,雞排
24個男,2個女,30個老人

我想要做的就是从这些字符串中分解出所有中文和字母数字字符。 如何将,/"和空格等所有特殊字符替换为-_

然后用explode()LIKE$str = explode("-",$str);$str = explode("_",$str);提取所有汉字?

我目前有这样的RegEx

 if(/^S[u0391-uFFE5 w]+S$/.test(value)).....

我将其修改为

 $str = preg_replace("/^S[x{0391}-x{FFE5} w]+s+S$/u", "-", $str);

但似乎没有起作用.

在线示例:https://www.regex101.com/r/qR8aA6/1

编辑:我的预期输出(第一个字符串):

首先应替换为

蘋果-香蕉-橙-蘋果_香蕉_橙_

然后我可以用$str = explode("-",$str);使它们最终变成:

Array
    (
     [0] => 蘋果
     [1] => 香蕉
     [2] => 橙
     )

解决方案

您似乎想要这样的东西,

$txt = <<<EOT
蘋果,香蕉,橙。
榴蓮, 啤梨
鳳爪,排骨,雞排
24個男,2個女,30個老人
EOT;
echo preg_replace('~[^p{L}p{N}
]+~u', '-', $txt);

输出:

蘋果-香蕉-橙-
榴蓮-啤梨
鳳爪-排骨-雞排
24個男-2個女-30個老人

DEMO

说明:

  • p{L}匹配来自任何语言的任何种类的字母。
  • p{N}匹配任何脚本中的任何种类的数字字符。
  • 匹配换行符。
  • 将所有内容放入求反的字符类将执行相反的操作。

相关文章