清理php中的句子

2022-03-22 00:00:00 string regex php preg-replace sanitization
这个标题听起来可能有些奇怪,但我想尝试设置这个preg_place,它可以为文本区域处理杂乱无章的编写者。它必须:

  1. 如果有感叹号,则不应该连续有另一个感叹号。
  2. 如果有.,则逗号获胜,并且必须是。
  3. 如果昏迷前有一个+空格,则应减为零。
  4. 句子不能以逗号开头或结尾。
  5. 相同字母连接在一起的字母不应超过2个。
  6. 逗号后必须始终出现空格。

例如:

  • ,我的房子是绿色的。很漂亮!
  • 我的房子…是绿色的,很漂亮!
  • 我的房子是绿色的,很漂亮!!

最终结果应始终为:

我的房子是绿色的,很漂亮!

是否有已构建的正则表达式来处理此问题?

解决方案签出下面FakeRainBrigand的solution!


解决方案

我可能必须将其用于我自己的站点.好主意!

<?php

$text = 'My hooouse..., which is greeeeeen , is nice!!!  ,And pretty too...';

$pats = array(
'/([.!?]s{2}),/', # Abc.  ,Def
'/.+(,)/',  # ......,
'/(!)!+/',   # abc!!!!!!!!
'/s+(,)/',  # abc   , def
'/([a-zA-Z])11/', # greeeeeeen
'/,(?!s)/'); 

$fixed = preg_replace($pats, '$1', $text);

echo $fixed;
echo "

";

?>

和$text的"修改"版本:"我的房子是绿色的,很漂亮!"

更新:这里是处理"abc,def"->"abc,def"的版本。

<?php

$text = 'My hooouse..., which is greeeeeen ,is nice!!!  ,And pretty too...';

$pats = array(
'/([.!?]s{2}),/', # Abc.  ,Def
'/.+(,)/',        # ......,
'/(!)!+/',         # abc!!!!!!!!
'/s+(,)/',        # abc   , def
'/([a-zA-Z])11/');      # greeeeeeen

$fixed = preg_replace($pats, '$1', $text);
$really_fixed = preg_replace('/,(?!s)/', ', ', $fixed);

echo $really_fixed;
echo "

";
?>

我会认为这有点慢,因为它是额外的函数调用。

相关文章