PHP单词边界/b正则表达式不适用于法语

2022-03-29 00:00:00 regex php preg-replace preg-match french

我正在尝试将句子"ça vous dit qui"与正则表达式模式匹配:

$pattern=(".$value.")

单词边界适用于除法语独占字符以外的任何字符,如ça开头的ç。我可以通过更改PHP区域设置来解决单词边界问题,如下所示:

setlocale(LC_ALL, 'fr_FR');

当我这样做时,它成功地匹配了句子,但是所有的法语字符都显示为�,因此我得到:

�a vous dit quoi

有点烦人。解决一个问题只会制造另一个问题。我已经将html区域设置设置为:

<html xmlns="http://www.w3.org/1999/xhtml" lang="fr" xml:lang="fr" version="XHTML+RDFa 1.0" dir="ltr">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
不确定还需要做些什么来解决这个问题?如果所有区域设置都设置为法语,法语肯定会显示正常...?

编辑:我的服务器通过phpinfo将UTF-8显示为本地和主值的默认字符集。

编辑:此问题与建议的问题不相似,因为该问题根本不相似。答案可能是一样的,但任何人在谷歌上搜索我遇到的那种问题都不会找到这个问题,但他们会找到我的问题。我认为,人们开始将问题标记为重复问题,只是为了这样做。

这个问题也与我的问题相似,因为答案是相同的: regular expression for French characters 但这会使这三个问题都重复。


解决方案

修复??似乎是一场噩梦在法语语言环境中显示,但我能够通过修改正则表达式模式以另一种方式修复这个问题。通过在Patter中添加‘u’作为修饰符,它能够检测到法语字符çinça,并且无需更改区域设置即可正常工作。

从这里:

$pattern=(".$value.")

至此:

$pattern=(".$value."/u)

相关文章