如何确保用户输入的包含国际字符的数据不会损坏?

2022-02-24 00:00:00 internationalization php mysql

即使MySQL数据库、表和字段的排序规则设置为utf8_General_ci,é等字符也经常转换为©。页面的Content-Type中的编码也设置为UTF8。

我知道UTF8_ENCODE/DECODE,但我不太确定在哪里以及如何使用它。

我已阅读";The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)";文章,但我需要一些MySQL/PHP特定指针。

如何确保用户输入的包含国际字符的数据不会损坏?


解决方案

乍一看http://www.nicknettleton.com/zine/php/php-utf-8-cheatsheet,我认为遗漏了一件重要的事情(可能我忽略了这件事)。 根据您的MySQL安装和/或配置,您必须设置连接编码,以便MySQL知道您期望在客户端(即MySQL连接的客户端,应该是您的PHP脚本)上使用什么编码。您可以通过手动发出

SET NAMES utf8

在发送到MySQL服务器的任何其他查询之前进行查询。

如果您在PHP端使用PDO,则可以使用

将连接设置为在每次(重新)连接时自动发出此查询
$db=new PDO($dsn, $user, $pass);
$db->setAttribute(PDO::MYSQL_ATTR_INIT_COMMAND, "SET NAMES utf8");

初始化数据库连接时。

相关文章