|
|
2#

楼主 |
发表于 2009-11-23 10:46:47
|
只看该作者
mysqldump数据编码问题
|
mysql中的数据编码问题
mysql 4.1版本后,对编码的支持大大加强。有人曾建议,数据库字符集尽量使用utf8(utf-8),以使你的数据能很顺利的实现迁移,因为utf8字符集是目前最适合于实现多种不同字符集之间的转换的字符集,尽管你在命令行工具上无法正确查看数据库中的内容,依然强烈建议使用utf8作为默认字符集.
MYSQL的字符集缺省是latin1,现在将编码转为真正的utf8。
在mysql 命令行下或用 GUI工具执行sql 语句,这里以命令行为例:
mysql> show variables like ‘%character%’;应该会发现如下全部都是latin1,如果不是就不用改了。
- | character_set_client | latin1 |
- | character_set_connection | latin1 |
- | character_set_database | latin1 |
- | character_set_results | latin1 |
- | character_set_server | latin1 |
- | character_set_system | utf8 |
复制代码
然后修改/etc/my.cnf(windows 下请修改mysql.ini)
加入:- [mysqld]
- default-character-set=utf8
- [mysql]
- default-character-set=utf8
复制代码 重新启动mysql
再show variables like "%char%"如下所示:- | character_set_client | latin1 |
- | character_set_connection | latin1 |
- | character_set_database | utf8 |
- | character_set_results | latin1 |
- | character_set_server | utf8 |
- | character_set_system | utf8 |
- | character_sets_dir | /usr/share/mysql/charsets/ |
复制代码 如果希望character-set-client, character-set-results,character-set-connection也是utf8, 不知道在my.cnf中如何设置才能做到?
我目前都是先执行set names ‘utf8′,再作进一步查询。
执行set names ‘utf8′后,show variables "%char%", show variables "%collation%"显示所有的变量设置都是utf8的了。
另外:修改数据库编码可用如下命令
mysql> Alter DATABASE DEFAULT CHARACTER SET utf8;
接下来是完整的一个例子:
1.创建数据库表
mysql> CREATE DATABASE IF NOT EXISTS my_db default charset utf8 COLLATE utf8_general_ci;
#注意后面这句话 "COLLATE utf8_general_ci",大致意思是在排序时根据utf8变码格式来排序
#那么在这个数据库下创建的所有数据表的默认字符集都会是utf8了
mysql> create table my_table (name varchar(20) not null default ‘’)type=myisam default charset utf8;
#这句话就是创建一个表了,制定默认字符集为utf8
2.写数据
例子1是通过php直接插入数据:
a.php- <?php
- mysql_connect(’localhost’, 'user’, 'password’);
- mysql_select_db(’my_db’);
-
- //请注意,这步很关键,如果没有这步,所有的数据读写都会不正确的
- //它的作用是设置本次数据库联接过程中,数据传输的默认字符集
- mysql_query("set names utf8;");
-
- //必须将gb2312(本地编码)转换成utf-8,也可以使用iconv()函数
- mysql_query(mb_convet_encoding("insert into my_table values(’测试’);", "utf-8", "gb2312"));
- ?>
复制代码
例子是通过页面提交插入数据2:
b.php- <?php
- //输出本页编码为utf-8
- header("content-type:text/html; charset=utf-8");
-
- mysql_connect(’localhost’, 'user’, 'password’);
- mysql_select_db(’my_db’);
-
- if(isset($_REQUEST[’name’))
- {
- //由于上面已经指定本页字符集为utf-8了,因此无需转换编码
- mysql_query(sprintf("insert into my_table values(’%s’);", $_REQUEST[’name’]));
- }
-
- $q = mysql_query("select * from my_table");
- while($r = mysql_fetch_row($q))
- {
- print_r($r);
- }
- ?>
-
- <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
- <form action="" method="post">
- <input type="text" name="name" value="">
- <input type="submit" value=’submit’>
- </form>
复制代码
自此,使用utf8字符集的完整的例子结束了.
如果你想使用gb2312编码,那么建议你使用latin1作为数据表的默认字符集,这样就能直接用中文在命令行工具中插入数据,并且可以直接显示出来.而不要使用gb2312或者gbk等字符集,如果担心查询排序等问题,可以使用binary属性约束,例如:- create table my_table ( name varchar(20) binary not null default ‘’)type=myisam default charset latin1;
复制代码 附:旧数据升级办法
以原来的字符集为latin1为例,升级成为utf8的字符集。原来的表: old_table (default charset=latin1),新表:new_table(default charset=utf8)。
第一步:导出旧数据
- mysqldump –default-character-set=latin1 -hlocalhost -uroot -B my_db –tables old_table > old.sql
复制代码 第二步:转换编码
- iconv -t utf-8 -f gb2312 -c old.sql > new.sql
复制代码
在这里,假定原来的数据默认是gb2312编码。
第三步:导入
修改old.sql,增加一条sql语句: "SET NAMES utf8;",保存。
- mysql -hlocalhost -uroot my_db > new.sql
复制代码
大功告成!! |
|