网站建设中的UTF-8编码问题总结

来源:互联网  作者:本站整理
网站建设中的UTF-8编码问题总结
摘要:一个网站如果需要国际化,实现更大范围更广区域内的影响,就需要将编码从GB2312转成UTF-8,其中有很多的问题需要注意,如果没有转换彻底,将会有很多的编码问题出现!…

内容提示:一个网站如果需要国际化,实现更大范围更广区域内的影响,就需要将编码从GB2312转成UTF-8,其中有很多的问题需要注意,如果没有转换彻底,将会有很多的编码问题出现!

主要有五个方面:

一、HTML页面转UTF-8编码问题

1.在<head>后,<title>前加入一行:

<meta http-equiv='Content-Type' content='text/html; charset=utf-8' />
  顺序不能错,一定要在<title>标签前加入,否则如果<title>与</title>之间有中文字符的话,显示的标题有可能是乱码!

2.html文件编码问题:

点击编辑器的菜单:&ldquo;文件&rdquo;->&ldquo;另存为&rdquo;,可以看到当前文件的编码,确保文件编码为:UTF-8,如果是ANSI,需要将编码改成:UTF-8。

3.HTML文件头BOM问题:

将文件从其他的编码转换成UTF-8编码时,有时候会在文件的最开始加上一个BOM标签,在个BOM标签可能会导致浏览器在显示中文的时候出现乱码。

删除这个BOM标签的方法:
  A.可以用Dreamweaver打开文件,并重新保存,即可以去除BOM标签!
  B.可以用EditPlus打开文件,并在菜单&ldquo;首选项&rdquo;->&ldquo;文件&rdquo;->"UTF-8标识",设置为:&ldquo;总是删除签名&rdquo;,然后保存文件,即可以去除BOM标签!

4.WEB服务器UTF-8编码问题:

如果你按以上所列的步骤做了,还是有中文乱码问题,请检查你的所使用的WEB服务器的编码问题如果你使用的是Apache,请将配置文件里的:charset 设成:utf-8(这里仅列出方法,具体格式请参考apache的配置文件)如果你使用的是Nginx,请将nginx.conf里的:charset  设成 utf-8,具体找到 "charset  gb2312;"或者类似的语句,改成:&ldquo;charset  utf-8;&rdquo;。

二、JS相关的UTF-8编码问题

1.JS读Cookie的中文乱码问题PHP写cookie的时候需要将中文字符进行escape编码,否则JS读到cookie中的中文字符将是乱码。

但php本身没有escape函数,我们新写一个escape函数:
  function escape($str){preg_match_all("/[\x80-\xff].

[\x01-\x7f]+/",$str,$r);$ar = $r[0];foreach($ar as $k=>$v){if(ord($v[0]) < 128)$ar[$k] = rawurlencode($v);else$ar[$k] = "%u".bin2hex(iconv("UTF-8","UCS-2",$v));}
  return join("",$ar);}
  JS读cookie的时候,用unescape解码,然后就解决cookie中有中文乱码的问题了。

2.外部JS文件UTF-8编码问题当一个HTML页面或则PHP页面包含一个外部的JS文件时,如果HTML页面或则PHP页面是UTF-8编码格式的文件,外部的JS文件同样要转成UTF-8的文件,否则将出现,没有包含不成功,调用函数时没有反应的情况。

点击编辑器的菜单:&ldquo;文件&rdquo;->&ldquo;另存为&rdquo;,可以看到当前文件的编码,确保文件编码为:UTF-8,如果是ANSI,需要将编码改成:UTF-8。

三、MYSQL数据库使用UTF-8编码的问题

1.用phpmyadmin创建数据库和数据表创建数据库的时候,请将&ldquo;整理&rdquo;设置为:&ldquo;utf8_general_ci&rdquo;
  或执行语句:
  CREATE DATABASE `dbname` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
  创建数据表的时候:如果是该字段是存放中文的话,则需要将&ldquo;整理&rdquo;设置为:&ldquo;utf8_general_ci&rdquo;,如果该字段是存放英文或数字的话,默认就可以了。
  相应的SQL语句,例如:
  CREATE TABLE `test` (`id` INT NOT NULL ,`name` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,PRIMARY KEY ( `id` )) ENGINE = MYISAM ;

2.用PHP读写数据库在连接数据库之后:
  $connection = mysql_connect($host_name, $host_user, $host_pass);加入两行:
  mysql_query("set character set 'utf8'");//读库mysql_query("set names 'utf8'");//写库就可以正常的读写MYSQL数据库了。

【相关文章】好搜一下
Firefox 3.5浏览器即将于6月30日正式发布

Firefox 3.5浏览器即将于6月30日

国外最新消息称,Mozilla发言人证实了将在6月30日也就是下周二正式发布Fi…