shtml include在utf-8编码下多出一行的问题 最合理解决方法

创建日期:2008年4月28日 来自:本站 浏览:953次 作者:aoaob

上次我写过一篇关于shtml include在utf-8编码下多出一行的问题,当时是采用css来解决的,不过当时根本没搞清楚问题的根本原因,后来我发现在ie5.0里面,还会出现一个小正方形的乱码,并且网页在百度快照里显示调用处多出来一个问号,也是乱码。

后来到处找资料还是知道原因了,原来是utf-8的签名导致的问题。

UTF-8签名(UTF-8 signature)也叫做BOM(Byte Order Mark),是UTF编码方案里用于标识编码的标准标记。如果多个文件设置了签名,在二进制流中就会包含多个UTF-8签名,而IE是无法识别多个UTF-8签名的,所以用一个空行来代替,在某些程序处理中还会出现一个类似“诺”的字符。

在UCS 编码中有一个叫做”ZERO WIDTH NO-BREAK SPACE”的字符,它的编码是FEFF。而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前,先传输 字符”ZERO WIDTH NO-BREAK SPACE”。这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的;如果收到FFFE,就表明这个字节流是Little- Endian的。因此字符”ZERO WIDTH NO-BREAK SPACE”又被称作BOM。

详情请参见这两篇文章:

http://www.xiaop.net/archives/2007/11/07/utf-8-signature-bom/

http://zxsv.com/post/246.html

还有W3C官方关于这个问题的说明:http://www.w3.org/International/questions/qa-utf8-bom

解决方法是去掉UTF-8文件的签名,EditPlus和Dreamweaver中均有相应的选项。以EditPlus为例:进入Tools->Preferences->Files,在UTF-8 signature选项中选择“Always remove signature”,重新保存文件即可。

如果模板采用包含的方法包含多个utf8文件需要用ultraedit保存时另存为功能,选择utf8 无bom格式保存即可。
另外,如果中文页面在html head标记中将title标记放在<meta http-equiv=”content-type” content=”text/html; charset=UTF-8″ />前面会导致页面空白。
所以utf8页面应该使用标准顺序

<meta http-equiv=”content-type” content=”text/html; charset=UTF-8″ />
<meta http-equiv=”content-language” content=”zh-CN” />
<meta name=”robots” content=”index,follow” />
<meta name=”keywords” content=”" />
<meta name=”description” content=”" />
<meta name=”rating” content=”general” />
<meta name=”author” content=”" />
<meta name=”copyright” content=”" />
<meta name=”generator” content=”" />
<title></title>

最合理解决方法:在<!--include file="name.html"-->之前输入<div style="display:none;">在所包含文件开始输入</div>

虽然啥都没去,但啥也不显示,并支持所有浏览器


责编:aoaob
相关搜索: shtml   include   utf-8   多出一行  
Google
嗷嗷毙技术网版权申明:大家可以自由转载我站点的文章,但原作者和来自我站的链接必须保留(非我站原创的,按照原来链接,自行链接)。文章版权归作者所有。
特别注意:本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有,文章若有侵犯作者版权,请与我们联系,我们将立即删除修改。
搜索 
Google