XML学习笔记(上)

来源:互联网  作者:本站整理
摘要:Copyright?2004本文遵从GNU的自由文档许可证(FreeDocumentLicense)的条款,欢迎转载、修改、散布。…

Chapter 5. XHTML

XHTML是W3C推荐的一种标准,它定义了一种与XML兼容的HTML版本。XHTML文档是一个有效的XML文档,所以编写格式比HTML严格。如果需从HTML文档转换成XHTML文档,需作以下更改:

在XHTML中不允许省略结束标签,所以需补齐缺少的标签。
元素需按正确的顺序嵌套。
所有元素和属性的名称都采用小写。
属性值需添加引号,如<p align="center">。
所有属性都需有属性值。
采用&和<等的实体形式表示这些字符。
确保文档有单一根元素,最好用html。
像<hr>这样的空元素要改成<hr/>或<hr><hr/>。
注释应由<! 注释 >的形式改成<!-- 注释 -->。
文档编码应采用UTF-8或UTF-16,或者添加XML声明指定文档的编码方式。
需去掉非标准的元素。如:marguee。

添加一个DOCTYPE声明,用PUBLIC来指向XHTML的三种DTD中的一种。分别是Strict、Transitional和Frameset,一般使用Strict。

Strict(严格型),W3C推荐的XHTML形式。不包括一些非标准的元素和属性,如applet和center等。声明方式如下:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
                   "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

Transitional(过渡型),一种不太严格的XHTML格式,可使用一些非标准的元素和属性,如applet和bgcolor等。声明方式如下:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
                   "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

Frameset(框架型),与过渡型DTD类似,允许使用与框架相关的元素,如frameset和iframe。声明方式如下:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
                   "http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd">

文档的根元素必须具有xmlns属性,标识缺省的名称空间提http://www.w3.org/1999/xhtml

下面是一个标准的XHTML文档的示例:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
                   "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns:"http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-type" content="text/html; charset=UTF-8">
<title>xhtml example</title>
</head>
<body>
...
</body>
</html>

由HTML转到XHTML是一种枯燥而乏味的工作,现在有一种叫tidy的开源工具可帮我们完成大部份的工作,它是一个C程序,使用方法如下:

% tidy --output-xhtml yes test.html test.xml

  XHTML 1.1把XHTML的三种DTD分成独立模块。我们可根据实际情况包含或省去某些模块。这些模块是:

Structure Module(结构模块)--->%xhtml-struct.module;,包含HTML文档主要的元素,如:html、head、title和body。
  Text Module(文本模块)--->%xhtml-text.module;,包含文本的基本元素和其内联元素,如:h1、h2、...、strong、span等。
  Hypertext Module(超链接模块)--->%xhtml-hypertext.module;,包含用于链接的元素,如:a元素。
  List Module(列表模块)--->%xhtml-list.module;,包含用于列表的元素,如:dl、dt、dd、ul、ol和li。
  Applet Module(applet模块)--->%xhtml-applet.module;,Java所需要元素,如:applet和param。
  Presentation Module(表示模块)--->%xhtml-pres.module;,面向表示的标记:b、big、hr、I、small、sub、sup和tt。
  Edit Module(编辑模块)--->%xhtml-edit.module;,用于修正的元素,如:del和ins。
  Bidirectional Text Module(文本方向模块)--->%xhtml-bdo.module;,用于指定文本阅读的方向,如bdo元素。
  Basic Forms Module(基本表单模块)--->%xhtml-basic-form.module;,用于HTML 3.2的表单元素,如:form、input、select、option和textarea。
  Forms Module(表单模块)--->%xhtml-form.module;,用于HTML 4.0的表单元素,如:form、input、select、option、textarea、button、fieldset、label、legend和optgroup。
  Basic Tables Module(基本表格模块)--->%xhtml-basic-table.module;,基本的表格元素,如:table、caption、th、tr和td。
  Table Module(表格模块)--->%xhtml-table.module;,安全功能的表格支持,如:table、caption、th、tr、td、col、colgroup、tbody、thead和tfoot。
  Image Module(图像模块)--->%xhtml-image.module;,包含img元素。
  Client-side Image Map Module(客户端图像映像模块)--->%xhtml-csismap.module;,包含map和area元素以及支持客户端图像映像所需要的元素的属性。
  Server-side-Image Map Module(服务器端图像映像模块)--->%xhtml-ssismap.module;,该模块没有添加新元素,但对img元素添加了一个ismap属性。
  Object Module(对象模块)--->%xhtml-object.module;,用于在网页中嵌入可执行内容,如:java程序。
  Param Module(参数模块)--->%xhtml-param.module;,网页中可执行内容中传递参数的param元素。
  Frames Module(框架模块)--->%xhtml-frames.module;,包含实现框架所需的元素,如:frame、frameset和noframes。
  Iframe Module(内联框架模块)--->%xhtml-iframe.module;,包含内联框架的iframe元素。
  Intrinsic Events(固有事件模块)--->%xhtml-events.module;,支持如onSubmit和onFocus等脚本的属性。
  Meta-information Module(元信息模块)--->%xhtml-meta.module;,包含meta元素。
  Scripting Module(脚本模块)--->%xhtml-script.module;,支持JavaScript等脚本。
  Stylesheet Module(样式表模块)--->%xhtml-style.module;,用于定义CSS的style元素。
  Link Module(链接模块)--->%xhtml-link.module;,指定外部文件,如样式表、库等关系的link元素。
  Base Modue(基模块)--->%xhtml-base.module;,包含base元素,指定解析相对URL所参照的基URL。
  Target Module(目标模块)--->%xhtml-target.module;,用于指定目标框架或框架中某个窗口的target属性。
  Style Attribute Module(样式属性模块)--->%xhtml-inlstyle.module;,将CSS样式应用于文档中单个元素的style属性。
  Name Identification Module(名称标识模块)--->%xhtml-nameident.module;,name属性是id属性的早期版本,现在不推荐使用。
  Legacy Module(传统模块)--->%xhtml-legacy.module;,不推荐使用的元素和属性,如:basefont、center、fonts、strike和u元素。
  Ruby Module(Ruby模块)--->%xhtml-ruby.module;,东亚文本中用于将少量文本放于正文文本旁边的ruby、rbc、rtc、rb、rt和rp元素,一般用来指示发音。

后续部分请见:XML学习笔记(下)

【相关文章】好搜一下
如何使用Visual C# 2005或Visual C# .NET向Excel工作簿传输数据

如何使用Visual C# 2005或Vis

本文分步介绍了多种从 Microsoft Visual C# 2005 或 Mi…