读书人

经验2-XML约束-DTD精讲

发布时间: 2012-10-11 10:16:10 作者: rapoo

心得2--XML约束--DTD精讲

1.XML约束概述

l 什么是XML约束

在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。

l 为什么需要XML约束

l 常用的约束技术

? XML DTD

? XML Schema

2.DTD约束快束入门

l DTD(Document Type Definition),全称为文档类型定义

文件清单:book.xml

<?xmlversion="1.0" ?>

<!DOCTYPE 书架 SYSTEM "book.dtd">

<书架>

<书>

<书名>Java就业培训教程</书名>

<作者>redarmy</作者>

<售价>39.00元</售价>

</书>

<书>

<书名>JavaScript网页开发</书名>

<作者>redarmy</作者>

<售价>28.00元</售价>

</书>

</书架>

文件清单:book.dtd

<!ELEMENT书架 (书+)>

<!ELEMENT 书 (书名,作者,售价)>

<!ELEMENT 书名 (#PCDATA)>

<!ELEMENT 作者 (#PCDATA)>

<!ELEMENT 售价 (#PCDATA)>

DTD文件应使用UTF-8或Unicode

3.编程校验XML文档正确性

l IE5以上浏览器内置了XML解析工具:Microsort.XMLDOM,开发人员可以编写javascript代码,利用这个解析工具装载xml文件,并对xml文件进行dtd验证。

l 创建xml文档解析器对象

varxmldoc = new ActiveXObject("Microsoft.XMLDOM");

l 开启xml校验

xmldoc.validateOnParse= "true";

l 装载xml文档

xmldoc.load("book.xml");

l 获取错误信息

xmldoc.parseError.reason;

xmldoc.parseError.line

4.编写DTD约束的两种方式

l DTD约束即可以作为一个单独的文件编写,也可以在XML文件内编写。

<?xmlversion="1.0" encoding="UTF-8"standalone="yes"?>

<!DOCTYPE书架 [

<!ELEMENT 书架 (书+)> <!-- +号表示书架上有一本或多本书,相当于正则里的+,正则里的问号表示0、多个。-->

<!ELEMENT 书 (书名,作者,售价)> <!—这里的逗号表示这三个元素是按顺序出现的,如果这里用空格则表示没顺序。--> <!ELEMENT 书名 (#PCDATA)>

<!ELEMENT 作者 (#PCDATA)>

<!ELEMENT 售价 (#PCDATA)>

]>

<书架>

<书>

<书名>Java就业培训教程</书名>

<作者>redarmy</作者>

<售价>39.00元</售价>

</书>

...

</书架>

l XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:

当引用的文件在本地时,采用如下方式:

<!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">

例如: <!DOCTYPE 书架 SYSTEM “book.dtd”>。在xml文件中手写一下。

? 当引用的文件是一个公共的文件时,采用如下方式:

<!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">

例如:<!DOCTYPE web-app PUBLIC

"-//SunMicrosystems, Inc.//DTD Web Application 2.3//EN"

"http://java.sun.com/dtd/web-app_2_3.dtd">

可以不会自己写,但是一定要看得懂!!

5. DTD 的语法细节:元素定义

l 在DTD文档中使用ELEMENT声明一个XML元素,语法格式如下所示:<!ELEMENT 元素名称 元素类型> 元素类型可以是元素内容、或类型;

? 如为元素内容:则需要使用()括起来,如

<!ELEMENT 书架 (书名,作者,售价)>

<!ELEMENT 书名 (#PCDATA)>

元素内容中可以使用如下方式,描述内容的组成关系

? 用逗号分隔,表示内容的出现顺序必须与声明时一致。<!ELEMENT MYFILE(TITLE,AUTHOR,EMAIL)>

? 用|分隔,表示任选其一(或),即多个只能出现一个

<!ELEMENT MYFILE (TITLE|AUTHOR|EMAIL)>

在元素内容中也可以使用+、*、?等符号表示元素出现的次数:

+: 一次或多次 (书+)

?: 0次或一次 (书?)

*: 0次或多次 (书*)

也可使用圆括号( )批量设置,例

<!ELEMENT MYFILE((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>

? 如为元素类型,则直接书写,DTD规范定义了如下几种类型

? EMPTY:用于定义空元素,例如<br/> <hr/>

? ANY:表示元素内容为任意类型。

6. DTD的语法细节:属性定义

xml文档中的标签属性需通过ATTLIST为其设置属性

l 语法格式:

<!ATTLIST 元素名

属性名1 属性值类型 设置说明

属性名2 属性值类型 设置说明

……>

l 属性声明举例:

<!ATTLIST商品

类别 CDATA #REQUIRED

颜色 CDATA #IMPLIED>

l 对应XML文件:

<商品 类别="服装" 颜色="黄色">…</商品>

<商品 类别="服装">…</商品>

l 设置说明:

? #REQUIRED:必须设置该属性

? #IMPLIED:可以设置也可以不设置

? #FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值。但需要为该属性提供这个值

? 直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。

l 举例:

<!ATTLIST页面作者

姓名 CDATA #IMPLIED

年龄 CDATA #IMPLIED

联系信息 CDATA #REQUIRED

网站职务 CDATA #FIXED"页面作者"

个人爱好 CDATA "上网"

>

7.常用属性值类型

l CDATA:表示属性值为普通文本字符串

l ENUMERATED (枚举)

l ID

l ENTITY(实体)

属性值类型 ENUMERATED

l 属性的类型可以是一组取值的列表,在 XML 文件中设置的属性值只能是这个列表中的某个值(枚举),例子:

<?xmlversion = "1.0" encoding="GB2312"standalone="yes"?>

<!DOCTYPE购物篮 [

<!ELEMENT 肉 EMPTY>

<!ATTLIST 肉 品种 ( 鸡肉 | 牛肉 | 猪肉 | 鱼肉 ) "鸡肉">

]>

<购物篮>

<肉 品种="鱼肉"/>

<肉 品种="牛肉"/>

<肉/>

</购物篮>

属性值类型 ID

l 表示属性的设置值为一个唯一值。

l ID 属性的值只能由字母,下划线开始,不能出现空白字符

<?xmlversion = "1.0" encoding="GB2312" ?>

<!DOCTYPE联系人列表[

<!ELEMENT 联系人列表 ANY>

<!ELEMENT 联系人(姓名,EMAIL)>

<!ELEMENT 姓名(#PCDATA)>

<!ELEMENT EMAIL(#PCDATA)>

<!ATTLIST 联系人 编号 ID #REQUIRED>

]>

<联系人列表>

<联系人 编号="1">

<姓名>张三</姓名>

<EMAIL>zhang@it315.org</EMAIL>

</联系人>

<联系人 编号="2">

<姓名>李四</姓名>

<EMAIL>li@it315.org</EMAIL>

</联系人>

</联系人列表>

实体定义

l 实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了。

l 在DTD定义中,一条<!ENTITY …>语句用于定义一个实体。

l 实体可分为两种类型:引用实体和参数实体。

l 引用实体主要在 XML 文档中被应用

l 语法格式:

<!ENTITY 实体名称 “实体内容” >:直接转变成实体内容

l 引用方式:&实体名称;

l 举例:

<!ENTITY copyright “I am aprogrammer">

……

&copyright;

l 另一种方式:<!ENTITY 实体名称 SYSTEM “外部XML文档的URL” >:用一个文档所实体 

l 实体定义:参数实体

l 参数实体被 DTD 文件自身使用

l 语法格式:

<!ENTITY % 实体名称 "实体内容">

l 引用方式:

%实体名称;

l 举例1:

<!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址">

<!ELEMENT 个人信息 (%TAG_NAMES; | 生日)>

<!ELEMENT 客户信息 (%TAG_NAMES; | 公司名)>

l 举例2:

<!ENTITY% common.attributes

"id ID #IMPLIED

account CDATA #REQUIRED "

>

<!ATTLISTpurchaseOrder %common.attributes;>

<!ATTLISTitem %common.attributes;>

8. 综合案例:

(1)<?xmlversion="1.0"encoding="UTF-8"?>

<!--设计一个xml格式的文件,该文件能够表达出一个国家中的每个省及省长名称,每个省下面的每个市及市长名称,每个市下面的每个镇及镇长名称。 -->

<!DOCTYPEcountry[

<!ELEMENTcountry (capital,province+)>

<!ELEMENTcaptial (#PCDATA)>

<!ELEMENTprovince (province_captital|city+)>

<!ELEMENTprovince_captital (#PCDATA)>

<!ELEMENTcity (town+)>

<!ELEMENTtown (village+,town_mayor)>

<!ELEMENTvillage (#PCDATA)>

<!ELEMENTtown_mayor (#PCDATA)>

<!ATTLISTcountry chairman CDATA#FIXED "杨凯">

<!ATTLISTcapital capitaler CDATA#REQUIRED>

<!ATTLISTprovince provincer CDATA #REQUIRED>

<!ATTLISTprovince_captital pc CDATA #REQUIRED>

<!ATTLISTprovince name CDATA#REQUIRED>

<!ATTLISTcity city_mayor CDATA#IMPLIED>

<!ATTLISTcity name CDATA#REQUIRED>

<!ATTLISTcity age CDATA"100">

]>

<country>

<capital capitaler="yangkai"></capital>

<province provincer="yang"name="河南">

<province_captitalpc="郑州"></province_captital>

</province>

<province provincer="kai"name="河北">

<city name="邢台">

<town>

<village>沙河</village>

<town_mayor><杨凯></town_mayor>

</town>

</city>

<city name="保定">

<town>

<village></village>

<town_mayor>杨凯</town_mayor>

</town>

</city>

</province>

</country>

(2)<?xmlversion="1.0"encoding="UTF-8"?>

<!DOCTYPENEWSPAPER [

<!ELEMENTNEWSPAPER (ARTICLE+)>

<!ELEMENTARTICLE (HEADLINE,BYLINE,LEAD,BODY,NOTES)>

<!ELEMENTHEADLINE (#PCDATA)>

<!ELEMENTBYLINE (#PCDATA)>

<!ELEMENTLEAD (#PCDATA)>

<!ELEMENTBODY (#PCDATA)>

<!ELEMENTNOTES (#PCDATA)>

<!ATTLISTARTICLE AUTHOR CDATA#REQUIRED>

<!ATTLISTARTICLE EDITOR CDATA#IMPLIED>

<!ATTLISTARTICLE DATE CDATA#IMPLIED>

<!ATTLISTARTICLE EDITION CDATA#IMPLIED>

<!ENTITYNEWSPAPER "VervetLogic Times">

<!ENTITYPUBLISHER "VervetLogic Press">

<!ENTITYCOPYRIGHT "Copyright1998 Vervet Logic Press">

]>

<NESPAPER>

<ARTICLE AUTHOR="nn">

<HEADLINE></HEADLINE>

<BYLINE></BYLINE>

<LEAD></LEAD>

<BODY></BODY>

<NOTES></NOTES>

</ARTICLE>

<ARTICLE AUTHOR="nn"EDITOR="&PUBLISHER;"DATE="&COPYRIGHT;"EDITION="">

<HEADLINE>&NEWSPAPER;</HEADLINE>

<BYLINE></BYLINE>

<LEAD></LEAD>

<BODY></BODY>

<NOTES></NOTES>

</ARTICLE>

</NESPAPER>

读书人网 >XML SOAP

热点推荐