第Ⅰ篇 XML篇
第1章 XML
本章要点
•了解XML的起源
•弄清楚XML与HTML的区别
•学会使用XMLSpy
•了解XML的物理结构
•掌握XML的逻辑结构
•学会编写格式良好的XML文档
XML对我们来说已不再陌生,其相关概念和知识在网络上随处可见,有关XML的应用也越来越多。本章的目的是帮助读者快速了解和掌握XML,为后面章节的学习打下基础。
1.1 XML的起源
XML的全称是Extensible Markup Language,意思是可扩展的标记语言,它是标准通用标记语言(Standard Generalized Markup Language,SGML)的一个子集。那SGML又是什么呢?
在20世纪80年代早期,IBM提出在各文档之间共享一些相似的属性,例如字体大小和版面。IBM设计了一种文档系统,通过在文档中添加标记,来标识文档中的各种元素,IBM把这种标识语言称做通用标记语言(Generalized Markup Language,GML)。经过若干年的发展,1984年国际标准化组织(ISO)开始对此提案进行讨论,并于1986年正式发布了为生成标准化文档而定义的标记语言标准(ISO 8879),称为新的语言SGML,即标准通用标记语言。
SGML功能非常强大,是可以定义标记语言的元语言,然而由于SGML过于复杂,不适合在Web上应用,因此W3C组织在1996年便开始设计一种可扩展的标记语言,以便能将SGMlL的丰富功能与HTML的易用性结合到Web应用中。1998年2月10日,W3C发布了XML1.0标准,其目的是为了在Web上能以现有的超文本标记语言(HTML)的使用方式提供、接收和处理通用的SGML。XML是SGML的一个简化子集,它以一种丌放的、自我描述的方式定义了数据结构。在描述数据内容的同时能突出对结构的描述,从而体现出数据与数据之间的关系。
本书介绍的XML主要遵循W3C于2006年8月16日发布的。XML1.0**标准的第四版,读者可以在http://www.w3.org/TR/REC.xml/了解到此标准的详细内容。
W3C组织于2004年2月4日,发布了XML1.1的**标准,并于2006年8月16日发布了XML1.1**标准的第二版,这是*新的XML版本,不过由于目前大多数的应用还是基于XML1.0的**标准,因此本书也将遵照XML1.0规范来讲述。如果读者想要了解XML1.1规范的内容,可以参看网址:http://www.w3.orgfrR/2006/REC—xm111—20060816/。
……