大话HTML DOM与XML DOM的区别与联系
创始人
2024-07-13 10:11:29
0

本文内容的主题便是,为什么开发者要认为“DOM Level 1规范的架构”是至关重要的,其突出的重要性在哪里等等,以及还有HTML DOM和XML DOM之间微妙的区别及内在的联系。

51CTO推荐阅读:XML DOM新手入门指南

W3C所制订的DOM Level分为两大模块:Core和HTML。第一个大模块是Core核心,W3C规范是这样描述Core的:满足软件开发者和Web脚本编写者,访问和操控产品项目中包含的可解析的HTML和XML内容。

第二个HTML模块,规范描述为:HTML之中特定元素的功能,和恰到好处的、易用的、针对常见性任务的HTML文档操作机制。

以上可见两者的重要性。同时HTML模块的意义也在于,解决了向后兼容的问题,这在当今符合DOM Level 1的浏览器中已经可以提供适应的解决方案。

按照这样的说法,如果您仍然不能理解上述的要义,我们则可以这样认为,HTML文档可以使用Core API和HTML API两者;而XML文档只能使用Core API。换句话说,HTML与XML重叠的部分有Core API,而HTML API则是不能共享的部分,顾名思义限于HTML文档所使用。这是我们认识Core/HTML的初步认识。

理解DOM Level 1 Core

理解DOM Level 1 Core之要义实质在于将Core看待成为许多节点(Nodes)而组成的文档(Document),也就是说,此文档结构中可允许存在着大量的条目项,其每一项都可理解为“节点”。讨论该结构可以以两个方面入手:一、一切皆是节点对象(Node Object,扁平化的角度去理解,flattened view,乃适合于多态下的接口);二、每个对象继承于基类节点,实现了节点的接口(interface,OO继承的角度去理解)。请观察一下这段HTML:

  1. view plaincopy to clipboardprint?  
  2. Hello World
    
  • Hello World
  •   

    这是一个闭合的div标签。从DOM Level 1的层面来分析可以有以下几点内容:

    ◆标签div可作为“节点对象Node Object(扁平化角度,前面已述)”,或者元素对象Element OBject(继承的角度 - 元素继承于Node)。

    ◆节点属性id也可作为“节点对象Node Object(扁平化角度)”,或者属性对象Attr. OBject(继承的角度 - Attr继承于Node)。

    ◆文本“Hello world”也可作为“节点对象Node Object(扁平化角度)”,字符串对象CharacterData对象(继承的角度 - CharacterData继承于Node),Text文本对象(继承的角度 - Text继承于CharacterData)。

    稍微归纳一下,就是DOM 1 Core部分中一切皆是节点,节点以及其接口都可实现在每个对象身上(从继承的角度理解出发),实现了节点接口才可以有节点的属性、方法。——这是我们理解的前提。然后,根据特定的节点类型的不同,其接口的属性和方法都是不同的,视乎DOM对该节点的设计而定。

    理解DOM Level 1 HTML

    我们日常工作的时候,跟HTML文档打交道,其实就是属于W3C所规定的DOM Level 1 HTML模块内的处理工作。HTML DOM的特性和方法不是标准的DOM实现,是专门针对HTML同时也让一些DOM操作变的更加简便。HTML模块集中表现在HTMLElement接口上,即为全体元素类型的对象所实现的接口。就该文讨论的范围而言,HTMLElement接口的参与形式与上述的 Node节点接口非常地相似。一旦引入了OO设计观,只要实现了HTMLElement接口的对象,就可以定义它为元素了。一份HTML文档有相当多的都是元素,当然还有,表示文档本身的HTMLDocument和集合容器HTMLCollection等等。

    因此,要准确理解DOM 1 HTML的模块,必须认识其接口是基于元素的(Element-based),而不是基于节点的(Node-based)。那样的话,元素方式与节点方式到底又有什么区别呢(Element v.s Node),应该如何界定两者呢?例如节点属性(properties of elements),当在“基于元素”的语境中,就是“属性(attributes)”,并非独立的节点对象。——尽管按照某个角度讲,元素是节点的一种特例,我们仍可保留“节点”这一说法,一个标签(tag)便是一个 “节点”。假如我们要得到id属性的字符串的值是什么,采用DOM 1 Core的方式就是:

    1. view plaincopy to clipboardprint?  
    2. myElement.attributes["id"].value; // 从Node接口提供的属性    
    3. myElement.attributes["id"].value; // 从Node接口提供的属性  

    等于下面的方法:

    1. view plaincopy to clipboardprint?  
    2. myElement.getAttributes("id"); // 从Element实现的方法返回    
    3. myElement.getAttributes("id"); // 从Element实现的方法返回  

    但使用DOM 1 HTML方式的话,我们仅仅如此:

    1. view plaincopy to clipboardprint?  
    2. myElement.id;    
    3. myElement.id;  

    这般就可以获取id了。此时此刻,你可能会认为,XML文档本身就不一定缺省有id的属性,而因为有你所说的HTMLElement.id属性预先定义在API中,当然HTML中的每个元素就有id的属性啦——这里的意思没有错,也不妨碍我们的理解。的确全体的HTML元素均有id一项的属性,不管HTMLDivElement\HTMLImageElement\……

    Core or HTML Module?

    既然这样,那我应该使用Core的API,还是HTML模块的API?对于HTML的文档来说,用Core或HTML Moduel实际差别不大。本来我们一直都不太强调这种界定,以致忽略了它们细微的差异。如果我们觉得还是模棱两可的话,我们可进一步查探它们的明细。个人认为处理XHTML并使用Core API这样更能够说明XHTML的“X”,即表明这份HTML就是一份标准的XML文档,以便与原有HTML 4.1从语义上区别开来。但请记住,当处理一份XML结构的文档的时候,自然而然就是采用Core去处理。通过XHMLHttpRequest请求执行后所返回的responseXML结果,只能使用Core的API去处理分析,就不能够采用HTML的了。

    小结

    通过文本开发者应该明白到,HTML DOM与XML DOM之间,既有区别,又有联系。一般而言,除了上述比较外,须值得一提的就是,HTML是可以允许不Well-Form的,XML就不行。

    【编辑推荐】

    1. XML DOM新手入门指南
    2. 利用DOM解析XML文档实例
    3. JavaScript DOM的本质及操作方法

    相关内容

    热门资讯

    如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
    如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
    施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
    Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
    20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
    规避非法攻击 用好路由器远程管... 单位在市区不同位置设立了科技服务点,每一个服务点的员工都通过宽带路由器进行共享上网,和单位网络保持联...
    范例解读VB.NET获取环境变... VB.NET编程语言的使用范围非常广泛,可以帮助开发人员处理各种程序中的需求,而且还能对移动设备进行...
    德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...