查看完整版本: [-- JDOM /XPATH 基础教程 --]

风信Java论坛 ›› Java 基础开发 ›› JDOM /XPATH 基础教程 登录 -> 注册

1F JDOM /XPATH 基础教程   jastby Post by : 2009-06-29 11:03:28.0

XPATH遵循文档对象模型(DOM)的路径格式,由于每个XML文档都可以看成是一棵拥有许多结点的树,每个结点可以是以下七个类型之一:根(root)、元素(element)、属性(attribute)、正文(text)、命名空间(namespace)、处理指令(processing instruction)和注释(comment)。XPATH的基本语法由表达式构成。在计算表达式的值之后产生一个对象,这种对象有以下四种基本类型:节点集合、布尔型、数字型和字符串型 。XPATH基本上和在文件系统中寻找文件类似,如果路径是以"/"开头的,就表明该路径表示的是一个绝对路径,这和在UNIX系统中关于文件路径的定义是一致的。以"//"开头则表示在文档中的任意位置查找。

不谈泛泛的理论,学习XPATH还要从实例学起最为快捷,并有助于你举一反三。

下面的样例XML文档,描述了某台电脑中硬盘的基本信息(根节点<HD>代表硬盘,<disk>标签代表硬盘分区,从它的name属性可以看出有两个盘符名称为"C"和"D"的分区;每个分区下都包含<capacity>,<directories><files>三个节点,分别代表了分区的空间大小、目录数量、所含文件个数):

   xhtml代码
  1. <?xml version="1.0" encoding="UTF-8"?> 
  2. <HD> 
  3.  <disk name="C"> 
  4.      <capacity>8G</capacity> 
  5.      <directories>200</directories> 
  6.      <files>1580</files> 
  7.  </disk> 
  8.  <disk name="D">   
  9.      <capacity>10G</capacity> 
  10.      <directories>500</directories> 
  11.      <files>3000</files>   
  12.  </disk> 
  13. </HD> 

你在XML文档中使用位置路径表达式来查找信息,这些表达式有很多种组成方式。

结点元素的查找是你将要碰到的最频繁的查找方式。在上面这个XML文档例子中,根HD包含disk结点。你可以使用路径来查找这些结点,用正斜杠(/)来分隔子结点,返回所有与模式相匹配的元素。下面的XPATH 语句返回所有的disk元素:

/HD/disk

"*"代表"全部"的意思。/HD/* 代表HD下的全部节点。

下面的XPATH将返回任意节点下的名称为disk的全部节点:

//disk

下面的XPATH将返回名称为disk,name属性为'C'的全部节点:

/HD/disk[@name='C']

节点的附加元素,比如属性,函数等都要用方括号扩起来,属性前面要加上@号

下面的XPATH将返回文件个数为1580的files节点:

/HD/disk/files[text()='1580']

大家注意到上面包含一个text(),这就是XPATH的一个函数,它的功能是取出当前节点的文本。

下面的XPATH将返回文件个数为1580的分区:

/HD/disk/files[text()='1580']/parent::*

最后的parent::*表示这个元素的所有的父节点的集合。

XPATH中一些有用的函数:

string concat (string, string, string*) 联接两个字符串
boolean starts-with (string, string) 判断某字符串是否以另一字符串开头
boolean contains (string, string) 判断某字符串是否包含另一字符串
string substring (string, number, number) 取子字符串
number string-length (string) 测字符串长度
number sum (node-set) 求和
number floor (number) 求小于此数的最大整数值
number ceiling (number) 求大于此数最小整数值

XPATH具有丰富的表达功能,上面这些已经基本够用,在你做项目中就会发现根据实际情况有许多查询需求,你应该参考本文最后提供的W3C发布的关于XAPH的官方资料进行查阅,我在这里只起一个抛砖引玉的作用,在下面的章节中,我们的应用范例将不会超出上面提到的这些内容

用JDOM解析XML

JDOM模型的全部类都在org.jdom.*这个包里,org.jdom.input.*这个包里包含了JDOM的解析器,其中的DOMBuilder的功能是将DOM模型的Document解析成JDOM模型的Document;SAXBuilder的功能是从文件或流中解析出符合JDOM模型的XML树。由于我们的上面提到的XML样例存储在一个名称为sample.xml的文件中,很显然我们应该采用后者作为解析工具。下面程序演示了jdom的基本功能,即解析一个xml文档,并挑选一些内容输出到屏幕上。

   java代码
  1. package com.test;  
  2.  
  3. import java.util.List;  
  4.  
  5. import org.jdom.Document;  
  6. import org.jdom.Element;  
  7. import org.jdom.input.SAXBuilder;  
  8.  
  9. public class Sample1 {  
  10.     public static void main(String[] args) throws Exception {  
  11.         SAXBuilder sb = new SAXBuilder();  
  12.         Document doc = sb.build("sample.xml");  
  13.         Element root = doc.getRootElement();  
  14.         List list = root.getChildren("disk");  
  15.         for (int i = 0; i < list.size(); i++) {  
  16.             Element element = (Element) list.get(i);  
  17.             String name = element.getAttributeValue("name");  
  18.             String capacity = element.getChildText("capacity");  
  19.             String directories = element.getChildText("directories");  
  20.             String files = element.getChildText("files");  
  21.             System.out.println("磁盘信息:");  
  22.             System.out.println("分区盘符:" + name);  
  23.             System.out.println("分区容量:" + capacity);  
  24.             System.out.println("目录数:" + directories);  
  25.             System.out.println("文件数:" + files);  
  26.             System.out.println("-----------------------------------");  
  27.         }  
  28.     }  

程序的输出结果:

磁盘信息:
分区盘符:C
分区容量:8G
目录数:200
文件数:1580
-----------------------------------
磁盘信息:
分区盘符:D
分区容量:10G
目录数:500
文件数:3000
-----------------------------------

这段程序采用了传统的解析方式,一级一级的从根节点到子节点逐个采集我们所需要的数据,中规中矩。试想如果这个树足够深,我们想取第5 0层第三个节点的数据(夸张了点,呵呵),那将是一场噩梦!下面的内容将轻松化解你的这一痛苦。

2F Re:JDOM /XPATH 基础教程   jastby Post by : 2009-06-29 11:11:31.0

说了那么多JDOM和XPATH的好处,终于到了英雄有用武之地的时候了。

JDOM的关于XPATH的api在org.jdom.xpath这个包里。看看这个包下,只有一个类,JDOM就是如此简洁,什么事都不故弄玄虚 的搞得 那么复杂。这个类中的核心的api主要是两个selectNodes()和selectSingleNode()。前者根据一个xpath语句返回一组节 点;后者根据一个xpath语句返回符合条件的第一个节点。

下面的程序我们用JDOM+XPATH实现了上一个程序同样的功能,你可以从中学到不少运用XPATH 的知识

   java代码
  1. package com.test;  
  2.  
  3. import java.util.List;  
  4.  
  5. import org.jdom.Document;  
  6. import org.jdom.Element;  
  7. import org.jdom.Text;  
  8. import org.jdom.input.SAXBuilder;  
  9. import org.jdom.xpath.XPath;  
  10.  
  11. public class Sample2 {  
  12.     public static void main(String[] args) throws Exception {  
  13.         SAXBuilder sb = new SAXBuilder();  
  14.         Document doc = sb.build("sample.xml");  
  15.         Element root = doc.getRootElement();  
  16.         List list = XPath.selectNodes(root, "/HD/disk");  
  17.         for (int i = 0; i > list.size(); i++) {  
  18.             Element disk_element = (Element) list.get(i);  
  19.             String name = disk_element.getAttributeValue("name");  
  20.             String capacity = ((Text) XPath.selectSingleNode(disk_element,"//disk[@name='" + name + "']/capacity/text()")).getTextNormalize();  
  21.             String directories = ((Text) XPath.selectSingleNode(disk_element,"//disk[@name='" + name + "']/directories/text()")).getTextNormalize();  
  22.             String files = ((Text) XPath.selectSingleNode(disk_element,"//disk[@name='" + name + "']/files/text()")).getTextNormalize();  
  23.             System.out.println("磁盘信息:");  
  24.             System.out.println("分区盘符:" + name);  
  25.             System.out.println("分区容量:" + capacity);  
  26.             System.out.println("目录数:" + directories);  
  27.             System.out.println("文件数:" + files);  
  28.             System.out.println("-----------------------------------");  
  29.         }  
  30.     }  

输出结果:

磁盘信息:
分区盘符:C
分区容量:8G
目录数:200
文件数:1580
-----------------------------------
磁盘信息:
分区盘符:D
分区容量:10G
目录数:500
文件数:3000
-----------------------------------

结语

技术在日新月异的发展。永远没有学过后,便可以一劳永逸的技术。XML的发展一日千里。W3C作为INTERNET方面的权威组织指导着互联网技术 的发展 方向。新技术的出现大都围绕着W3C制订的标准,但往往有些“旁门左道”的另类功法却能产生惊人的杀伤力。JDOM就是这众多旁门中的一朵奇葩。就像 J2EE大行其道的今天,有许多开源组织仍旧在默默的打造着自己的独家兵器,谁又能说在不久的将来,他们不会成为划时代的创造呢? 君不见Hibernate的兴起正在有力的震撼着J2EE中EJB架构的基石。只要是成型的框架,必然有薄弱的软肋。新的技术只要能攻入对方这一弱点,便 可在业界站一席之地。本文只起抛砖引玉的作用,相信读者在吃过这道快餐之后,一定会发现窗外有更美丽的风景等待我们去游历。


风信Java论坛 ›› Java 基础开发 ›› JDOM /XPATH 基础教程 登录 -> 注册

查看完整版本: [-- JDOM /XPATH 基础教程 --]
CopyRight © 2008-2009 JavaWind.Net Studio All Rights Reserved
Powered By JWind.BBS Vesion 1.0.0 Beta1 Processed in 9 ms,0 (Queries)  Gzip enabled
粤ICP备07511478号