读书人

dom4j引见与基本使用

发布时间: 2012-12-21 12:03:50 作者: rapoo

dom4j介绍与基本使用

介绍

?

dom4j是一个Java的XML API,类似于jdom,用来读写XML文件的。dom4j是一个非常非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件,可以在SourceForge上找到它。在IBM developerWorks上面可以找到一篇文章,对主流的Java XML API进行的性能、功能和易用性的评测,dom4j无论在那个方面都是非常出色的。如今你可以看到越来越多的Java软件都在使用dom4j来读写XML,特别值得一提的是连Sun的JAXM也在用dom4j。这是必须使用的jar包, Hibernate用它来读写配置文件。

?

  <books>

  <!--This is a test for dom4j, holen, 2004.9.11-->

  <book show="yes">

  <title>Dom4j Tutorials</title>

  </book>

  <book show="yes">

  <title>Lucene Studing</title>

  </book>

  <book show="no">

  <title>Lucene in Action</title>

  </book>

  <owner>O'Reilly</owner>

  </books>

  这是一个很简单的XML文档,场景是一个网上书店,有很多书,每本书有两个属性,一个是书名,一个为是否展示[show],最后还有一项是这些书的拥有者[owner]信息。

  <books><!--This is a test for dom4j, holen, 2004.9.11--><book show="yes"><title>Dom4j Tutorials</title></book><book show="yes"><title>Lucene Studing</title></book><book show="no"><title>Lucene in Action</title></book><owner>O'Reilly</owner></books>

  Iterator iter = list.iterator();

  while(iter.hasNext()){

  Attribute attribute = (Attribute)iter.next();

  if(attribute.getValue().equals("yes")){

  attribute.setValue("no");

  }

  }

  /**

  * 修改内容之二: 把owner项内容改为Tshinghua

  * 并在owner节点中加入date节点,date节点的内容为2004-09-11,还为date节点添加一个属性type

  */

  list = document.selectNodes("/books/owner" );

  iter = list.iterator();

  if(iter.hasNext()){

  Element ownerElement = (Element)iter.next();

  ownerElement.setText("Tshinghua");

  Element dateElement = ownerElement.addElement("date");

  dateElement.setText("2004-09-11");

  dateElement.addAttribute("type","Gregorian calendar");

  }

  /** 修改内容之三: 若title内容为Dom4j Tutorials,则删除该节点 */

  list = document.selectNodes("/books/book");

  iter = list.iterator();

  while(iter.hasNext()){

  Element bookElement = (Element)iter.next();

  Iterator iterator = bookElement.elementIterator("title");

  while(iterator.hasNext()){

  Element titleElement=(Element)iterator.next();

  if(titleElement.getText().equals("Dom4j Tutorials")){

  bookElement.remove(titleElement);

  }

  }

  }

  try{

  /** 将document中的内容写入文件中 */

  XMLWriter writer = new XMLWriter(new FileWriter(new File(newfilename)));

  writer.write(document);

  writer.close();

  /** 执行成功,需返回1 */

  returnValue = 1;

  }catch(Exception ex){

  ex.printStackTrace();

  }

  }catch(Exception ex){

  ex.printStackTrace();

  }

  return returnValue;

  }

  说明:

  List list = document.selectNodes("/books/book/@show" );

  list = document.selectNodes("/books/book");

  上述代码通过xpath查找到相应内容。

  通过setValue()、setText()修改节点内容。

  通过remove()删除节点或属性。

5. 格式化输出和指定编码

  默认的输出方式为紧凑方式,默认编码为UTF-8,但对于我们的应用而言,一般都要用到中文,并且希望显示时按自动缩进的方式的显示,这就需用到OutputFormat类。

  /**

  * 格式化XML文档,并解决中文问题

  * @param filename

  * @return

  */

  public int formatXMLFile(String filename){

  int returnValue = 0;

  try{

  SAXReader saxReader = new SAXReader();

  Document document = saxReader.read(new File(filename));

  XMLWriter writer = null;

  /** 格式化输出,类型IE浏览一样 */

  OutputFormat format = OutputFormat.createPrettyPrint();

  /** 指定XML编码 */

  format.setEncoding("GBK");

  writer= new XMLWriter(new OutputStreamWriter(new FileOutputStream("filename"),format.getEncoding()),format);

  writer.write(document);

  writer.close();

  /** 执行成功,需返回1 */

  returnValue = 1;

  }catch(Exception ex){

  ex.printStackTrace();

  }

  return returnValue;

  }

  说明:

  OutputFormat format = OutputFormat.createPrettyPrint();

  这句指定了格式化的方式为缩进式,则非紧凑式。

  format.setEncoding("GBK");

  指定编码为GBK。

  XMLWriter writer = new XMLWriter(new FileWriter(new File(filename)),format);

  这与前面两个方法相比,多加了一个OutputFormat对象,用于指定显示和编码方式。

读书人网 >编程

热点推荐