读书人

用java兑现提取指定网页中的表格数据

发布时间: 2011-12-24 23:03:24 作者: rapoo

用java实现提取指定网页中的表格数据
我想用java编程来实现抽取指定网站上的一些表格数据内容,比如买书的网站上,有新书发布,我想把所有的新书的信息提取出来,比如书名,作者,出版社等,请问如何实现?有谁有相关的源代码?谢谢

[解决办法]
提供一个思路吧,这种都属于页面抓取程序,分析一下你要抓的页面的源文件,定义一个取数据的区域,自己解析就可以了,至于如何页面抓取,可以到网上搜索一下,很多的
[解决办法]
把真个文件内容放入一个xml的document里,然后用做xml解析就行了。

读书人网 >Java Web开发

热点推荐