使用HttpClient和iText下载slideshare上的文档
1、使用HttpClient获取页面HTML
2、解析HTML获取最大页数和第一页的图像地址
3、分别抓取各页的图像
4、使用iText将所有页面的图像做成PDF
前提是需FQ(PacketiX VPN)
发布时间: 2013-03-06 16:20:31 作者: rapoo
使用HttpClient和iText下载slideshare上的文档
1、使用HttpClient获取页面HTML
2、解析HTML获取最大页数和第一页的图像地址
3、分别抓取各页的图像
4、使用iText将所有页面的图像做成PDF
前提是需FQ(PacketiX VPN)