读书人

网络资料抓取

发布时间: 2012-12-21 12:03:49 作者: rapoo

网络文件抓取
1、java远程文件抓取,实现远程文件提取,静态生成。


2、php远程提取超链接,
package cn.com;import java.io.File;import java.io.RandomAccessFile;import java.util.ArrayList;import java.util.List;public class Test {public static void main(String[] args) {getText(new File("D:/Program Files/Apache Software Foundation/Apache2.2/htdocs/tun2/b2b"));System.out.println("ok");} public static void getText(File f){           File file[] = f.listFiles();           for(File dir : file){                 if(dir.isDirectory()){                   getText(dir);               }else{                                       try {                           RandomAccessFile raf = new RandomAccessFile(dir, "r");                           String strLine = null;                           while((strLine=raf.readLine())!=null){                               if((new String(strLine.getBytes("ISO-8859-1"),"utf8")).contains("show_bd_pics")){                            System.out.println(dir);                            break;                             }                         }                       } catch (Exception e) {                           e.printStackTrace();                       }               }                          }        }  }

读书人网 >编程

热点推荐