读书人

怎么抓取指定网站的文本图像内容

发布时间: 2012-04-20 15:27:03 作者: rapoo

如何抓取指定网站的文本图像内容
我想编写一个能抓取维基百科网页内容的程序,求助。
比如我提供一个检索关键词可以自动将维基百科中关键词所对应的网页下载到本地磁盘

[解决办法]
HttpRequest/HttpResponse/RegExp
[解决办法]
不知道,估计要好好看看WinInet文档 和 http 协议这些东西
[解决办法]
爬虫程序
[解决办法]
用python实现了一个抓取网页中所需内容的程序,根据正则表达式提取需要的内容,如果是文件,可以下载到本地。这个文件理论上可以是任何文件,包括:图片、txt,html等。

读书人网 >C++

热点推荐