读书人

在。net下提取网页的文本解决方案

发布时间: 2012-01-31 21:28:41 作者: rapoo

在。net下提取网页的文本
我想用C# 提取网页中的文本文字,请问要用什么方法啊?找了很多好像有关于IHTMLDocument2 和 Htmldocument 希望有好心人能提供完整点的代码。

[解决办法]
using System.IO;
using System.Net;

Stream instream = null;
StreamReader sr = null;
HttpWebResponse response = null;
HttpWebRequest request = null;
request = WebRequest.Create("http://www.sina.com.cn") as HttpWebRequest;
response = request.GetResponse() as HttpWebResponse;
instream = response.GetResponseStream();
sr = new StreamReader(instream, Encoding.UTF8);
//返回结果网页(html)代码
return sr.ReadToEnd();

读书人网 >C#

热点推荐