不用WEBBROWSER,如何只获取网页内容?
我要的内容是跟webbrowser.document.documentelement.outerText一样的内容,不包含代码,但因为webbrowser不用控制,而且比较慢,我想用其他方式获取,可以吗?请给代码,谢谢!
[最优解释]
Dim strHtml As String = Inet1.OpenURL("http://www.baidu.com", 0)
引用 Micosoft Internet Transfer Control
'去除html
'--------------------------------------------------------------
Public Function NoHtml(ByVal Str As String) As String
Dim Reg As RegExp
Set Reg = New RegExp
Reg.IgnoreCase = True
Reg.Global = True
Reg.Pattern = "(\<.[^\<]*\>)"
Str = Reg.Replace(Str, " ")
Reg.Pattern = "(\<\/[^\<]*\>)"
Str = Reg.Replace(Str, " ")
NoHtml = Str
Set Reg = Nothing
End Function
[其他解释]
用winsock获取,自己过滤<>.
[其他解释]
可以说很难啊 winsock什么的只是静态的 inet、xmlhttp之流的都只是静态的
[其他解释]
[其他解释]
“webbrowser不用控制”不知啥意思。
搜索下mshtml取网页的资料,看是不是你要的那类。
[其他解释]
自己写个HTTP客户端程序,这里有源码,解压后找WebClnt,下载地址:http://download.csdn.net/detail/geoff08zhang/4571358
[其他解释]
要想和webbrowser一样还是挺复杂的,因为页面有个js,有时网页打开后会有一系列的js事件触发,而导致你用webbrowser.document.documentelement.outerText和直接根据网址下载页面源代码的截然不同。
[其他解释]
用vb自带的INET控件获取 很方便
[其他解释]
网上的例子太多了,去找找吧。
[其他解释]
找不到啊.全部都是列代码的,我要的不是代码,即没有"<>"标签的那种啊.
[其他解释]
可以联系我们
[其他解释]
使用XMLHTTP组件最简单,代码如下:
Sub main()
Dim xmlHttp As Object
Set xmlHttp = CreateObject("MSXML2.XMLHTTP")
xmlHttp.open "GET", "http://www.baidu.com", False
xmlHttp.send
If xmlHttp.readyState = 4 And xmlHttp.Status = 200 Then
Debug.Print xmlHttp.responseText
End If
End Sub