求提取网页源代码中URL的正则表达式
我这里有两个:
"\"[hH][tT]{2}[pP]\\:/{2}.*?(\")"
用来获取如http://www.neusoft.com/...这样的URL。
"\"[hH][tT]{2}[pP]\\:/{2}.*?(?=((/)|(\")|(\\:)))"
用来获取如www.neusoft.com这样的URL。
但是应该不全,还有别的类型的
[解决办法]
能用字符串解决的,就用字符串解决吧
发布时间: 2013-03-04 17:22:12 作者: rapoo
求提取网页源代码中URL的正则表达式
我这里有两个:
"\"[hH][tT]{2}[pP]\\:/{2}.*?(\")"
用来获取如http://www.neusoft.com/...这样的URL。
"\"[hH][tT]{2}[pP]\\:/{2}.*?(?=((/)|(\")|(\\:)))"
用来获取如www.neusoft.com这样的URL。
但是应该不全,还有别的类型的
[解决办法]
能用字符串解决的,就用字符串解决吧