读书人

正则婚配取某段汉字

发布时间: 2013-10-23 11:39:13 作者: rapoo

正则匹配取某段汉字

<div class="weatherMain">
<div class="weatherLeft">
<div class="weatherTop">
<h1 class="weatheH1" id="live">
今天是2013年10月8日 星期二 农历九月初四

<!--today5-->

<select class="weatherSelect" onchange="MM_jumpMenu('parent',this,0)">
<option>相关地区</option>


求问:正则表达式如何写?才能取出“今天是2013年10月8日 星期二 农历九月初四”
要直接取出来,尽量不要二次处理字符串。
困难在于 <h1 class="weatheH1" id="live">这个可以取出,但是不晓得如何取下一行,并且是汉字,而且前面有空格。
求教!
[解决办法]
用bs4来做吧
[解决办法]
一般来说,strip之类二次处理是少不免的,这个可以试试
re.findall(r'<h1[^>]+id="live">\s*([^<]+)\s*<', html, re.I)

读书人网 >perl python

热点推荐