更新时间2018-07-18 15:10:26
text="<span><h2>Text</h2></span>"如果你只是想匹配标签里边的内容,用这个吧,(?<=>).*(?=<)可以匹配标签里边的内容。如果你用(),这个表示分组,$1表示结果里边的第一个匹配内容。*和+都是贪婪量词,前者匹配0次或多次,后者匹配1次或者多次。
text="<span><h2>Text</h2></span>"
par='<span>.*?<span>'
print(re.compile(par).findall(text)
为什么显示的是<h2>Text</h2>而不是<span><h2>Text</h2></span>?
上述回答都很好,统一,