正規表現:タグ間テキスト抜きだし。
但し、コレ1行に1セットタグがある場合のみ有効。
使うのは・・・
(?<=pattern) patternがこの位置の左に存在する場合にマッチ。
import re html = '<p>ここをぬきだす。</p>' matchObj = re.search(r'(?<=>)[^<]+', html) print matchObj.group()
但し、コレ1行に1セットタグがある場合のみ有効。
使うのは・・・
(?<=pattern) patternがこの位置の左に存在する場合にマッチ。
import re html = '<p>ここをぬきだす。</p>' matchObj = re.search(r'(?<=>)[^<]+', html) print matchObj.group()