【正規表現】「HTMLタグ」だけを指定する方法

【正規表現】
「正規表現」で「HTMLタグ」だけを指定する方法




「正規表現」で、
「HTMLタグ」だけを指定する方法をまとめています。


文章だけを抽出したりするときに、
「HTMLタグ」を削除したいことがある。

「HTMLタグ」だけを「正規表現」で指定して、
削除すると、とても簡単に、
文章だけが抽出できる。


簡単な操作なので、
覚えておくと便利。



詳しくは、
下記をご参照ください。



すべての「HTMLタグ」を指定する「正規表現」の記述方法


「正規表現」で、
すべての「HTMLタグ」を指定するには、
<{1}[^<]*>{1}
と記述する。



記述した「正規表現」の意味

正規表現意味
<{1}1個目の「<」にマッチする
[^<]*「<」以外の文字に何回でもマッチする
>{1}1個目の「>」にマッチする


Back

特定の「HTMLタグ」を指定する「正規表現」の記述方法


「正規表現」で、
特定の「HTMLタグ」を指定するには、
<{1}div[^>]*>{1}


<{1}div[^>]*>{1}
<{1}/div[^>]*>{1}

<{1}div[^>]*>{1}([^<]*)<{1}/div[^>]*>{1}
と記述する。



記述した「正規表現」の意味

正規表現意味
<{1}1個目の「<」にマッチする
div「div」という文字にマッチする
/div「/div」という文字にマッチする
[^<]*「<」以外の文字に何回でもマッチする
>{1}1個目の「>」にマッチする
([^<]*) 「開始タグ」と「終了タグ」の間に記述された
「<」以外の文字に何回でもマッチして、
「()」内にある文字は記憶しておく。


Back