【正規表現】「HTMLタグ」だけを指定する方法
【正規表現】
「正規表現」で「HTMLタグ」だけを指定する方法
「正規表現」で、
「HTMLタグ」だけを指定する方法をまとめています。
文章だけを抽出したりするときに、
「HTMLタグ」を削除したいことがある。
「HTMLタグ」だけを「正規表現」で指定して、
削除すると、とても簡単に、
文章だけが抽出できる。
簡単な操作なので、
覚えておくと便利。
詳しくは、
下記をご参照ください。
すべての「HTMLタグ」を指定する「正規表現」の記述方法
「正規表現」で、
すべての「HTMLタグ」を指定するには、
<{1}[^<]*>{1}
と記述する。
記述した「正規表現」の意味
正規表現 | 意味 |
<{1} | 1個目の「<」にマッチする |
[^<]* | 「<」以外の文字に何回でもマッチする |
>{1} | 1個目の「>」にマッチする |
Back
特定の「HTMLタグ」を指定する「正規表現」の記述方法
「正規表現」で、
特定の「HTMLタグ」を指定するには、
<{1}div[^>]*>{1}
<{1}div[^>]*>{1}
<{1}/div[^>]*>{1}
<{1}div[^>]*>{1}([^<]*)<{1}/div[^>]*>{1}
と記述する。
記述した「正規表現」の意味
正規表現 | 意味 |
<{1} | 1個目の「<」にマッチする |
div | 「div」という文字にマッチする |
/div | 「/div」という文字にマッチする |
[^<]* | 「<」以外の文字に何回でもマッチする |
>{1} | 1個目の「>」にマッチする |
| |
| |
([^<]*) |
「開始タグ」と「終了タグ」の間に記述された
「<」以外の文字に何回でもマッチして、
「()」内にある文字は記憶しておく。
|
Back