【正規表現】「正規表現」で「改行」を指定する方法
【正規表現】
「正規表現」で「改行」を指定する方法
はじめに
「正規表現」での
「改行」の仕方・指定方法などについてまとめています。
改行コードは、
「
\n」
「
\r」
「
\r
\n」
という「3種類」の文字列。
「正規表現」では、
上記の「改行コード」のいずれかを指定して、
「改行」を「検索」「置換」することができるようになっている。
しかし、
「OS」によって、
利用している「改行コード」が異なる。
上記の3種類の内、いずれかを利用しているので、
すべて試してみれば見つかる。
「アプリ」によって異なることもある。
見つからない時は、
「
\(バックスラッシュ)」を「¥(円マーク)」に変えると使える「OS(Windows)」がある。
「OS」ごとの正規表現での「改行」コード
OS | 改行コード |
「MacOS」の「改行」コード | \n |
古い「MacOS」の「改行」コード | \r |
「WindowsOS」の「改行」コード | \r\n |
| |
いずれか1つの「改行」にマッチする正規表現 | \n | \r\n | \r |
いずれか1つの「改行」にマッチする正規表現 | \n | \r\n | \r | ¥n | ¥r¥n | ¥r |
| |
「WindowsOS」での一部アプリの「改行」コード | ¥r¥n |
「WindowsOS」での一部アプリの「改行」コード | ¥n |
「正規表現」を利用していて、
かなりの頻度で必要になってくるのが「改行」なので、
「改行」コードを理解しておくことは必須になっています。
また、
「バックスラッシュ(
\)」の入力方法も、
「OS」「アプリ」などによって、異なります。
「正規表現」「改行コード」などでは、
「バックスラッシュ(
\)」は必須です。
「バックスラッシュ(
\)」の入力方法も説明しています。
詳しくは、
下記で説明しています。
良かったら、ご参照ください。
Back
「改行」コードの種類
プログラムの中では、
「改行」コードの種類は、
下記のようになっています。
改行コード | 説明 |
\r |
「CR(Carriage Return)」文字と呼ばれる制御文字。
「CR」が、印字装置を左端に戻す動作を意味している。
|
\n |
「LF(Line Feed)」文字と呼ばれる制御文字。
「LF」が、紙を1行分スクロールする動作を意味している。
|
\r\n |
「CR」と「LF」を両方の制御文字を使用するパターン。
色々な環境で対応できるようにするために、
両方の制御文を利用している「OS」「ファイル」もある。
|
複数の「改行」コードが存在していて、
使用している「OS」によって、「改行」コードは異なります。
「CR」と「LF」を組み合わせて使用している「OS」もある。
注意が必要で、
「OS」と「ファイル」の改行コードが別なケースもあります。
「ファイル」「アプリ」「ソフト」によっても、
「OS」の改行コードと異なるケースもある。
Back
「OS」別の「改行」コード
OS | 改行コード | 種類 |
Windows系OS | \r\n | CR+LF |
Windows系OSアプリ | ¥r¥n | CR+LF |
Windows系OSアプリ | ¥n | LF |
| | |
MacOS | \n | LF (Line Feed) |
古いMac OS(9以前) | \r | CR(Carriage Return) |
| | |
Unix系OS | \n | LF (Line Feed) |
「OS」だけでなく、
「ファイル」ごとでも、
使用している「改行」コードが、
「OS」のものとは異なることがあります。
Windowsでは、「¥n」「¥r¥n」も使えることがある
「WindowsOS」では、
「ソフト」「アプリ」などによっては、
「バックスラッシュ(
\)」ではなく、
半角「¥」マークで、「改行」コードを記述しても、
「正規表現」で利用できることがあります。
「WindowsOS」は、
「バックスラッシュ(
\)」記号の入力が、
「¥」記号と重複しているようで、
「バックスラッシュ(
\)」と入力しても、
「¥」記号になってしまうことが多い。
「ソフト」「アプリ」では、それを見越して、
「¥」記号を「バックスラッシュ(
\)」と見なしてくれるように、
設定されているものもある。
ちなみに、
「WindowsOS」以外では、
「¥」記号で記述しても、
「バックスラッシュ(
\)」として見なしてくれない。
正規表現を「¥」記号で記述しても、
「Mac」「Linux]などでは、正規表現として扱ってくれない。
Back
【OS別】「バックスラッシュ(\)」記号の入力方法
まず、
「改行」コードを入力するのに、
「バックスラッシュ(
\)」記号が必須となります。
使用頻度がそこそこある記号ですが、
各OSによって、入力方法が異なります。
ちょっと厄介な記号になっています。
「バックスラッシュ(
\)」記号を入力するには、
下記のような入力キーを使用します。
「バックスラッシュ(\)」記号の入力キー
OS | 入力方法 |
Mac | 「Option」+「¥」 |
Windows |
(半角入力モード)で「\(ろ)」ボタンを押す。
「¥n」でも、「Windows」では「改行」コードとみなしてくれることもあるが、
正規表現では、「¥」マークではなく、
「バックスラッシュ(\)」記号が基本。
|
同じ「OS」でも、
アプリによって、「バックスラッシュ(
\)」記号の扱いが異なり、
正しく入力をしても、
「¥(円マーク)」で表示されて、
「バックスラッシュ(
\)」記号が表示されないようになっていることもあります。
Back
いずれか1つの「改行コード」に合致する正規表現
いずれか1つの「改行コード」に合致する正規表現は、
\n | \r\n | \r
\n | \r\n | \r | ¥n | ¥r¥n | ¥r
というように記述します。
「改行」コードの種類は、組み合わせも含めて、
「3種類」の改行コードが主に使われている。
改行コード | 種類 | OS |
\n | LF | Unix系OS全般、Mac OS X |
\r | CR | 古いMac OS(9以前) |
\r\n | CR+LF | Windows系OS |
「正規表現」で「改行」を指定する時には、
どの「改行コード」でも問題ないように指定する方法がある。
すべての改行コードのいずれかにマッチするように記述する方法は、
下記のように記述する。
\n | \r\n | \r
「|(パイプ)」を使用することで、
いずれかの条件に合致する条件を記述することが可能。
「|(パイプ)」は、
「もしくは(or)」という意味なので、
\n | \r\n | \r
という表記は、
\n もしくは \r\n もしくは \r
\n or \r\n or \r
という意味を持つ「正規表現」コードとなっている。
「WindowsOS」や「一部アプリ」では、
「
\(バックスラッシュ)」の代わりに「¥(円マーク)」が使用されていることがあるので、
通常の「改行コード」に加え、
¥n | ¥r¥n | ¥r
という表記も必要になることがある。
Back
「Adobe DreamWeaver」で「改行」指定する「正規表現」
「Adobe DreamWeaver」で、
「改行」を指定するための「正規表現」は、
「WindowsOS」では、
通常の「改行コード」とは異なる。
「
\(バックスラッシュ)」の代わりに、
「¥(円マーク)」が使用されていることがある。
OS | 正規表現 改行コード | 「バックスラッシュ(\)」の入力方法 |
WindowsOS | \n |
LF
|
WindowsOS | \r\n |
CR+LF
|
WindowsOS or 一部アプリ |
¥n
|
本来であれば、
半角入力モードで「バックスラッシュ(\)」を入力するが、
「Windows」での「Adobe DreamWeaver」の「検索画面」では、
「バックスラッシュ(\)」が入力できない。
「円マーク(\)」で記述しても「正規表現」の「改行」として認識してくれる。
|
WindowsOS or 一部アプリ |
¥r¥n
|
本来であれば、
半角入力モードで「バックスラッシュ(\)」を入力するが、
「Windows」での「Adobe DreamWeaver」の「検索画面」では、
「バックスラッシュ(\)」が入力できない。
「円マーク(\)」で記述しても「正規表現」の「改行」として認識してくれる。
|
| | |
Mac |
\n
|
「MacOS」で「バックスラッシュ」は、
「Option + ¥」
で入力ができる。
|
Back