【正規表現】「正規表現」で「改行」を指定する方法

【正規表現】
「正規表現」で「改行」を指定する方法







はじめに



「正規表現」での
「改行」の仕方・指定方法などについてまとめています。


改行コードは、
\n」 「\r」 「\r\n」
という「3種類」の文字列。
「正規表現」では、
上記の「改行コード」のいずれかを指定して、
「改行」を「検索」「置換」することができるようになっている。


しかし、
「OS」によって、
利用している「改行コード」が異なる。

上記の3種類の内、いずれかを利用しているので、
すべて試してみれば見つかる。
「アプリ」によって異なることもある。

見つからない時は、
\(バックスラッシュ)」を「¥(円マーク)」に変えると使える「OS(Windows)」がある。



「OS」ごとの正規表現での「改行」コード

OS改行コード
「MacOS」の「改行」コード\n
古い「MacOS」の「改行」コード\r
「WindowsOS」の「改行」コード\r\n
いずれか1つの「改行」にマッチする正規表現\n | \r\n | \r
いずれか1つの「改行」にマッチする正規表現\n | \r\n | \r | ¥n | ¥r¥n | ¥r
「WindowsOS」での一部アプリの「改行」コード¥r¥n
「WindowsOS」での一部アプリの「改行」コード¥n


「正規表現」を利用していて、
かなりの頻度で必要になってくるのが「改行」なので、
「改行」コードを理解しておくことは必須になっています。


また、
「バックスラッシュ(\)」の入力方法も、
「OS」「アプリ」などによって、異なります。

「正規表現」「改行コード」などでは、
「バックスラッシュ(\)」は必須です。
「バックスラッシュ(\)」の入力方法も説明しています。



詳しくは、
下記で説明しています。
良かったら、ご参照ください。


Back

「改行」コードの種類


プログラムの中では、
「改行」コードの種類は、
下記のようになっています。
改行コード説明
\r 「CR(Carriage Return)」文字と呼ばれる制御文字。
「CR」が、印字装置を左端に戻す動作を意味している。
\n 「LF(Line Feed)」文字と呼ばれる制御文字。
「LF」が、紙を1行分スクロールする動作を意味している。
\r\n 「CR」と「LF」を両方の制御文字を使用するパターン。
色々な環境で対応できるようにするために、
両方の制御文を利用している「OS」「ファイル」もある。


複数の「改行」コードが存在していて、
使用している「OS」によって、「改行」コードは異なります。
「CR」と「LF」を組み合わせて使用している「OS」もある。


注意が必要で、
「OS」と「ファイル」の改行コードが別なケースもあります。

「ファイル」「アプリ」「ソフト」によっても、
「OS」の改行コードと異なるケースもある。


Back

「OS」別の「改行」コード


OS改行コード種類
Windows系OS\r\nCR+LF
Windows系OSアプリ¥r¥nCR+LF
Windows系OSアプリ¥nLF
MacOS\nLF (Line Feed)
古いMac OS(9以前)\rCR(Carriage Return)
Unix系OS\nLF (Line Feed)


「OS」だけでなく、
「ファイル」ごとでも、
使用している「改行」コードが、
「OS」のものとは異なることがあります。




Windowsでは、「¥n」「¥r¥n」も使えることがある

「WindowsOS」では、
「ソフト」「アプリ」などによっては、
「バックスラッシュ(\)」ではなく、
半角「¥」マークで、「改行」コードを記述しても、
「正規表現」で利用できることがあります。


「WindowsOS」は、
「バックスラッシュ(\)」記号の入力が、
「¥」記号と重複しているようで、
「バックスラッシュ(\)」と入力しても、
「¥」記号になってしまうことが多い。


「ソフト」「アプリ」では、それを見越して、
「¥」記号を「バックスラッシュ(\)」と見なしてくれるように、
設定されているものもある。

ちなみに、
「WindowsOS」以外では、
「¥」記号で記述しても、
「バックスラッシュ(\)」として見なしてくれない。
正規表現を「¥」記号で記述しても、
「Mac」「Linux]などでは、正規表現として扱ってくれない。


Back

【OS別】「バックスラッシュ(\)」記号の入力方法


まず、
「改行」コードを入力するのに、
「バックスラッシュ(\)」記号が必須となります。
使用頻度がそこそこある記号ですが、
各OSによって、入力方法が異なります。
ちょっと厄介な記号になっています。



「バックスラッシュ(\)」記号を入力するには、
下記のような入力キーを使用します。


「バックスラッシュ(\)」記号の入力キー

OS入力方法
Mac「Option」+「¥」
Windows (半角入力モード)で「\(ろ)」ボタンを押す。
「¥n」でも、「Windows」では「改行」コードとみなしてくれることもあるが、
正規表現では、「¥」マークではなく、
「バックスラッシュ(\)」記号が基本。


同じ「OS」でも、
アプリによって、「バックスラッシュ(\)」記号の扱いが異なり、
正しく入力をしても、
「¥(円マーク)」で表示されて、
「バックスラッシュ(\)」記号が表示されないようになっていることもあります。


Back

いずれか1つの「改行コード」に合致する正規表現


いずれか1つの「改行コード」に合致する正規表現は、
\n | \r\n | \r

\n | \r\n | \r | ¥n | ¥r¥n | ¥r
というように記述します。



「改行」コードの種類は、組み合わせも含めて、
「3種類」の改行コードが主に使われている。

改行コード種類OS
\nLFUnix系OS全般、Mac OS X
\rCR古いMac OS(9以前)
\r\nCR+LFWindows系OS

「正規表現」で「改行」を指定する時には、
どの「改行コード」でも問題ないように指定する方法がある。
すべての改行コードのいずれかにマッチするように記述する方法は、
下記のように記述する。

\n | \r\n | \r

「|(パイプ)」を使用することで、
いずれかの条件に合致する条件を記述することが可能。

「|(パイプ)」は、
「もしくは(or)」という意味なので、
\n | \r\n | \r
という表記は、

\n もしくは \r\n もしくは \r
\n or \r\n or \r
という意味を持つ「正規表現」コードとなっている。


「WindowsOS」や「一部アプリ」では、
\(バックスラッシュ)」の代わりに「¥(円マーク)」が使用されていることがあるので、
通常の「改行コード」に加え、
¥n | ¥r¥n | ¥r
という表記も必要になることがある。


Back

「Adobe DreamWeaver」で「改行」指定する「正規表現」


「Adobe DreamWeaver」で、
「改行」を指定するための「正規表現」は、
「WindowsOS」では、
通常の「改行コード」とは異なる。

\(バックスラッシュ)」の代わりに、
「¥(円マーク)」が使用されていることがある。



OS正規表現
改行コード
「バックスラッシュ(\)」の入力方法
WindowsOS\n LF
WindowsOS\r\n CR+LF
WindowsOS or 一部アプリ ¥n 本来であれば、
半角入力モードで「バックスラッシュ(\)」を入力するが、 「Windows」での「Adobe DreamWeaver」の「検索画面」では、 「バックスラッシュ(\)」が入力できない。
「円マーク(\)」で記述しても「正規表現」の「改行」として認識してくれる。
WindowsOS or 一部アプリ ¥r¥n 本来であれば、
半角入力モードで「バックスラッシュ(\)」を入力するが、 「Windows」での「Adobe DreamWeaver」の「検索画面」では、 「バックスラッシュ(\)」が入力できない。
「円マーク(\)」で記述しても「正規表現」の「改行」として認識してくれる。
Mac \n 「MacOS」で「バックスラッシュ」は、
「Option + ¥」
で入力ができる。


Back