🦈

正規表現 : チートシート

に公開

正規表現 : チートシート

正規表現は、テキストデータの中から特定のパターンを持つ文字列を検索、置換、抽出するための強力なツールです。プログラミングやテキスト編集、データ分析など、様々な場面で活用できます。この記事では、正規表現の基本的な構文と、よく使われるパターンをまとめたチートシートをご紹介します。

基本的な正規表現

ワイルドカード

ワイルドカードは、任意の文字や文字の繰り返しに一致させるための記号です。

記号 意味
. 任意の1文字 (文字、数字、記号) に一致します。
? 直前の文字が 0回または1回出現する場合に一致します。
* 直前の文字が 0回以上出現する場合に一致します。
+ 直前の文字が 1回以上出現する場合に一致します。
| OR条件を作成します
縦線 (|) で区切られたいずれかの要素と一致します。
{n} 直前の要素とちょうどn回一致します。
{n,} 直前の要素とn回以上一致します。
{n,m} 直前の要素とn回以上m回以下で一致します。

アンカー

アンカーは、文字列の特定の位置に一致させるための記号です。

記号 意味
^ 文字列 (行) の先頭に一致します。
$ 文字列 (行) の末尾に一致します。

グループ

グループは、複数の文字をまとめて扱うための記号です。

記号 意味
() 囲まれた文字が同じ順序で文字列に含まれる場合に一致します。
他の正規表現をグループ化する場合にも使用します。
[] 囲まれた文字が任意の順序で文字列に含まれる場合に一致します。
- [ ] 角括弧内の文字範囲が文字列に含まれる場合に一致します。(例:[a-z]

エスケープ文字

エスケープ文字は、正規表現で特別な意味を持つメタ文字を、通常の文字として扱いたい場合に使用します。

記号 意味
\ 隣接する文字を正規表現のメタ文字としてではなく、通常の文字として解釈するよう指定します。

正規表現の使用例

以下に、日常的によく使用される正規表現のパターンをいくつか紹介します。

使用例 意味
[0-9] 0~9の数字。1文字
[0-9]* 0~9の数字。0文字以上の繰り返し
[0-9]+ 0~9の数字。1文字以上の繰り返し
[0-9]{2,3} 0~9の数字。2~3文字の繰り返し
[a-z] アルファベットの小文字。1文字
[A-Z] アルファベットの大文字。1文字
[a-zA-Z] アルファベット。1文字
[0-9a-zA-Z] 英数字。1文字
(char|short|int) char, short, int のいずれかに一致
[\s\t]+ スペースまたはタブ。1文字以上の繰り返し
[\r\n]+ 改行。\r または \n のいずれかに一致。1文字以上の繰り返し
^$[\r\n] 空行。先頭(^)と末尾($)、改行([\r\n])を表す
\(.*\) ( ) 丸括弧に挟まれた文字列に一致、丸括弧内は0文字以上(例:(x)
var(\s|\t)*= var= の間にスペースやタブが0個以上ある文字列(例:var =

Discussion