🦈
正規表現 : チートシート
正規表現 : チートシート
正規表現は、テキストデータの中から特定のパターンを持つ文字列を検索、置換、抽出するための強力なツールです。プログラミングやテキスト編集、データ分析など、様々な場面で活用できます。この記事では、正規表現の基本的な構文と、よく使われるパターンをまとめたチートシートをご紹介します。
基本的な正規表現
ワイルドカード
ワイルドカードは、任意の文字や文字の繰り返しに一致させるための記号です。
記号 | 意味 |
---|---|
. | 任意の1文字 (文字、数字、記号) に一致します。 |
? | 直前の文字が 0回または1回出現する場合に一致します。 |
* | 直前の文字が 0回以上出現する場合に一致します。 |
+ | 直前の文字が 1回以上出現する場合に一致します。 |
| | OR条件を作成します 縦線 (|) で区切られたいずれかの要素と一致します。 |
{n} | 直前の要素とちょうどn回一致します。 |
{n,} | 直前の要素とn回以上一致します。 |
{n,m} | 直前の要素とn回以上m回以下で一致します。 |
アンカー
アンカーは、文字列の特定の位置に一致させるための記号です。
記号 | 意味 |
---|---|
^ | 文字列 (行) の先頭に一致します。 |
$ | 文字列 (行) の末尾に一致します。 |
グループ
グループは、複数の文字をまとめて扱うための記号です。
記号 | 意味 |
---|---|
() | 囲まれた文字が同じ順序で文字列に含まれる場合に一致します。 他の正規表現をグループ化する場合にも使用します。 |
[] | 囲まれた文字が任意の順序で文字列に含まれる場合に一致します。 |
- |
[ ] 角括弧内の文字範囲が文字列に含まれる場合に一致します。(例:[a-z] ) |
エスケープ文字
エスケープ文字は、正規表現で特別な意味を持つメタ文字を、通常の文字として扱いたい場合に使用します。
記号 | 意味 |
---|---|
\ | 隣接する文字を正規表現のメタ文字としてではなく、通常の文字として解釈するよう指定します。 |
正規表現の使用例
以下に、日常的によく使用される正規表現のパターンをいくつか紹介します。
使用例 | 意味 |
---|---|
[0-9] | 0~9の数字。1文字 |
[0-9]* | 0~9の数字。0文字以上の繰り返し |
[0-9]+ | 0~9の数字。1文字以上の繰り返し |
[0-9]{2,3} | 0~9の数字。2~3文字の繰り返し |
[a-z] | アルファベットの小文字。1文字 |
[A-Z] | アルファベットの大文字。1文字 |
[a-zA-Z] | アルファベット。1文字 |
[0-9a-zA-Z] | 英数字。1文字 |
(char|short|int) |
char , short , int のいずれかに一致 |
[\s\t]+ | スペースまたはタブ。1文字以上の繰り返し |
[\r\n]+ | 改行。\r または \n のいずれかに一致。1文字以上の繰り返し |
^$[\r\n] | 空行。先頭(^ )と末尾($ )、改行([\r\n] )を表す |
\(.*\) |
( ) 丸括弧に挟まれた文字列に一致、丸括弧内は0文字以上(例:(x) ) |
var(\s|\t)*= |
var と = の間にスペースやタブが0個以上ある文字列(例:var = ) |
Discussion