正規表現とは?
正規表現とは、文字列(単語や文章などの文字の並び)を別の形式で表現する方法です。例えば"12345"という文字列は、[1-5]という形式の正規表現で表されます。
正規表現の形式には、ルールがあります。このルールにより、1つの正規表現だけで複数の文字列を表すことができます。
正規表現の[1-5]は、文字列の"12345"を表しています。
一方で、正規表現の[1-5]は、文字列の"54321"をも表しています。
はたまた、正規表現の[1-5]は、文字列の"15243"をも表しています。
文字列を扱うときに、他人が自由に決めた文字列を処理しなければならない、といった場合があります。処理する可能性がある文字列は、無数に考えられます。そんなとき、文字列のパターンとして短く書ける方法があると嬉しいですよね。
正規表現で書いた特定のルールをもつ形式のことを「パターン」と言います。
また、正規表現のパターンによって文字列を探し当てることができた場合、これを「マッチした」と言います。
正規表現は、特定のルールに従って文字列を判定するパターンマッチングの方法と言えます。