Delphi XEでSkRegExpを使って正規表現を使用する

Delphi用正規表現ライブラリ「SkRegExp」について調べました。

SkRegExpとは

SkRegExpはDelphi 2005以降で使えるDelphi用正規表現ライブラリです。

Delphiで書かれていてDLLが不要なので手軽に使用でき、標準ライブラリのTRegExよりも高速で、日本語特有の処理に対応していて、ラインセスはMPL 1.1で利用できる、すばらしいライブラリです。

こちらのページからダウンロードできます。

日本語特有の処理を行う

最初に、SkRegExpの特徴である日本語特有の処理を見てみましょう。

全角と半角を同一視して照合する

修飾子「k」はカタカナとひらがなを同一視して照合します。

var
  regex: TRegEx;
  match: TMatch;
  matches: TMatchCollection;
begin
  matches := TRegEx.Matches('テスト、てすと', '(?k)テスト');

  for match in matches do
  begin
    Writeln(Format('%s (%d, %d)',[match.Value, match.Index, match.Length]))
  end;

実行結果

テスト (1, 3)
てすと (5, 3)

###全角と半角を同一視して照合する

修飾子「w」は全角と半角を同一視して照合します。

var
  match: TMatch;
  matches: TMatchCollection;
begin
  matches := TRegEx.Matches('TEST、TEST、TEST', '(?w)TEST');

  for match in matches do
  begin
    Writeln(Format('%s (%d, %d)',[match.Value, match.Index, match.Length]))
  end;
end;

実行結果

TEST (1, 4)
TEST (6, 4)
TEST (11, 4)

SkRegularExpressionsユニット

SkRegularExpressions.pasを使うと、TRegExと同じインターフェイスで使うことができます。
TRegExからの移行も簡単です。

SkRegularExpressionsユニットをusesして使用します。

uses SkRegularExpressions

サンプルコードは「Delphi XEのTRegExで正規表現を使用する」とほとんど同じです。

SkRegularExpressions.TRegEx.IsMatchメソッド 入力文字列に一致が存在するか

クラスメソッドを使う例

if TRegEx.IsMatch('Delphi', '[A-Z]+') then
  ShowMessage('Match');

インスタンスメソッドを使う例

var
  regex: TRegEx;
begin
  regex := TRegEx.Create('[A-Z]+');
  if regex.IsMatch('Delphi') then
    ShowMessage('Match');

SkRegularExpressions.TRegEx.Matcheメソッド 正規表現に一致する最初の文字列を取得する

MatcheメソッドはTMatchレコードを返します。

クラスメソッドを使う例

var
  match: TMatch;
begin
  match := TRegEx.Match('Delphi XE', '[A-Z]+');
  ShowMessage(
    Format('%s (%d, %d)',
      [match.Value, match.Index, match.Length])); //=> D (1, 1)

インスタンスメソッドを使う例

var
  regex: TRegEx;
  match: TMatch;
begin
  regex := TRegEx.Create('[A-Z]+');
  match := regex.Match('Delphi XE');
  ShowMessage(
    Format('%s (%d, %d)',
      [match.Value, match.Index, match.Length])); //=> D (1, 1)

TMatchのNextMatchメソッドで次の一致した文字列を取得できます。

var
  regex: TRegEx;
  match: TMatch;
begin
  regex := TRegEx.Create('[A-Z]+');
  match := regex.Match('Delphi XE');
  ShowMessage(
    Format('%s (%d, %d)',
      [match.Value, match.Index, match.Length])); //=> D (1, 1)

  //次の一致
  match := match.NextMatch;
  ShowMessage(
    Format('%s (%d, %d)',
      [match.Value, match.Index, match.Length])); //=> XE (8, 2)

TMatchのSuccessプロパティで一致したかどうかを調べることができます。

var
  regex: TRegEx;
  match: TMatch;
begin
  regex := TRegEx.Create('[A-Z]+');
  match := regex.Match('Delphi XE');
  while match.Success do
  begin
    ShowMessage(match.Value);
    match := match.NextMatch();
  end;

グループ化した正規表現に一致した文字列は、TMatchのGroupsプロパティで取得できます。

var
  match: TMatch;
  group: TGroup;
begin
  match := TRegEx.Match('2012/5/14', '(\d+)/(\d+)/(\d)');
  ShowMessage(IntToStr(match.Groups.Count)); //=> 4

  for group in match.Groups do
  begin
    ShowMessage(Format('%s (%d, %d)',
      [group.Value, group.Index, group.Length]));
  end;

出力結果

  2012/5/1 (1, 8)
  2012 (1, 4)
  5 (6, 1)
  1 (8, 1)

SkRegularExpressions.TRegEx.Matchesメソッド 正規表現に一致するすべての文字列を取得する

Matchesメソッドは、TMatchCollectionレコードを返します。

var
  match: TMatch;
  matches: TMatchCollection;
begin
  matches := TRegEx.Matches('Delphi XE', '[A-Z]+');
  ShowMessage(IntToStr(matches.Count));

  match := matches.Item[0];
  ShowMessage(
    Format('%s (%d, %d)',
      [match.Value, match.Index, match.Length])); //=> D (1, 1)

  match := matches.Item[1];
  ShowMessage(
    Format('%s (%d, %d)',
      [match.Value, match.Index, match.Length])); //=> XE (8, 2)

Matchesメソッドは、for in doに対応しています。

var
  regex: TRegEx;
  match: TMatch;
  matches: TMatchCollection;
begin
  regex := TRegEx.Create('[A-Z]+');
  matches := regex.Matches('Delphi XE');
  ShowMessage(IntToStr(matches.Count)); //一致した数

  for match in matches do
    ShowMessage(
      Format('%s (%d, %d)',
        [match.Value, match.Index, match.Length]));

SkRegularExpressions.TRegEx.Replaceメソッド 正規表現に一致した文字列を置き換える

//アルファベットの大文字を_に置き換える
s := TRegEx.Replace('Delphi XE', '[A-Z]', '_');
ShowMessage(s); //=> _elphi __

引数に関数を渡すことで、マッチした文字にあわせて置換する文字を指定できます。

(* マッチした数値に1を加える *)
function TForm1.IncNum(const Match: TMatch): string;
begin
  Result := IntToStr(StrToInt(Match.Value) + 1);
end;

//正規表現に一致した文字を関数処理して置き換える
var
  s: UnicodeString;
begin
  s := TRegEx.Replace('Delphi 2009', '\d+', IncNum);
  ShowMessage(s); //=> Delphi 2010

SkRegularExpressions.TRegEx.Splitメソッド 文字列を分割する

var
  splits: TStringDynArray;
  s: string;
begin
  //半角スペースかスラッシュで分割する
  splits := TRegEx.Split('Delphi C++Builder/RadPHP', '[ /]');
  for s in splits do
    Memo1.Lines.Add(s);

SkRegularExpressions.TRegEx.Escapeメソッド 特殊文字をエスケープする

var
  s: string;
begin
  s := TRegEx.Escape('C++');
  ShowMessage(s); //=> C\+\+

正規表現の文法を検証する

コンストラクタの引数にroCompiledを指定すると、正規表現をコンパイルします。
正規表現に問題があれば例外を投げます。

try
  TRegEx.Create(Edit1.Text, [roCompiled]);
except on E: Exception do
  ShowMessage(E.Message);
end;

コメント

  1. Pingback: 山本隆の開発日誌

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください