gstの正規表現
日本語も使えるんだ。今更気付いた。(遅すぎ)
#!/usr/bin/env gst | string rwStr | string := 'aてdigすlBaーa95Aj82とleぉぉぉ89348hg'. rwStr := ReadWriteStream on: ''. string onOccurrencesOfRegex: '[あ-ん]' do: [:regs | rwStr nextPutAll: regs match. ]. rwStr contents printNl.
もちろん、 '[^あ-ん]' とか 'ぉ{1,}' とかもちゃんとマッチする。自分の環境はUTF-8なのですが、他の環境だとどうなんだろう?
追記
ごめんなさい。正確にはこれはちゃんとマッチしているとは言えないかもしれない。日本語としてマッチしているんではなくて、 "$
おぉ!これはラッキー日本語使えるじゃん と早とちりしてしまった、おバカな俺でした。
さらに追記
とはいってもそこそこ日本語が使えるようなのでこれはこれで結構良い感じ。ちなみに、正規表現のエンジン部分はRubyのregex.cを使っているようです。