前回、いろいろ追加してそれなりにフィルタリング出来るようになったと思っていたんですが、残念ながら取りこぼしがみょろーんと出てたのでまた拡張していこうと思います
まず敗因は元サイトのはてブコメントのこれ
quaoarTween(が使っている.NETの正規表現ライブラリ)では、文字クラスの範囲指定はJIS漢字順ではなくUnicode順([亜-黑] は “一” にマッチしない)だと思うんだけど…
まじか・・・知らなかったわー
で試してみたら「#一」がフィルタリングされない始末だったので、調べて拡張していきましょう
(#|#)[¥w]*[a-zA-Z0-9ぁ-ヶ亜-黑]
前回までがこれ。¥は半角で。これはJIS順な正規表現ライブラリでは問題ないんですが、TweenみたいなUnicode順な正規表現ライブラリだとアウアウ
悲しいのでこれにUnicode順でみて漢字範囲を割り当てていきます。めんどくさいんで一気に行くとこうなりました
(#|#)[¥w]*[a-zA-Z0-9ぁ-ヾ一-龥豈-鶴]
例の如く¥は半角で。きっとこれで良いはず・・・!きっと・・・!
Comments (0)