ラベル 正規表現 の投稿を表示しています。 すべての投稿を表示
ラベル 正規表現 の投稿を表示しています。 すべての投稿を表示

2014年1月28日火曜日

正規表現で括弧に囲まれた部分を削除


確実に括弧が必ず閉じている,括弧の中に括弧が存在しないならば

・半角括弧と全角括弧の両方を削除

$patstr="\(.*?\)|(.*?)";
$repstr="";
$sourcestr="山田(ヤマダ)太郎(タロウ)";

$str=mb_ereg_replace($patstr, $repstr, $sourcestr);




参考サイト:
http://oshiete.goo.ne.jp/qa/5950836.html

2012年6月21日木曜日

正規表現+置換

 投資対効果の極めて高い、プログラムなんて分からない人のための「単純作業自動化」入門
 http://ryosukeishii.hatenablog.com/entry/2012/06/21/021503




•改行、タブなど特殊文字\n,\t,^,$
改行や、タブ区切りなどを表現するための特殊な記号が割り当てられています。 (次の2つはC言語などでもおなじみですね)
改行:\n
タブ区切り:\t
文の頭:^
文末:$
 たとえば
^1223\t
で検索すると、文頭すぐに1223があって、直後にタブがついているもののみヒットする、ということになります。

また、
検索:\n\n
置換:\n
で置換を行うと、改行が2つ入っているものを、1つにまとめる事ができるため

こんなふう↓ に
---------------
一行目テキスト

二行目テキスト

三行目テキスト

四行目テキスト
---------------
改行がたくさん入っているテキストを
こんなふう↓ に
---------------
一行目テキスト
二行目テキスト
三行目テキスト
四行目テキスト
---------------
改行を詰めることができます。
ちなみにこれを、
検索:\n
置換: (置換後は無し)
で置き換えると、
 --------------- 
一行目テキスト二行目テキスト三行目テキスト四行目テキスト
---------------
のように、文章からひとつも改行がなくなってしまいます。


また、
検索:\t
置換:,
のようにすると、タブ区切りのファイルを、カンマ区切りに変える事ができます。