正則表達式的內建支持通常只限于腳本語言如Ruby,Perl和awk等,這是一個恥辱:盡管正則表達式很神秘,但它是一個強大的文本處理工具。通過內建而不是通過程序庫接口來支持它,有很大的不同。
正則表達式只是一種指定字符模式的方法,這個字符模式會在字符串中進行匹配。在Ruby中,通常在斜線之間(/pattern/)編寫模式(pattern)來創建正則表達式。同時,Ruby就是Ruby,正則表達式是對象并且可以當作對象來操作。
前面那個斜線界定了這個模式,模式由要匹配的兩個子字符串組成,它們被管道符(|)分開。管道符意味著“要么右邊的字符串,要么左邊的字符串”。在這個例子中,它們分別是Perl或Python。就像在算術表達式中的那樣,可以在模式中使用括號,因此可以把模式寫成
也可以在模式中指定重復(repetition)。/ab+c/匹配一個含有a,后面跟著一個或多個b,其后是c的字符串。把模式中的加號改成星號,/ab*c/創建了一個匹配含有a,零個或多個b和然后是c的正則表達式
也可以在模式中匹配一組或多組字符。一些常見的例子是字符類(character classes)如\s,它匹配空白字符(空格符、制表符、回車換行符等等);\d 匹配任何數字;還有\w,它匹配會出現在一個詞內的任何字符。一個點(.)匹配幾乎任意字符。
一旦創建了模式,不去用它總不好意思。=~匹配操作符可以用正則表達式來匹配字符串。如果在字符串中發現了模式,=~返回模式的開始位置,否則它返回nil。這意味著可以在if和while語句中把正則表達式當作條件使用。比如,如果字符串包含了Perl或Python,下面的代碼輸出一條消息。
if line=~/Perl|Python/
puts "Scripting language mentioned:#{line}"
end
line.sub(/Perl/,'Ruby') #用'Ruby'替換第一個'Perl'
line.gsub(/Python/,'Ruby') #用'Ruby'替換所有的'Python'