2013年6月9日 星期日

用 PHP 正規表示式清除字串中的多餘空白

轉貼自:http://inspire.twgg.org/programming/php/item/340-php-regular-expression-with-a-string-of-extra-white-space-removed.html




我們經常會在PHP程序中處理來自用戶輸入或從數據庫中讀取的數據,可能在你的字符串中有多餘的空白或製表符,回車等。存儲這些額外的字符是有點浪費空間的。
如果您想要去掉字符串開始和結束的空白可以使用PHP內部函數trim() 。但是, 我們經常想完全清除空白。需要把開始和結束的空白清除掉,將多個空白變為一個空白,使用一個規則來處理同樣的類型的其它空白。
完成這些可以使用PHP的正規表示式來完成
下例可以去除額外Whitespace
<?php

$str = " This line  contains\tliberal \r\n use of   whitespace.\n\n";

// First remove the leading/trailing whitespace

//去掉開始和結束的空白

$str = trim($str);

// Now remove any doubled-up whitespace

//去掉跟隨別的擠在一塊的空白

$str = preg_replace('/\s(?=\s)/', '', $str);

// Finally, replace any non-space whitespace, with a space

//最後,去掉非space 的空白,用一個空格代替

$str = preg_replace('/[\n\r\t]/', ' ', $str);

// Echo out: 'This line contains liberal use of whitespace.'

echo "<pre>{$str}</pre>";

?>
上例一步一步的去掉所有的空白。首先我們使用trim()函數來去掉開始和結束的空 白。然後,我們使用preg_replace() 去除重複的。\s代表任何whitespace 。(?=) 表示向前查找 。它味著只匹配後面有和它本身相同字符的字符。所以這個正則表達式的意思是: "被whitespace 字符跟隨的任何whitespace 字符。" 我們用空白來替換掉,這樣也就去除了,留下的將是唯一的whitespace 字符。
最後, 我們使用另一個正則表達式[\n\r\t]來查找任何殘餘的換行符(\n), 回車(\r), 或製表符(\t) 。我們用一個空格來替換這些。

沒有留言:

張貼留言