POSIX 风格和兼容 Perl 风格两种正则表达式主要函数的类比(preg

1修饰符:好象未有讲 2神工鬼斧方式好象有个别少 举个例子?php
$cp=preg_replace(“@script(.*?)/script@is”,””,$cp);
$cp=preg_replace(“@iframe(.*?)/iframe@is”,””,$cp);
$cp=preg_replace(“@style(.*?)/style@is”,””,$cp);
?出现”@script(.*?卡塔尔/script@作者就迷糊 希望赢得协理,谢谢

三个空行,只怕蕴含,换行符, ,空格。对字符串实行管理时,难免会遭逢对空行进行拍卖。
1,替换空行,空行可回顾空格, ,t,f,n

首先来探访 POSIX 风格正则表明式的八个重要函数:

“@script(.*?卡塔尔国/script@非贪婪格局,意思是匹配script之后第叁个里头的事物,等价于@script([^]*State of Qatar/script@临时候必要[^]+?获取准确匹配。

$s = preg_replace(‘/(^(s| )*$)/m’, ”,$s); 
2,替换空行,只包蕴换行符

ereg 函数:(正则表明式相称)

$s = preg_replace(‘/(($nr*$)|(^nr*^))+/m’, ”,$s) 
3,替换空行,并将非空行的初始和末段的空格去掉

格式:int ereg ( string pattern, string string [, array &regs] )
小心:使用 Perl 宽容正则表明式语法的 preg_match(State of Qatar 函数平日是比 ereg(卡塔尔国越来越快的替代方案。(常常的话还是利用 preg_match(State of Qatar ,比较好勒~~)

$s = preg_replace(‘/^( |s)*|( |s)*$/m’, ”,$s); 
4,不相配空行,直接不相称空行,挺难的。其实不相配空行,就是相配非空行

以分别朗朗上口写的诀窍在 string 中探究与给定的正则表明式 pattern
所相称的子串。假如找到与 pattern
中圆括号内的子格局相相配的子串而且函数调用给出了第多个参数
regs,则相称项将被存入 regs 数组中。$regs[1]
满含第贰个左圆括号初叶的子串,$regs[2]
满含第三个子串,依此类推。$regs[0] 蕴含全体相称的字符串。

preg_match_all(‘/S+/m’,$s,$match); 
5,多行匹配实例

再次来到值:假如在 string 中找到 pattern 形式的合营则赶回
所相配字符串的尺寸,若无找到相称或出错则赶回
FALSE。若无传递入可选参数 regs 可能所相配的字符串长度为
0,则本函数重返 1。

$s = ” 
 
 test:
 11111
 22222
 
 33333333333333333333
 44444444444444444444
 “; 
 
$s = preg_replace(‘/(^(s| )*$)/m’, ‘<br>’,$s); 
 
$pa = “/test:(((s)*[^<]*)*)/i”; 
preg_match($pa,$s,$m); 
 
echo $m[1]; 
相称test行到上边多空行之间的内空,也是11111,22222
6,常用匹配格局
i 形式中的字符将同不常候匹配大小写字母
m 字符串视为多行
s 将字符串视为单行,换行符作为普通字符
x 将情势中的空白忽视
e preg_replace(卡塔尔 函数在轮番字符串中对逆向援用作正常的替换,将其充当 PHP
代码求值,并用其结果来替换所找寻的字符串。
A 强迫仅从指标字符串的开始初步相称
D 情势中的 $ 元字符仅非常目的字符串的结尾
U 相称如今的字符串
u 形式字符串被当成 UTF-8

来探视 ereg(卡塔尔国 函数的例子:

以下代码片断选取 ISO 格式的日期(YYYY-MM-DD)然后以 DD.MM.YYYY
格式展现:
复制代码 代码如下:

if (ereg (“([0-9]{4})-([0-9]{1,2})-([0-9]{1,2})”, $date, $regs))
{
echo “$regs[3].$regs[2].$regs[1]”;
} else {
echo “Invalid date format: $date”;
}
?>


ereg_replace 函数:(正则表明式替换)

格式:string ereg_replace ( string pattern, string replacement, string
string )
函数表明:
本函数在 string 中围观与 pattern 相配的有的,并将其替换为
replacement。
回到替换后的字符串。(若无可供替换的同盟项则会回到原字符串。)
假设 pattern 包蕴有括号内的子串,则 replacement 能够包蕴形如 \digit
的子串,这么些子串将被轮流为数字代表的第多少个括号内的子串;\0
则含有了字符串的整个内容。最多能够用七个子串。括号能够嵌套,此情况下以左圆括号来计量顺序。
借使未在 string 中找到匹配项,则 string 将相貌再次回到。
来寻访这么些函数例子吗:
1,上面的代码片断输出 “This was a test” 三遍:
复制代码 代码如下:

$string = “This is a test”;
echo str_replace(” is”, ” was”, $string);
澳门新葡亰娱乐官网,echo ereg_replace(“( )is”, “\1was”, $string);
echo ereg_replace(“(( )is)”, “\2was”, $string);
?>

要留意的某个是假设在 replacement
参数中使用了整数值,则也许得不到所期待的结果。那是因为ereg_replace()将把数字作为字符的队列值来讲解并接纳之。比方:
2,replacement 参数为整数时的例证:
复制代码 代码如下:

/* 无法生出出希望的结果 */
$num = 4;
$string = “This string has four words.”;
$string = ereg_replace(‘four’, $num, $string);
echo $string; /* Output: ‘This string has words.’ */
/* 本例专门的职业平常化 */
$num = ‘4’;
$string = “This string has four words.”;
$string = ereg_replace(‘four’, $num, $string);
echo $string; /* Output: ‘This string has 4 words.’ */
?>

3,将 U揽胜极光L 替换为超链接:
复制代码 代码如下:$text =
ereg_replace(“[[:alpha:]]+://[^<>[:space:]]+[[:alnum:]/]”,
“\0”, $text);

提示: preg_replace(卡塔尔 函数使用了 Perl 宽容正则表明式语法,通常是比
ereg_replace(State of Qatar 越来越快的代替方案。
再来看看 Perl 宽容正则表达式的五个重中之重函数:
preg_match 函数:(举行正则表明式相称)
格式:int preg_match ( string pattern, string subject [, array matches
[, int flags]] )
函数表明:
在 subject 字符串中追寻与 pattern 给出的正则表明式相相称的始末。
只要提供了 matches,则其会被搜寻的结果所填充。$matches[0]
将富含与一切方式相称的公文,$matches[1]
将富含与第一个捕获的括号中的子格局所相称的公文,就那样类推。
flags 能够是下列标识:
PREG_OFFSET_CAPTURE
只要设定本标志,对各样出现的卓绝结果也同一时候再次来到其专项的字符串偏移量。注意那改动了回去的数组的值,使个中的每种单元也是三个数组,当中第一项为匹配字符串,第二项为其偏移量。本标识自
PHP 4.3.0 起可用。
flags 参数自 PHP 4.3.0 起可用。
preg_match(卡塔尔(قطر‎ 再次来到 pattern 所相称的次数。要么是 0 次(未有相配)或 1
次,因为 preg_match(卡塔尔 在第一遍相称之后将结束找出。preg_match_all(卡塔尔(قطر‎则相反,会直接寻觅到 subject 的结尾处。假使出错 preg_match() 返回
FALSE。
Tips: 假如只想查看多个字符串是或不是含有在另二个字符串中,不要用
preg_match(卡塔尔。能够用 strpos(卡塔尔国 或 strstr(State of Qatar 代替,要快得多。
来拜会它的例子吗:
例 1. 在文书中搜求“php”:
复制代码 代码如下:

// 格局定界符前面包车型客车 “i” 表示不区分轻重缓急写字母的检索
if (preg_match (“/php/i”, “PHP is the web scripting language of
choice.”)) {
print “A match was found.”;
} else {
print “A match was not found.”;
}
?>

例 2. 研究单词“web”:
复制代码 代码如下:

/* 形式中的 b 表示单词的边界,由此唯有独立的 “web” 单词会被相称,
* 而不会相称举例 “webbing” 或 “cobweb” 中的一部分 */
if (preg_match (“/bwebb/i”, “PHP is the web scripting language of
choice.”)) {
print “A match was found.”;
} else {
print “A match was not found.”;
}
if (preg_match (“/bwebb/i”, “PHP is the website scripting language
of choice.”)) {
print “A match was found.”;
} else {
print “A match was not found.”;
}
?>

例 3. 从 UENVISIONL 中收取域名:
复制代码 代码如下:

// 从 U安德拉L 中收获主机名
preg_match(“/^(http://)?([^/]+)/i”,
“”, $matches);
$host = $matches[2];
// 从主机名中获得后边两段
preg_match(“/[^./]+.[^./]+$/”, $host, $matches);
echo “domain name is: {$matches[0]}n”;
?>

本例将出口:

domain name is: php.net

preg_replace 函数:(实行正则表明式的追寻和替换)
格式:mixed preg_replace ( mixed pattern, mixed replacement, mixed
subject [, int limit] )
函数表达:
在 subject 中找找 pattern 格局的分外项并替换为 replacement。固然钦点了
limit,则仅替换 limit 个门户极其,假若省略 limit 或许其值为
-1,则怀有的非常项都会被交换。
replacement 能够蕴涵 \n 方式或(自 PHP 4.0.4 起)$n
情势的逆向援用,首荐使用前面一个。每一个此种援引将被调换为与第 n
个被抓获的括号内的子形式所相配的公文。n 能够从 0 到 99,当中 \0 或 $0
指的是被全部格局所相配的文书。对左圆括号从左到右计数(从 1
初始)以得到子形式的数量。
对替换情势在叁个逆向援引前面随着叁个数字时(即:紧接在二个相称的形式前面的数字),不可能选用深谙的
\1 符号来代表逆向援引。譬如说 \11,将会使 preg_replace()搞不清楚是想要一个 \1 的逆向援引前面随着叁个数字 1 照旧三个 \11
的逆向援引。本例中的解决情势是使用 ${1}1。那会产生一个割裂的 $1
逆向援引,而使另三个 1 只是可是的文字。
来走访它的例证:
例 1. 逆向征引前面跟着数字的用法:
复制代码 代码如下:

$string = “April 15, 2003”;
$pattern = “/(w+) (d+), (d+)/i”;
$replacement = “${1}1,$3”;
print preg_replace($pattern, $replacement, $string);

/* Output

April1,2003
*/
?>

即使搜索到相称项,则会回到被交流后的 subject,否则重临原来不改变的
subject。
preg_replace(State of Qatar 的种种参数(除了 limit)都能够是一个数组。如果 pattern
和 replacement
都是数组,将以其键名在数组中现身的次第来进展管理。那不一定和目录的数字顺序雷同。假使应用索引来标志哪个
pattern 将被哪些 replacement 来替换,应该在调用 preg_replace(卡塔尔(قطر‎ 以前用
ksort(State of Qatar 对数组举办排序。
例 2. 在 preg_replace(卡塔尔 中运用索引数组:
复制代码 代码如下:

$string = “The quick brown fox jumped over the lazy dog.”;
$patterns[0] = “/quick/”;
$patterns[1] = “/brown/”;
$patterns[2] = “/fox/”;
$replacements[2] = “bear”;
$replacements[1] = “black”;
$replacements[0] = “slow”;
print preg_replace($patterns, $replacements, $string);

/* Output

The bear black slow jumped over the lazy dog.
*/
/* By ksorting patterns and replacements,
we should get what we wanted. */
ksort($patterns);
ksort($replacements);
print preg_replace($patterns, $replacements, $string);

/* Output

The slow black bear jumped over the lazy dog.
*/
?>

假设 subject 是个数组,则会对 subject
中的每一种品种施行找出和替换,并再次回到二个数组。
倘使 pattern 和 replacement 都以数组,则 preg_replace(卡塔尔(قطر‎会依次从当中分别收取值来对 subject 进行搜寻和替换。若是 replacement
中的值比 pattern 中的少,则用空字符串作为剩余的更替值。假使 pattern
是数组而 replacement 是字符串,则对 pattern
中的每一个值都用此字符串作为替换值。反过来则尚未意义了。
/e 修改符使 preg_replace(卡塔尔 将 replacement 参数作为 PHP
代码(在非凡的逆向引用替换完事后)。提醒:要承保 replacement
构成三个合法的 PHP 代码字符串,不然 PHP 会在告知在包括 preg_replace(卡塔尔国的行中现身语法分析错误。
例 3. 交替数个值:
复制代码 代码如下:

$patterns = array (“/(19|20)(d{2})-(d{1,2})-(d{1,2})/”,
“/^s*{(w+)}s*=/”);
$replace = array (“\3/\4/\1\2”, “$\1 =”);
print preg_replace ($patterns, $replace, “{startDate} = 1999-5-27”);
?>

本例将出口:
$startDate = 5/27/1999
例 4. 使用 /e 修正符:
复制代码 代码如下:

preg_replace (“/(]*>)/e”,
“‘\1’.strtoupper(‘\2’).’\3′”,
$html_body);
?>

那将使输入字符串中的全数 HTML 标识变成大写。
例 5. 将 HTML 调换到文本:
复制代码 代码如下:

// $document 应包含三个 HTML 文书档案。
// 本例将去掉 HTML 标志,javascript 代码
// 和空白字符。还大概会将一些通用的
// HTML 实体转变来相应的公文。
$search = array (“‘

‘si”, // 去掉 javascript
“‘]*?>’si”, // 去掉 HTML 标记
“‘([rn])[s]+'”, // 去掉空白字符
“‘&(quot|#34);’i”, // 替换 HTML 实体
“‘&(amp|#38);’i”,
“‘&(lt|#60);’i”,
“‘&(gt|#62);’i”,
“‘&(nbsp|#160);’i”,
“‘&(iexcl|#161);’i”,
“‘&(cent|#162);’i”,
“‘&(pound|#163);’i”,
“‘&(copy|#169);’i”,
“‘(d+卡塔尔(قطر‎;’e”卡塔尔; // 作为 PHP 代码运营
$replace = array (“”,
“”,
“\1”,
“””,
“&”,
“”>”,
” “,
chr(161),
chr(162),
chr(163),
chr(169),
“chr(\1)”);
$text = preg_replace ($search, $replace, $document);
?>

The End…

You can leave a response, or trackback from your own site.

Leave a Reply

网站地图xml地图