首页 > 语言 > PHP > 正文

PHP正则表达式过滤html标签属性(DEMO)

2024-05-04 23:45:31
字体:
来源:转载
供稿:网友
这篇文章主要介绍了PHP正则表达式过滤html标签属性的相关内容,实用性非常,感兴趣的朋友参考下吧
 

过滤html标签在php中可以有内置的函数了,但它过滤的太干净了,我们就整理了一下些利用正则来过滤指定html标签的例子,具体如下所示。

采集的时候有时候需要过滤掉多余的标签属性,比如 img标签过滤掉除了src属性之外的所有属性例如删除titile alt等属性以及一些脚的onclick属性等。

例如

过滤除了src之外的所有属性:

 

复制代码代码如下:

$str= preg_replace('//s(?!src)[a-zA-Z]+=[/'/"]{1}[^/'/"]+[/'/"]{1}/iu',' $str); 

 

上面的实例代码是过滤掉除了src属性外的所有标签属性.

过滤设置过滤除了alt和src之外的所有属性

代码如下:

 

复制代码代码如下:

$str = preg_replace('//s(?!(src|alt))[a-zA-Z]+=[^/s]*/iu',' ', $str); 

 

过滤所有html标签的属性的正则表达式:

 

复制代码代码如下:

$str = preg_replace("/<([a-z]+)[^>]*>/i","",$str ); 

 

只过滤alt属性的正则表达式:

 

复制代码代码如下:

(/s)alt=[^/s]* 

 

过滤所有html标签的属性的正则表达式:

 

复制代码代码如下:

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript 
"'<[///!]*?[^<>]*?>'si", // 去掉 HTML 标记 
"'([/r/n])[/s]+'", // 去掉空白字符 
"'&(quot|#34);'i", // 替换 HTML 实体 
"'&(amp|#38);'i", 
"'&(lt|#60);'i", 
"'&(gt|#62);'i", 
"'&(nbsp|#160);'i" 
); // 作为 PHP 代码运行 
$replace = array ("","","//1","/"","&","<",">"," "); 
$html = preg_replace($search, $replace, $html); 


注:相关教程知识阅读请移步到PHP教程频道。
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

图片精选