首页 > 编程 > Regex > 正文

正则表达式轻松消除HTML代码

2020-03-16 21:17:20
字体:
来源:转载
供稿:网友
正则表达式再次让我震撼,寥寥数行代码就可以完成普通代码不易实现的功能,至少是实现起来比较复杂的功能。
 
 
一、清楚内容中的Javsscript 代码 
复制代码代码如下:

Function ClearJSCode(originCode) 
Dim reg 
set reg = New RegExp 
reg.Pattern = "<SCRIPT[^<]*</SCRIPT>" 
reg.IgnoreCase = True 
reg.Global = True 
clearJSCode = reg.Replace(originCode, "") 
End Function 

二、清除内容中的HTML代码 
复制代码代码如下:

Function ClearHTMLCode(originCode) 
Dim reg 
set reg = new RegExp 
reg.Pattern = "<[^>]*>" 
reg.IgnoreCase = True 
reg.Global = True 
ClearHTMLCode = reg.Replace(originCode, "") 
End Function

现在好多网站的内容都是使用采集程序生成的,使用上边的代码就可以轻松的将内容中的HTML和JS代码清除掉。 
 

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表