首页 > 编程 > Regex > 正文

去html代码的正则 推荐

2020-03-16 21:22:45
字体:
来源:转载
供稿:网友
代码如下:

'================================================== 
'函数名:ScriptHtml 
'作  用:过滤html标记 
'参  数:ConStr ------ 要过滤的字符串 
'================================================== 
Function ScriptHtml(Byval ConStr,TagName,FType) 
    Dim Re 
    Set Re=new RegExp 
    Re.IgnoreCase =true 
    Re.Global=True 
    Select Case FType 
    Case 1 
       Re.Pattern="<" & TagName & "([^>])*>" 
       ConStr=Re.Replace(ConStr,"") 
    Case 2 
       Re.Pattern="<" & TagName & "([^>])*>.*?</" & TagName & "([^>])*>" 
       ConStr=Re.Replace(ConStr,"") 
    Case 3 
       Re.Pattern="<" & TagName & "([^>])*>" 
       ConStr=Re.Replace(ConStr,"") 
       Re.Pattern="</" & TagName & "([^>])*>" 
       ConStr=Re.Replace(ConStr,"") 
    End Select 
    ScriptHtml=ConStr 
    Set Re=Nothing 
End Function 

1 content=ScriptHtml(content,"br",1) ‘去掉所有<br>HTML标记 

2 content=ScriptHtml(content,"a",2) ‘去掉所有<a></a>和两个标记之间的内容  
如  <a href=www.126.com>www.126.com</a>  把这一段全去了 

3  content=ScriptHtml(content,"td",3) ‘去掉<td>和</td>HTML标记 
如  <td>士大夫撒</td>  把<td> </td> 去掉了 但士大夫撒还保留 

依次类推把其他HTML标记都过滤了 div objdect什么的 自己看吧
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表