首页 > 编程 > Regex > 正文

过滤所有HTML代码和CSS,JS

2020-03-16 21:23:21
字体:
来源:转载
供稿:网友
过滤所有HTML代码和CSS,JS的正则代码:


  1. Function RemoveHTML(strHTML)    '过滤HTML代码的函数包括过滤CSS和JS  
  2.  
  3.  
  4. StrHtml = Replace(StrHtml,vbCrLf,"")  
  5.  
  6. StrHtml = Replace(StrHtml,Chr(13)&Chr(10),"")  
  7.  
  8. StrHtml = Replace(StrHtml,Chr(13),"")  
  9.  
  10. StrHtml = Replace(StrHtml,Chr(10),"")  
  11.  
  12. StrHtml = Replace(StrHtml," ","")  
  13.  
  14. StrHtml = Replace(StrHtml,"    ","")  
  15.  
  16.  
  17.  Dim objRegExp, Match, Matches   
  18.  
  19.  Set objRegExp = New Regexp  
  20.  
  21.    
  22.  
  23.  objRegExp.IgnoreCase = True  
  24.  
  25.  objRegExp.Global = True  
  26.  
  27.  
  28.  '取闭合的<>  
  29.  
  30.  objRegExp.Pattern = "<style(.+?)/style>"  
  31.  
  32.  '进行匹配  
  33.  
  34.  Set Matches = objRegExp.Execute(strHTML)  
  35.  
  36.    
  37.  
  38.  ' 遍历匹配集合,并替换掉匹配的项目  
  39.  
  40.  For Each Match in Matches   
  41.  
  42.  strHtml=Replace(strHTML,Match.Value,"")  
  43.  
  44.  Next  
  45.  
  46.  
  47.   '取闭合的<>  
  48.  
  49.  objRegExp.Pattern = "<script(.+?)/script>"  
  50.  
  51.  '进行匹配  
  52.  
  53.  Set Matches = objRegExp.Execute(strHTML)  
  54.  
  55.    
  56.  
  57.  ' 遍历匹配集合,并替换掉匹配的项目  
  58.  
  59.  For Each Match in Matches   
  60.  
  61.  strHtml=Replace(strHTML,Match.Value,"")  
  62.  
  63.  Next  
  64.  
  65.  
  66.   '取闭合的<>  
  67.  
  68.  objRegExp.Pattern = "<.+?>"  
  69.  
  70.  '进行匹配  
  71.  
  72.  Set Matches = objRegExp.Execute(strHTML)  
  73.  
  74.    
  75.  
  76.  ' 遍历匹配集合,并替换掉匹配的项目  
  77.  
  78.  For Each Match in Matches   
  79.  
  80.  strHtml=Replace(strHTML,Match.Value,"")  
  81.  
  82.  Next  
  83.  
  84.  
  85.  RemoveHTML=strHTML  
  86.  
  87.  Set objRegExp = Nothing  
  88.  
  89. End Function  

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表