首页 > 学院 > 开发设计 > 正文

JAVA去掉HTMl以及CSS样式

2019-11-14 22:02:30
字体:
来源:转载
供稿:网友
java去掉HTMl以及CSS样式

封装方法如下

public String delHTMLTag(String htmlStr){         String regEx_style="<style[^>]*?>[//s//S]*?<///style>"; //定义style的正则表达式         String regEx_html="<[^>]+>"; //定义HTML标签的正则表达式                  Pattern p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);         Matcher m_style=p_style.matcher(htmlStr);         htmlStr=m_style.replaceAll(""); //过滤style标签                  Pattern p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);         Matcher m_html=p_html.matcher(htmlStr);         htmlStr=m_html.replaceAll(""); //过滤html标签                 htmlStr=htmlStr.replace("","");        htmlStr=htmlStr.replaceAll("//s*|/t|/r|/n","");        htmlStr=htmlStr.replace("“","");        htmlStr=htmlStr.replace("”","");        htmlStr=htmlStr.replaceAll(" ","");                  return htmlStr.trim(); //返回文本字符串     } 

本文参考文章:http://blog.csdn.net/shiyuezhong/article/details/8122861


上一篇:dozer学习笔记

下一篇:13)Java static

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表