首页 > 编程 > Java > 正文

Java 获取Html文本中的img标签下src中的内容方法

2019-11-26 09:56:43
字体:
来源:转载
供稿:网友

如下所示:

/**  * 得到网页中图片的地址  * @param sets html字符串  */ public Set<String> getImgStr(String htmlStr) {  Set<String> pics = new HashSet<String>();  String img = "";  Pattern p_image;  Matcher m_image;  String regEx_img = "<img.*src//s*=//s*(.*?)[^>]*?>";  p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);  m_image = p_image.matcher(htmlStr);  while (m_image.find()) {   // 得到<img />数据   img = m_image.group();   // 匹配<img>中的src数据   Matcher m = Pattern.compile("src//s*=//s*/"?(.*?)(/"|>|//s+)").matcher(img);   while (m.find()) {    pics.add(m.group(1));   }  }  return pics; }

以上这篇Java 获取Html文本中的img标签下src中的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持武林网。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表