站长资源网页制作

将html文本中所有的标签替换掉的方法

整理:jimmy2024/12/28浏览2
简介(?i) 表示不匹配大小写。不管大写还是小写都给替换掉html = html.replaceAll("(<(?i)(|)[^]*/?>)|( )|(')|(\")", "");System.out.println(html); (<(?i)(|)[^]*/?>)|( )|(')|(\") -- 匹
(?i) 表示不匹配大小写。不管大写还是小写都给替换掉
html = html.replaceAll("(&lt;(?i)(|)[^]*/?&gt;)|(&nbsp;)|(')|(\")", "");
System.out.println(html);
(&lt;(?i)(|)[^]*/?&gt;)|(&nbsp;)|(')|(\")  -- 匹配全部的标签与空格和引号
若只替换一部分则进行下面的修改
(&lt;(?i)(|)[^]*/?&gt;) --替换全部的标签
(&lt;(?i)(p|img)[^]*/?&gt;) --替换p和img标签
(&lt;(?i)a[^]*/?&gt;)    --仅替换a标签