「java去掉html标签」js移除div标签

博主:adminadmin 2022-11-23 07:38:09 57

本篇文章给大家谈谈java去掉html标签,以及js移除div标签对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。

本文目录一览:

java正则表达式去除html标签保留指定标签

String reg = "\\/?html[^]*";

String html = "";

html.replaceAll(reg,"");

用java字符串方法去除HTML代码标签的问题

可以通过replaceAll方法进行字符串替换,之后替换的内容用正则表达式来匹配。举例

String ss="div id='mini_nav_qq'lia target='_top' " +

  "href='http:// lady.qq.com/emo/emotio.shtml'情感/a/lili" +

  "a target='_top' href=''美容/a/li/div";

String ss=ss.replaceAll("(/?\\S+)\\s*?[^]*?(/?)","$1$2");//通过只保留"“后面的字符串,之后删除空格和后面的内容,快捷的实现去除操作(此方法通用于所有的标签去除,只需要传入不同的ss值)。

结果就是:divlia情感/a/lilia美容/a/li/div。

用java如何去掉HTML标签里卖弄的属性

public class Test {

/**

* @param args

*/

public static void main(String[] args) {

//str 可以放你具体要处理的HTML字符串

String str = "div class='content'div id=\\'t1'文本1/divp class='bbb'文本2.....font color='#00000'文本3/fontspan style='line-height:24px;'文本4/span/p/div";

str = new Test().getString(str, "class");

System.out.println(str);

}

/**

* 除去Html文件中的class属性

* @param str

* @param subStr

* @return

*/

public String getString(String str, String subStr){

String sb = "";

String[] s1 = str.split(subStr);

for (int i = 0; i s1.length; i++) {

if (i==0) {

sb = sb + s1[0];

continue;

}

int ii = s1[i].indexOf("", 0);

sb = sb + s1[i].substring(ii);

}

return sb.toString();

}

}

java爬取知乎答案的时候,如何去除其中的HTML标签

可以通过正则表达式去除html标签

import java.util.regex.Matcher;  

import java.util.regex.Pattern;  

  

public class HtmlUtil {  

    private static final String regEx_script = "script[^]*?[\\s\\S]*?\\/script"; // 定义script的正则表达式  

    private static final String regEx_style = "style[^]*?[\\s\\S]*?\\/style"; // 定义style的正则表达式  

    private static final String regEx_html = "[^]+"; // 定义HTML标签的正则表达式  

    private static final String regEx_space = "\\s*|\t|\r|\n";//定义空格回车换行符  

      

    /** 

     * @param htmlStr 

     * @return 

     *  删除Html标签 

     */  

    public static String delHTMLTag(String htmlStr) {  

        Pattern p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);  

        Matcher m_script = p_script.matcher(htmlStr);  

        htmlStr = m_script.replaceAll(""); // 过滤script标签  

  

        Pattern p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);  

        Matcher m_style = p_style.matcher(htmlStr);  

        htmlStr = m_style.replaceAll(""); // 过滤style标签  

  

        Pattern p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);  

        Matcher m_html = p_html.matcher(htmlStr);  

        htmlStr = m_html.replaceAll(""); // 过滤html标签  

  

        Pattern p_space = Pattern.compile(regEx_space, Pattern.CASE_INSENSITIVE);  

        Matcher m_space = p_space.matcher(htmlStr);  

        htmlStr = m_space.replaceAll(""); // 过滤空格回车标签  

        return htmlStr.trim(); // 返回文本字符串  

    }  

      

    public static String getTextFromHtml(String htmlStr){  

        htmlStr = delHTMLTag(htmlStr);  

        htmlStr = htmlStr.replaceAll(" ", "");  

        htmlStr = htmlStr.substring(0, htmlStr.indexOf("。")+1);  

        return htmlStr;  

    }  

      

    public static void main(String[] args) {  

        String str = "div style='text-align:center;' 整治“四风”   清弊除垢br/span style='font-size:14px;' /spanspan style='font-size:18px;'公司召开党的群众路线教育实践活动动员大会/spanbr//div";  

        System.out.println(getTextFromHtml(str));  

    }  

}

java 移除html标签的属性

针对于你提的问题,如果想去掉class和style属性必须对所需要去掉属性的标签增加id

以你提供的代码为例,首先需要增加id属性,修改后如下:

div class="content" id=“testdiv”

div id="t1"

文本1

/div

p class="bbb" id=“testp”

文本2.....font color='#00000'文本3/fontspan style="line-height:24px;"文本4/span

/p

/div

然后编写对应js代码,代码如下:

function delClass(){

$("#testdiv").removeClass("content");

$("#testp").removeClass("bbb");

}

上述代码可以去除Class

注:

如果程序为进入页面后调用则需要在body中增加onload方法也就是:onload="delClass();"

如果为点击式触发则在页面增加按钮,对按钮总方法onClick方法指定删除的js方法

希望回答对你有用。

java如何去掉字符串中的 html标签

1.去除单个HTML标记

String s="asdfasdscriptasdfsfd/script1234";

System.out.println(s.replaceAll("script.*?(?=/script)",""));

2.去除所有HTML标记

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class HTMLSpirit{ ITjob 远标教育

public static String delHTMLTag(String htmlStr){

String regEx_script="script[^]*?[\\s\\S]*?\\/script"; //定义script的正则表达式

String regEx_style="style[^]*?[\\s\\S]*?\\/style"; //定义style的正则表达式

String regEx_html="[^]+"; //定义HTML标签的正则表达式

Pattern p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);

Matcher m_script=p_script.matcher(htmlStr);

htmlStr=m_script.replaceAll(""); //过滤script标签

Pattern p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);

Matcher m_style=p_style.matcher(htmlStr);

htmlStr=m_style.replaceAll(""); //过滤style标签

Pattern p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);

Matcher m_html=p_html.matcher(htmlStr);

htmlStr=m_html.replaceAll(""); //过滤html标签

return htmlStr.trim(); //返回文本字符串

}

}

java去掉html标签的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于js移除div标签、java去掉html标签的信息别忘了在本站进行查找喔。

The End

发布于:2022-11-23,除非注明,否则均为首码项目网原创文章,转载请注明出处。