「java去除html」java去除字符串最后一个字符

博主:adminadmin 2022-12-28 11:09:05 617

今天给各位分享java去除html的知识,其中也会对java去除字符串最后一个字符进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

用java字符串方法去除HTML代码标签的问题

可以通过replaceAll方法进行字符串替换,之后替换的内容用正则表达式来匹配。举例

String ss="div id='mini_nav_qq'lia target='_top' " +

  "href='http:// lady.qq.com/emo/emotio.shtml'情感/a/lili" +

  "a target='_top' href=''美容/a/li/div";

String ss=ss.replaceAll("(/?\\S+)\\s*?[^]*?(/?)","$1$2");//通过只保留"“后面的字符串,之后删除空格和后面的内容,快捷的实现去除操作(此方法通用于所有的标签去除,只需要传入不同的ss值)。

结果就是:divlia情感/a/lilia美容/a/li/div。

java如何去掉字符串中的 html标签

1.去除单个HTML标记

String s="asdfasdscriptasdfsfd/script1234";

System.out.println(s.replaceAll("script.*?(?=/script)",""));

2.去除所有HTML标记

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class HTMLSpirit{ ITjob 远标教育

public static String delHTMLTag(String htmlStr){

String regEx_script="script[^]*?[\\s\\S]*?\\/script"; //定义script的正则表达式

String regEx_style="style[^]*?[\\s\\S]*?\\/style"; //定义style的正则表达式

String regEx_html="[^]+"; //定义HTML标签的正则表达式

Pattern p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);

Matcher m_script=p_script.matcher(htmlStr);

htmlStr=m_script.replaceAll(""); //过滤script标签

Pattern p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);

Matcher m_style=p_style.matcher(htmlStr);

htmlStr=m_style.replaceAll(""); //过滤style标签

Pattern p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);

Matcher m_html=p_html.matcher(htmlStr);

htmlStr=m_html.replaceAll(""); //过滤html标签

return htmlStr.trim(); //返回文本字符串

}

}

java 如何去除html中的一个指定标签和指定标签里的内容

java处理html指定标签最好用正则表达式。例如要去除html中所有的h1标签和类容就可以用下面的演示代码:

package konw.reg;

import java.io.BufferedReader;

import java.io.BufferedWriter;

import java.io.FileNotFoundException;

import java.io.FileReader;

import java.io.FileWriter;

import java.io.IOException;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class RemoveTag

{

    public static void main(String[] args)

    {

        FileReader fr;

        String content =null;

        String regex = "[Hh]1.*/[Hh]1";

        try

        {

            fr = new FileReader("tag.html");

            BufferedReader br = new BufferedReader(fr);

            String str = null;

            StringBuffer sb = new StringBuffer();

            while((str = br.readLine()) != null)

            {

                sb.append(str+"\n");

            }

            content = sb.toString();

            br.close();

            

        } catch (FileNotFoundException e)

        {

            e.printStackTrace();

        } catch (IOException e)

        {

            e.printStackTrace();

        }

        Pattern pattern = Pattern.compile(regex);

        Matcher matcher = pattern.matcher(content);

        StringBuffer sb1 = new StringBuffer();

        while(matcher.find())

        {

            sb1.append(matcher.replaceAll("")+"\n");

        }

        try

        {

            FileWriter fw = new FileWriter("tag.html");

            BufferedWriter bw = new BufferedWriter(fw);

            fw.write(sb1.toString());

            bw.close();

        } catch (IOException e)

        {

            e.printStackTrace();

        }

    }

}

关于java去除html和java去除字符串最后一个字符的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。