「java去除html」java去除字符串最后一个字符

admin 2022-12-28 11:09:05 850

今天给各位分享java去除html的知识，其中也会对java去除字符串最后一个字符进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！

本文目录一览：

1、用java字符串方法去除HTML代码标签的问题
2、java如何去掉字符串中的 html标签
3、java 如何去除html中的一个指定标签和指定标签里的内容

用java字符串方法去除HTML代码标签的问题

可以通过replaceAll方法进行字符串替换，之后替换的内容用正则表达式来匹配。举例

String ss="div id='mini_nav_qq'lia target='_top' " +

"href='http:// lady.qq.com/emo/emotio.shtml'情感/a/lili" +

"a target='_top' href=''美容/a/li/div";

String ss=ss.replaceAll("(/?\\S+)\\s*?[^]*?(/?)","$1$2");//通过只保留"“后面的字符串，之后删除空格和后面的内容，快捷的实现去除操作（此方法通用于所有的标签去除，只需要传入不同的ss值）。

结果就是：divlia情感/a/lilia美容/a/li/div。

java如何去掉字符串中的 html标签

1.去除单个HTML标记

String s="asdfasdscriptasdfsfd/script1234";

System.out.println(s.replaceAll("script.*?(?=/script)",""));

2.去除所有HTML标记

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class HTMLSpirit{ ITjob 远标教育

public static String delHTMLTag(String htmlStr){

String regEx_script="script[^]*?[\\s\\S]*?\\/script"; //定义script的正则表达式

String regEx_style="style[^]*?[\\s\\S]*?\\/style"; //定义style的正则表达式

String regEx_html="[^]+"; //定义HTML标签的正则表达式

Pattern p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);

Matcher m_script=p_script.matcher(htmlStr);

htmlStr=m_script.replaceAll(""); //过滤script标签

Pattern p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);

Matcher m_style=p_style.matcher(htmlStr);

htmlStr=m_style.replaceAll(""); //过滤style标签

Pattern p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);

Matcher m_html=p_html.matcher(htmlStr);

htmlStr=m_html.replaceAll(""); //过滤html标签

return htmlStr.trim(); //返回文本字符串

}

java 如何去除html中的一个指定标签和指定标签里的内容

java处理html指定标签最好用正则表达式。例如要去除html中所有的h1标签和类容就可以用下面的演示代码：

package konw.reg;

import java.io.BufferedReader;

import java.io.BufferedWriter;

import java.io.FileNotFoundException;

import java.io.FileReader;

import java.io.FileWriter;

import java.io.IOException;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class RemoveTag

{

public static void main(String[] args)

{

FileReader fr;

String content =null;

String regex = "[Hh]1.*/[Hh]1";

try

{

fr = new FileReader("tag.html");

BufferedReader br = new BufferedReader(fr);

String str = null;

StringBuffer sb = new StringBuffer();

while((str = br.readLine()) != null)

{

sb.append(str+"\n");

}

content = sb.toString();

br.close();

} catch (FileNotFoundException e)

{

e.printStackTrace();

} catch (IOException e)

{

e.printStackTrace();

}

Pattern pattern = Pattern.compile(regex);

Matcher matcher = pattern.matcher(content);

StringBuffer sb1 = new StringBuffer();

while(matcher.find())

{

sb1.append(matcher.replaceAll("")+"\n");

}

try

{

FileWriter fw = new FileWriter("tag.html");

BufferedWriter bw = new BufferedWriter(fw);

fw.write(sb1.toString());

bw.close();

} catch (IOException e)

{

e.printStackTrace();

}

关于java去除html和java去除字符串最后一个字符的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

标签：java去除html