「java去掉html标签」js移除div标签
本篇文章给大家谈谈java去掉html标签,以及js移除div标签对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。
本文目录一览:
- 1、java正则表达式去除html标签保留指定标签
- 2、用java字符串方法去除HTML代码标签的问题
- 3、用java如何去掉HTML标签里卖弄的属性
- 4、java爬取知乎答案的时候,如何去除其中的HTML标签
- 5、java 移除html标签的属性
- 6、java如何去掉字符串中的 html标签
java正则表达式去除html标签保留指定标签
String reg = "\\/?html[^]*";
String html = "";
html.replaceAll(reg,"");
用java字符串方法去除HTML代码标签的问题
可以通过replaceAll方法进行字符串替换,之后替换的内容用正则表达式来匹配。举例
String ss="div id='mini_nav_qq'lia target='_top' " +
"href='http:// lady.qq.com/emo/emotio.shtml'情感/a/lili" +
"a target='_top' href=''美容/a/li/div";
String ss=ss.replaceAll("(/?\\S+)\\s*?[^]*?(/?)","$1$2");//通过只保留"“后面的字符串,之后删除空格和后面的内容,快捷的实现去除操作(此方法通用于所有的标签去除,只需要传入不同的ss值)。
结果就是:divlia情感/a/lilia美容/a/li/div。
用java如何去掉HTML标签里卖弄的属性
public class Test {
/**
* @param args
*/
public static void main(String[] args) {
//str 可以放你具体要处理的HTML字符串
String str = "div class='content'div id=\\'t1'文本1/divp class='bbb'文本2.....font color='#00000'文本3/fontspan style='line-height:24px;'文本4/span/p/div";
str = new Test().getString(str, "class");
System.out.println(str);
}
/**
* 除去Html文件中的class属性
* @param str
* @param subStr
* @return
*/
public String getString(String str, String subStr){
String sb = "";
String[] s1 = str.split(subStr);
for (int i = 0; i s1.length; i++) {
if (i==0) {
sb = sb + s1[0];
continue;
}
int ii = s1[i].indexOf("", 0);
sb = sb + s1[i].substring(ii);
}
return sb.toString();
}
}
java爬取知乎答案的时候,如何去除其中的HTML标签
可以通过正则表达式去除html标签
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class HtmlUtil {
private static final String regEx_script = "script[^]*?[\\s\\S]*?\\/script"; // 定义script的正则表达式
private static final String regEx_style = "style[^]*?[\\s\\S]*?\\/style"; // 定义style的正则表达式
private static final String regEx_html = "[^]+"; // 定义HTML标签的正则表达式
private static final String regEx_space = "\\s*|\t|\r|\n";//定义空格回车换行符
/**
* @param htmlStr
* @return
* 删除Html标签
*/
public static String delHTMLTag(String htmlStr) {
Pattern p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);
Matcher m_script = p_script.matcher(htmlStr);
htmlStr = m_script.replaceAll(""); // 过滤script标签
Pattern p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);
Matcher m_style = p_style.matcher(htmlStr);
htmlStr = m_style.replaceAll(""); // 过滤style标签
Pattern p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
Matcher m_html = p_html.matcher(htmlStr);
htmlStr = m_html.replaceAll(""); // 过滤html标签
Pattern p_space = Pattern.compile(regEx_space, Pattern.CASE_INSENSITIVE);
Matcher m_space = p_space.matcher(htmlStr);
htmlStr = m_space.replaceAll(""); // 过滤空格回车标签
return htmlStr.trim(); // 返回文本字符串
}
public static String getTextFromHtml(String htmlStr){
htmlStr = delHTMLTag(htmlStr);
htmlStr = htmlStr.replaceAll(" ", "");
htmlStr = htmlStr.substring(0, htmlStr.indexOf("。")+1);
return htmlStr;
}
public static void main(String[] args) {
String str = "div style='text-align:center;' 整治“四风” 清弊除垢br/span style='font-size:14px;' /spanspan style='font-size:18px;'公司召开党的群众路线教育实践活动动员大会/spanbr//div";
System.out.println(getTextFromHtml(str));
}
}
java 移除html标签的属性
针对于你提的问题,如果想去掉class和style属性必须对所需要去掉属性的标签增加id
以你提供的代码为例,首先需要增加id属性,修改后如下:
div class="content" id=“testdiv”
div id="t1"
文本1
/div
p class="bbb" id=“testp”
文本2.....font color='#00000'文本3/fontspan style="line-height:24px;"文本4/span
/p
/div
然后编写对应js代码,代码如下:
function delClass(){
$("#testdiv").removeClass("content");
$("#testp").removeClass("bbb");
}
上述代码可以去除Class
注:
如果程序为进入页面后调用则需要在body中增加onload方法也就是:onload="delClass();"
如果为点击式触发则在页面增加按钮,对按钮总方法onClick方法指定删除的js方法
希望回答对你有用。
java如何去掉字符串中的 html标签
1.去除单个HTML标记
String s="asdfasdscriptasdfsfd/script1234";
System.out.println(s.replaceAll("script.*?(?=/script)",""));
2.去除所有HTML标记
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class HTMLSpirit{ ITjob 远标教育
public static String delHTMLTag(String htmlStr){
String regEx_script="script[^]*?[\\s\\S]*?\\/script"; //定义script的正则表达式
String regEx_style="style[^]*?[\\s\\S]*?\\/style"; //定义style的正则表达式
String regEx_html="[^]+"; //定义HTML标签的正则表达式
Pattern p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);
Matcher m_script=p_script.matcher(htmlStr);
htmlStr=m_script.replaceAll(""); //过滤script标签
Pattern p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);
Matcher m_style=p_style.matcher(htmlStr);
htmlStr=m_style.replaceAll(""); //过滤style标签
Pattern p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);
Matcher m_html=p_html.matcher(htmlStr);
htmlStr=m_html.replaceAll(""); //过滤html标签
return htmlStr.trim(); //返回文本字符串
}
}
java去掉html标签的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于js移除div标签、java去掉html标签的信息别忘了在本站进行查找喔。
发布于:2022-11-23,除非注明,否则均为
原创文章,转载请注明出处。