「java下载html」JAVA下载网址

admin 2023-01-16 09:42:09 1864

今天给各位分享java下载html的知识，其中也会对JAVA下载网址进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！

本文目录一览：

1、jdk的html文档如何下载
2、java中.html文件和.java文件的用途及运行环境
3、java爬虫htmluinit框架批量下载文件？
4、java如何实现超链接下载
5、javase-downloads.html是什么
6、如何用Java实现模拟登录Discuz!论坛并下载返回的html代码？

jdk的html文档如何下载

先到页面;

点击Java SE 6 Documentation边上的Download,然后进入一个页面,选择英语,

再进去,有一个56.16M的ZIP file,点它下载

java中.html文件和.java文件的用途及运行环境

您好，这样的：

解析HTML文档的Java程序

下面是一个解析HTML字符串，网络上下载的HTML文件，以及本地文件系统中的HTML文件的完整的Java程序。你可以使用Eclipse IDE或者别的IDE甚至命令来运行这个程序。在Eclipse里面则很简单，拷贝这份代码，新建一个Java工程，在src包上右键并粘贴进去就可以了。Eclipse会去创建正确的包及同名的Java源文件的，因此工作量最小。如果你已经有一个Java示例工程了，那么仅需一步就可以了。下面的这个Java程序展示了解析及遍历HTML文件的三个不同例子。第一个例子中，我们直接解析了一个内容为HTML的字符串，第二个例子中我们解析了一个从URL中下载的HTML文件，第三个中我们从本地文件系统中加载了一个HTML文档并进行解析。第一和第三个例子中都用到了parse方法来获取一个Document对象，你可以查询它来提取出任何的标签值或者属性值。第二个例子中，我们用到了Jsoup.connect方法，它会去创建URL的连接，下载HTML并进行解析。这个方法也会返回Document，它可以用于后续的查询及获取标签或者属性的值。

import java.io.IOException;

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;

import org.jsoup.nodes.Element;

/**

[*] Java Program to parse/read HTML documents from File using Jsoup library.

[*] Jsoup is an open source library which allows Java developer to parse HTML

[*] files and extract elements, manipulate data, change style using DOM, CSS and

[*] JQuery like method.

[*]

[*] @author Javin Paul

[*]/

public class HTMLParser{

public static void main(String args[]) {

// Parse HTML String using JSoup library

String HTMLSTring = "!DOCTYPE html"

+ "html"

+ "head"

+ "titleJSoup Example/title"

+ "/head"

+ "body"

+ "|[b]HelloWorld[/b]"

+ ""

+ "/body"

+ "/html";

Document html = Jsoup.parse(HTMLSTring);

String title = html.title();

String h1 = html.body().getElementsByTag("h1").text();

System.out.println("Input HTML String to JSoup :" + HTMLSTring);

System.out.println("After parsing, Title : " + title);

System.out.println("Afte parsing, Heading : " + h1);

// JSoup Example 2 - Reading HTML page from URL

Document doc;

try {

doc = Jsoup.connect("").get();

title = doc.title();

} catch (IOException e) {

e.printStackTrace();

}

System.out.println("Jsoup Can read HTML page from URL, title : " + title);

// JSoup Example 3 - Parsing an HTML file in Java

//Document htmlFile = Jsoup.parse("login.html", "ISO-8859-1"); // wrong

Document htmlFile = null;

try {

htmlFile = Jsoup.parse(new File("login.html"), "ISO-8859-1");

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

} // right

title = htmlFile.title();

Element div = htmlFile.getElementById("login");

String cssClass = div.className(); // getting class form HTML element

System.out.println("Jsoup can also parse HTML file directly");

System.out.println("title : " + title);

System.out.println("class of div tag : " + cssClass);

}

输出：

Input HTML String to JSoup :!DOCTYPE htmlhtmlheadtitleJSoup Example/title/headbodytabletrtdh1HelloWorld/h1/tr/table/body/html

After parsing, Title : JSoup Example

Afte parsing, Heading : HelloWorld

Jsoup Can read HTML page from URL, title : Google

Jsoup can also parse HTML file directly title : Login Page

class of div tag : simple

Jsoup的好处就是它的健壮性很强。Jsoup HTML解析器会对你提供的HTML进行尽量干净的解析，而不去考虑这个HTML是否是格式良好的。它可以处理如下这些错误：未闭合的标签（比如，Java pScala to pJavaScala)，隐式标签（比如，一个裸的|Java is Great被封装到了|里面），它总能创建出一个文档结构（包含head及body的HTML，并且head里只会包含正确的元素）。这就是在Java中如何进行HTML的解析。Jsoup是一个优秀的健壮的开源库，它使得读取HTML文档，body片段，HTML字符串，以及直接从WEB中解析HTML内容都变得相当简单。在这篇文章中，我们学习了如何在Java中获取一个特定的HTML标签，正如第一个例子中我们将title及H1标签的值提取成了文本，而第三个例子中我们学习到了如何通过提取CSS属性来从HTML标签中获取属性值。除了强大的jQuery风格的html.body().getElementsByTag("h1").text()方法，你还可以提取任意的HTML标签，它还提供了像Document.title()和Element.className()这样便捷的方法，你可以快速获取到标题及CSS类。希望JSoup能让你玩得愉快，很快我们将会看到关于这个API的更多的一些例子。

java爬虫htmluinit框架批量下载文件？

我用Jsoup写爬虫，一般遇到html返回没有的内容。但是浏览器显示有的内容。都是分析页面的http请求日志。分析页面JS代码来解决。

1、有些页面元素被隐藏起来了-换selector解决

2、有些数据保存在js/json对象中-截取对应的串，分析解决

3、通过api接口调用-伪造请求获得数据

还有一个终极方法

4、使用phantomjs或者casperjs这种headless浏览器

java如何实现超链接下载

java实现超链接下载方法如下：

response.setHeader("Content-disposition","attachment;filename="下载的文件名字);

备注：让response调用setheader方法添加下载的头给客户的浏览器，浏览器收到该头后就会打开相应的下载对话框。

javase-downloads.html是什么

项目下载。

表示在javase的downloads下下载有关html的文件。

超文本标记语言，标准通用标记语言下的一个应用，超文本就是指页面内可以包含图片，链接，甚至是音乐，程序等非文字元素。超文本标记语言的结构包括头部分英语是Head，和主体部分Body，其中头部提供关于网页的信息，主体部分提供网页的具体内容。

如何用Java实现模拟登录Discuz!论坛并下载返回的html代码？

package org.shaw;

import org.apache.commons.httpclient.Cookie;

import org.apache.commons.httpclient.HttpClient;

import org.apache.commons.httpclient.NameValuePair;

import org.apache.commons.httpclient.methods.GetMethod;

import org.apache.commons.httpclient.methods.PostMethod;

public class BaiyouBBS {

static final String LOGON_SITE = "";

static final int LOGON_PORT = 80;

public Cookie[] login(String name, String pas) {

try {

HttpClient client = new HttpClient();

client.getHostConfiguration().setHost(LOGON_SITE, LOGON_PORT);

PostMethod post = new PostMethod("/logging.php?action=login");

client.executeMethod(post);

String responseString = new String(post.getResponseBody(), "gbk");

post.releaseConnection();

String formhash = getFormHash(responseString);

System.out.println(formhash);

post = new PostMethod("/logging.php?action=login");

NameValuePair[] params = new NameValuePair[11];

params[0] = new NameValuePair("loginfield", "username");

params[1] = new NameValuePair("username", name);

params[2] = new NameValuePair("password", pas);

params[3] = new NameValuePair("referer", "index.php");

params[4] = new NameValuePair("questionid", "0");

params[5] = new NameValuePair("answer", "");

params[6] = new NameValuePair("cookietime", "2592000");

params[7] = new NameValuePair("formhash", formhash);

params[8] = new NameValuePair("loginmode", "");

params[9] = new NameValuePair("loginsubmit", "true");

params[10] = new NameValuePair("styleid", "");

post.setRequestBody(params);

client.executeMethod(post);

// responseString = new String(post.getResponseBody(), "gbk");

post.releaseConnection();

GetMethod get = new GetMethod("/index.php");

client.executeMethod(get);

responseString = new String(get.getResponseBody(), "gbk");

get.releaseConnection();

System.out.println(responseString);

} catch (Exception e) {

e.printStackTrace();

}

return null;

}

public String getFormHash(String htmlContent) {

try {

int start = htmlContent.indexOf("name=\"formhash\"");

start = htmlContent.indexOf("value=\"", start) + 7;

int end = htmlContent.indexOf("\"", start);

String formhash = htmlContent.substring(start, end);

return formhash;

} catch (RuntimeException e) {

throw e;

}

public static void main(String[] args) {

new BaiyouBBS().login("zzzxxxzzz", "zzzxxxzzz");

}

关于java下载html和JAVA下载网址的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

标签：java下载html