java抓取https的简单介绍

admin 2023-03-21 07:11:09 2675

本篇文章给大家谈谈java抓取https，以及对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。

本文目录一览：

1、java用jpcap怎么识别出http和https的数据包
2、如何使用JAVA请求HTTPS
3、java 获取url中是http还是https
4、java如何提取 https页面上的所有内容
5、如何使用fiddler抓取java（Eclipse）的https（httpClient）请求
6、java如何获取https协议的客户端ip地址

java用jpcap怎么识别出http和https的数据包

暂时的解决方法：

在抓到的tcp数据包的data字段里判断是否包含"HTTP"字符串。

不足：

1.与wireshark对比后发现，wireshark有的tcp包中data字段有HTTP也识别为tcp而非http（不知道wireshark是怎么解析的）。

2.感觉会漏判，不够准确。

继续寻找更好的解法，期待解答！

如何使用JAVA请求HTTPS

1.写http请求方法

[java] view plain copy

//处理http请求 requestUrl为请求地址 requestMethod请求方式，值为"GET"或"POST"

public static String httpRequest(String requestUrl,String requestMethod,String outputStr){

StringBuffer buffer=null;

try{

URL url=new URL(requestUrl);

HttpURLConnection conn=(HttpURLConnection)url.openConnection();

conn.setDoOutput(true);

conn.setDoInput(true);

conn.setRequestMethod(requestMethod);

conn.connect();

//往服务器端写内容也就是发起http请求需要带的参数

if(null!=outputStr){

OutputStream os=conn.getOutputStream();

os.write(outputStr.getBytes("utf-8"));

os.close();

}

//读取服务器端返回的内容

InputStream is=conn.getInputStream();

InputStreamReader isr=new InputStreamReader(is,"utf-8");

BufferedReader br=new BufferedReader(isr);

buffer=new StringBuffer();

String line=null;

while((line=br.readLine())!=null){

buffer.append(line);

}

}catch(Exception e){

e.printStackTrace();

}

return buffer.toString();

}

2.测试。

[java] view plain copy

public static void main(String[] args){

String s=httpRequest("","GET",null);

System.out.println(s);

}

输出结果为的源代码，说明请求成功。

注：1).第一个参数url需要写全地址，即前边的http必须写上，不能只写这样的。

2).第二个参数是请求方式，一般接口调用会给出URL和请求方式说明。

3).第三个参数是我们在发起请求的时候传递参数到所要请求的服务器，要传递的参数也要看接口文档确定格式，一般是封装成json或xml.

4).返回内容是String类，但是一般是有格式的json或者xml。

二：发起https请求。

1.https是对链接加了安全证书SSL的，如果服务器中没有相关链接的SSL证书，它就不能够信任那个链接，也就不会访问到了。所以我们第一步是自定义一个信任管理器。自要实现自带的X509TrustManager接口就可以了。

[java] view plain copy

import java.security.cert.CertificateException;

import java.security.cert.X509Certificate;

import javax.net.ssl.X509TrustManager;

public class MyX509TrustManager implements X509TrustManager {

@Override

public void checkClientTrusted(X509Certificate[] chain, String authType)

throws CertificateException {

// TODO Auto-generated method stub

}

@Override

public void checkServerTrusted(X509Certificate[] chain, String authType)

throws CertificateException {

// TODO Auto-generated method stub

}

@Override

public X509Certificate[] getAcceptedIssuers() {

// TODO Auto-generated method stub

return null;

}

注：1)需要的包都是java自带的，所以不用引入额外的包。

2.)可以看到里面的方法都是空的，当方法为空是默认为所有的链接都为安全，也就是所有的链接都能够访问到。当然这样有一定的安全风险，可以根据实际需要写入内容。

2.编写https请求方法。

[java] view plain copy

* 处理https GET/POST请求

* 请求地址、请求方法、参数

* */

public static String httpsRequest(String requestUrl,String requestMethod,String outputStr){

StringBuffer buffer=null;

try{

//创建SSLContext

SSLContext sslContext=SSLContext.getInstance("SSL");

TrustManager[] tm={new MyX509TrustManager()};

//初始化

sslContext.init(null, tm, new java.security.SecureRandom());;

//获取SSLSocketFactory对象

SSLSocketFactory ssf=sslContext.getSocketFactory();

URL url=new URL(requestUrl);

HttpsURLConnection conn=(HttpsURLConnection)url.openConnection();

conn.setDoOutput(true);

conn.setDoInput(true);

conn.setUseCaches(false);

conn.setRequestMethod(requestMethod);

//设置当前实例使用的SSLSoctetFactory

conn.setSSLSocketFactory(ssf);

conn.connect();

//往服务器端写内容

if(null!=outputStr){

OutputStream os=conn.getOutputStream();

os.write(outputStr.getBytes("utf-8"));

os.close();

}

//读取服务器端返回的内容

InputStream is=conn.getInputStream();

InputStreamReader isr=new InputStreamReader(is,"utf-8");

BufferedReader br=new BufferedReader(isr);

buffer=new StringBuffer();

String line=null;

while((line=br.readLine())!=null){

buffer.append(line);

}

}catch(Exception e){

e.printStackTrace();

}

return buffer.toString();

}

可见和http访问的方法类似，只是多了SSL的相关处理。

3.测试。先用http请求的方法访问，再用https的请求方法访问，进行对比。

http访问：

[java] view plain copy

public static void main(String[] args){

String s=httpRequest("","GET",null);

System.out.println(s);

}

结果为：

https访问：

[java] view plain copy

public static void main(String[] args){

String s=httpsRequest("","GET",null);

System.out.println(s);

}

结果为：

可见https的链接一定要进行SSL的验证或者过滤之后才能够访问。

三：https的另一种访问方式——导入服务端的安全证书。

1.下载需要访问的链接所需要的安全证书。以这个网址为例。

1）在浏览器上访问。

2）点击上图的那个打了×的锁查看证书。

3）选择复制到文件进行导出，我们把它导入到java项目所使用的jre的lib文件下的security文件夹中去，我的是这个路径。D:\Program Files (x86)\Java\jre8\lib\security

注：中间需要选导出格式，就选默认的就行，还需要命名，我命名的是12306.

2.打开cmd,进入到java项目所使用的jre的lib文件下的security目录。

3.在命令行输入 Keytool -import -alias 12306 -file 12306.cer -keystore cacerts

4.回车后会让输入口令，一般默认是changeit,输入时不显示，输入完直接按回车，会让确认是否信任该证书，输入y，就会提示导入成功。

5.导入成功后就能像请求http一样请求https了。

测试：

[java] view plain copy

public static void main(String[] args){

String s=httpRequest("","GET",null);

System.out.println(s);

}

结果：

现在就可以用http的方法请求https了。

注：有时候这一步还是会出错，那可能是jre的版本不对，我们右键run as——run configurations,选择证书所在的jre之后再运行。

java 获取url中是http还是https

先调用 java.net.URL.toURI() 转成 URI

再获取 java.net.URI.getScheme()

示例:

public static void main(String[] args) throws MalformedURLException,URISyntaxException{

URL url = new URL("");

URI uri = url.toURI();

System.out.println(uri.getScheme());

}

结果:

https

java如何提取 https页面上的所有内容

public static void main(String[] args){

String s = "div id=\"hao_my_like\" monkey=\"cool\"ba href=\" \"我喜欢的网站：/a/bspan/span/div";

Pattern pattern = Pattern.compile("a .*href=(['\"])(.*)\\1(.*)/a",Pattern.CASE_INSENSITIVE);

Matcher matcher = pattern.matcher(s);

while(matcher.find()){

System.out.println(matcher.group());

System.out.println(matcher.group(2));

System.out.println(matcher.group(3));

}

就这个，上面打印的第二行就是链接，第三行就是文字

补充：

Pattern pattern = Pattern.compile("a .*href=(['\"])(.*)\\1(.*)/a",Pattern.CASE_INSENSITIVE);

这个改为

Pattern pattern = Pattern.compile("a .*href=(['\"])(.*)\\1.*(.*)/a",Pattern.CASE_INSENSITIVE);

更能适应一般情况

如何使用fiddler抓取java（Eclipse）的https（httpClient）请求

可使用android自带的httpclient框架实现。

1. GET 方式传递参数

//先将参数放入List，再对参数进行URL编码

ListBasicNameValuePair params = new LinkedListBasicNameValuePair();

params.add(new BasicNameValuePair("param1", "数据")); //增加参数1

params.add(new BasicNameValuePair("param2", "value2"));//增加参数2

String param = URLEncodedUtils.format(params, "UTF-8");//对参数编码

String baseUrl = "服务器接口完整URL";

HttpGet getMethod = new HttpGet(baseUrl + "?" + param);//将URL与参数拼接

HttpClient httpClient = new DefaultHttpClient();

try {

HttpResponse response = httpClient.execute(getMethod); //发起GET请求

Log.i(TAG, "resCode = " + response.getStatusLine().getStatusCode()); //获取响应码

Log.i(TAG, "result = " + EntityUtils.toString(response.getEntity(), "utf-8"));//获取服务器响应内容

} catch (ClientProtocolException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

}

2. POST方式方式传递参数

//和GET方式一样，先将参数放入List

params = new LinkedListBasicNameValuePair();

params.add(new BasicNameValuePair("param1", "Post方法"));//增加参数1

params.add(new BasicNameValuePair("param2", "第二个参数"));//增加参数2

try {

HttpPost postMethod = new HttpPost(baseUrl);//创建一个post请求

postMethod.setEntity(new UrlEncodedFormEntity(params, "utf-8")); //将参数填入POST Entity中

HttpResponse response = httpClient.execute(postMethod); //执行POST方法

Log.i(TAG, "resCode = " + response.getStatusLine().getStatusCode()); //获取响应码

Log.i(TAG, "result = " + EntityUtils.toString(response.getEntity(), "utf-8")); //获取响应内容

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

} catch (ClientProtocolException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

}

java如何获取https协议的客户端ip地址

嗨你好

据网上了解到：

在JSP里，获取客户端的IP地址的方法是：request.getRemoteAddr（），这种方法在大部分情况下都是有效的。但是在通过了Apache，Squid等反向代理软件就不能获取到客户端的真实IP地址了。

如果使用了反向代理软件，将：2046/ 的URL反向代理为 / 的URL时，用request.getRemoteAddr（）方法获取的IP地址是：127.0.0.1　或　192.168.1.110，而并不是客户端的真实IP。

经过代理以后，由于在客户端和服务之间增加了中间层，因此服务器无法直接拿到客户端的IP，服务器端应用也无法直接通过转发请求的地址返回给客户端。但是在转发请求的HTTP头信息中，增加了X－FORWARDED－FOR信息。用以跟踪原有的客户端IP地址和原来客户端请求的服务器地址。当我们访问 /index.jsp/ 时，其实并不是我们浏览器真正访问到了服务器上的index.jsp文件，而是先由代理服务器去访问：2046/index.jsp ，代理服务器再将访问到的结果返回给我们的浏览器，因为是代理服务器去访问index.jsp的，所以index.jsp中通过request.getRemoteAddr（）的方法获取的IP实际上是代理服务器的地址，并不是客户端的IP地址。

于是可得出获得客户端真实IP地址的方法一：

public String getRemortIP(HttpServletRequest request) { if (request.getHeader("x-forwarded-for") == null) { return request.getRemoteAddr(); } return request.getHeader("x-forwarded-for"); }

可是当我访问 /index.jsp/ 时，返回的IP地址始终是unknown，也并不是如上所示的127.0.0.1　或　192.168.1.110了，而我访问：2046/index.jsp 时，则能返回客户端的真实IP地址，写了个方法去验证。原因出在了Squid上。squid.conf 的配制文件　forwarded_for 项默认是为on，如果 forwarded_for 设成了 off 　则：X-Forwarded-For： unknown

于是可得出获得客户端真实IP地址的方法二：

public String getIpAddr(HttpServletRequest request) { String ip = request.getHeader("x-forwarded-for"); if(ip == null || ip.length() == 0 || "unknown".equalsIgnoreCase(ip)) { ip = request.getHeader("Proxy-Client-IP"); } if(ip == null || ip.length() == 0 || "unknown".equalsIgnoreCase(ip)) { ip = request.getHeader("WL-Proxy-Client-IP"); } if(ip == null || ip.length() == 0 || "unknown".equalsIgnoreCase(ip)) { ip = request.getRemoteAddr(); } return ip; }

可是，如果通过了多级反向代理的话，X-Forwarded-For的值并不止一个，而是一串Ip值，究竟哪个才是真正的用户端的真实IP呢？

答案是取X-Forwarded-For中第一个非unknown的有效IP字符串。

如：X-Forwarded-For：192.168.1.110， 192.168.1.120， 192.168.1.130， 192.168.1.100用户真实IP为： 192.168.1.110

希望可以帮到你的忙

祝你学习愉快

java抓取https的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于、java抓取https的信息别忘了在本站进行查找喔。

标签：java抓取https