「java截取链接」字符截取java

博主:adminadmin 2023-01-16 19:00:06 569

今天给各位分享java截取链接的知识,其中也会对字符截取java进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

java 字符串 对URL的截取 求 实现类似JS 中 location.pathname的方法

查询 ‘?’ 在url中的位置,可能有两种情况

1.未找到,此时整个url就是 location.pathname

2.找到了。假设位置为index, 那么url.substring(0,index) 就是 location.pathname

java正则表达式截取URL

String reg = ".*\\/\\/([^\\/\\:]*).*";

String str1 = " ";

System.out.println (str1.replaceAll (reg, "$1"));

String str2 = "";

System.out.println (str2.replaceAll (reg, "$1"));

java截取网址图片路径到指定目录。并改写路径地址?

1 你想把src里面的jpg图片保存到本地某个目录路径里面

2 你再把你保存的这个目录路径设置回去

3 抓取网页图片

import java.io.BufferedReader;

import java.io.File;

import java.io.FileOutputStream;

import java.io.InputStream;

import java.io.InputStreamReader;

import java.io.OutputStream;

import java.net.URL;

import java.net.URLConnection;

import java.util.ArrayList;

import java.util.Calendar;

import java.util.List;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

import com.sun.xml.internal.fastinfoset.stax.events.Util;

public class CatchPicture {

public static void main(String[] args) {

// TODO Auto-generated method stub

//定义抓取图片的 正则表达式

String regular="[*]b.*?/bbr/img src=\"(.*?)\" border=0 alt=\'(.*?)\' style=\".*?\" class=\".*?\"

";

ListPicture list=new CatchPicture().lookWeiboPic("","GBK",regular,"2,1");

System.out.println(list.size());

}

//根据URL查看网站上的图片

public ListPicture lookWeiboPic(String url,String charset,String regular,String attIndex){

ListPicture list=new ArrayListPicture();

try {

//获取填写的url

//判断所属网站 获取 正则表达式

//获取图片存放到 list集合

if(!Util.isEmptyString(url)){

String htmls = getPageSource(url.trim(),charset);

Pattern pattern =null;

pattern = Pattern.compile(regular.trim());

if(!Util.isEmptyString(htmls)){

Matcher matcher = pattern.matcher(htmls);

//得到参数属性顺序

String[] sort = regular.trim().split(","); //下标:0 表示 标题title , 1 表示 图片路径 

//判断后缀后 得到网站的请求头部 ;得到 

String[] suffix;

suffix =url.trim().split("cn");

String httphread = "";

if (suffix.length  1) {

httphread = suffix[0] + "cn";

} else {

suffix = url.trim().split("com");

httphread = suffix[0] + "com";

}

//循环匹配找到的

while(matcher.find()){

Picture picture=new Picture();

//匹配出title

if (-1 == Integer.parseInt(sort[0])) {

// 页面上抓不到标题

picture.setTitle("");

} else {

// 去标题的#

String title=matcher.group(Integer.parseInt(sort[0])).replace("#", " ");

picture.setTitle(title);

}

//匹配出source

if (-1 == Integer.parseInt(sort[1])) {

// 页面上抓不到图片路径

picture.setSource("");

}else{

String webImgUrl=matcher.group(Integer.parseInt(sort[1]));

//判断是绝对路径还是相对路径

String[] pathType=webImgUrl.split(":");

if(pathType.length1){

//绝对路径

picture.setSource(webImgUrl);

}else{

//判断相对路径是否含有..

pathType=webImgUrl.split("\\.\\.");

if(pathType.length1){

picture.setSource(httphread+pathType[1]);

}else{

if(webImgUrl.startsWith("/")){

picture.setSource(httphread+pathType[0]);

}else{

picture.setSource(httphread+"/"+pathType[0]);

}

}

}

}

String upPath=upload(picture.getSource(),"d:\\image\\");

picture.setUpPath(upPath);

list.add(picture);

}//--end while

}

}

}catch (Exception e) {

e.printStackTrace();

}

return list;

/**

 * 根据网路路径获取 页面源码

 * @param pageUrl

 * @param encoding

 * @return

 */

public String getPageSource(String pageUrl,String encoding) {    

    StringBuffer sb = new StringBuffer();    

    try {    

        //构建一URL对象    

        URL url = new URL(pageUrl);    

        //使用openStream得到一输入流并由此构造一个BufferedReader对象    

        BufferedReader in = new BufferedReader(new InputStreamReader(url    

                .openStream(), encoding));    

        String line;    

        //读取www资源    

        while ((line = in.readLine()) != null) {    

            sb.append(line);    

            sb.append("\n");  

        }    

        in.close();    

    } catch (Exception ex) {    

        System.err.println(ex);    

    }    

    return sb.toString();    

}   

/**

 * 上传 图片 

 * @param urlStr

 * @param path

 * @return

 * @throws Exception 

 */

public String upload(String urlStr,String path) throws Exception{

Calendar calendar = Calendar.getInstance();

String month = calendar.get(Calendar.YEAR) + "/"

+ (calendar.get(Calendar.MONTH) + 1);

String filename = java.util.UUID.randomUUID().toString()

+ getExtension(urlStr);

path =path + month + "/";

download(urlStr,path,filename);

return path+month + "/" + filename;

}

/**

 * 根据路径 下载图片 然后 保存到对应的目录下

 * @param urlString

 * @param filename

 * @param savePath

 * @return

 * @throws Exception

 */

public void download(String urlString, String filename,String savePath) throws Exception {

    // 构造URL

    URL url = new URL(urlString);

    // 打开连接

    URLConnection con = url.openConnection();

    //设置请求的路径

    con.setConnectTimeout(5*1000);

    // 输入流

    InputStream is = con.getInputStream();

    // 1K的数据缓冲

    byte[] bs = new byte[1024];

    // 读取到的数据长度

    int len;

    // 输出的文件流

   File sf=new File(savePath);

   if(!sf.exists()){

   sf.mkdirs();

   }

   OutputStream os = new FileOutputStream(sf.getPath()+"\\"+filename);

    // 开始读取

    while ((len = is.read(bs)) != -1) {

      os.write(bs, 0, len);

    }

    // 完毕,关闭所有链接

    os.close();

    

    is.close();

/**

 * 根据文件名 获取文件的后缀名

 * @param fileUrl

 * @return

 */

 public String getExtension(String fileUrl){

 return fileUrl.substring(fileUrl.lastIndexOf("."), fileUrl.length());

 }

}

java方法中如何截取地址栏的多个参数值?参数之间用&链接

一些String的相关操作,具体方法使用查看API。

给你实现方法:

首先使用 subString 截取url中的 ? 后的的字符(后面的就是参数列表)

然后通过 split(String regex) 方法传入 “”分割字符串。

java截取链接的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于字符截取java、java截取链接的信息别忘了在本站进行查找喔。