栏目分类:
子分类:
返回
文库吧用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
文库吧 > IT > 软件开发 > 后端开发 > Java

使用Jsoup解析URL结果、解析DOM片段、解析HTML片段简单示例

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

使用Jsoup解析URL结果、解析DOM片段、解析HTML片段简单示例

目录
  • 1、Jsoup是什么
  • 2、Jsoup解析URL返回结果
  • 3、Jsoup解析HTML片段

1、Jsoup是什么

Jsoup是java的HTML解析器,可以解析请求URL的返回结果,可以解析HTML的片段内容,其实主要用来解析HTML内容的。

pom.xml文件引入:



    org.jsoup
    jsoup
    1.14.3

2、Jsoup解析URL返回结果
package com.xxx.xxx.utils;

import java.io.IOException;

import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;


public class JsoupHttpUtil {
	
	public static void main(String[] args) {
		Document doc = JsoupHttpUtil.get("https://www.baidu.com");
		System.out.println(doc.toString());
	}
	
	
	public static Document get(String url){
		try{
			Connection conn = Jsoup.connect(url);
			conn.header("Accept", "text/javascript, application/javascript, application/ecmascript, application/x-ecmascript, */*; q=0.01");
			conn.header("Referer", url);
			conn.header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36");
			conn.header("X-Requested-With", "XMLHttpRequest");
		    return conn.get();
		} catch (IOException e) {
		    e.printStackTrace();
		    return null;
		}
	}

}
3、Jsoup解析HTML片段

HTML片段:


代码:

String each = "点击跳转下一页";

//将html片段转成Document对象
Document div = Jsoup.parse(each);
//获取到所有的属性有target的标签,然后取第一个
Element a = div.getElementsByAttribute("target").get(0);
//获取a标签内部的所有的em的元素集合
Elements em = a.getElementsByTag("em");
转载请注明:文章转载自 www.wk8.com.cn
本文地址:https://www.wk8.com.cn/it/1039467.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 wk8.com.cn

ICP备案号:晋ICP备2021003244-6号