如何使用jsoup解析HTML之获取html源码

2024-11-19 06:20:16
推荐回答(1个)
回答(1):

新建一个Java工程,命名为JsoupDemo。然后导入jsoup的jar包。 下面分别来演示几种获取Document对象的方法。 从字符串中解析Dom 使用Jsoup的parse(String html)类方法,可以从字符串中获取Document对象,然后再进行详细的解析。 从URL中获取Document对象 connect(String url)方法将会得到一个Connection类的实例,Connection类是HttpConnection的子类,然后调用get()方法,将会发送get请求,返回一个Document对象。类似的,我们也可以通过post()获取,主要是看我们的请求类型是get还是post。如果请求需要参数,我们可以使用Map构造参数,然后通过data(Map params)方法设置。得到Document对象后,我们就可以对其进行解析。 从文件中获取Document对象 当我们本地有一个html文件时,我们可以使用parse(File in, String charsetName)方法从本地文件中获取Document对象。