网站建设 >

查看其它板块

JAVA超级简单的爬虫实例讲解-创新互联

爬取整个页面的数据，并进行有效的提取信息，注释都有就不废话了：

创新互联建站是一家专业提供牟定企业网站建设,专注与成都网站建设、成都做网站、H5响应式网站、小程序制作等业务。10年已为牟定众多企业、政府机构等服务。创新互联专业网站设计公司优惠进行中。

public class Reptile {
 
 public static void main(String[] args) {  
 String url1="";   //传入你所要爬取的页面地址
 InputStream is=null;  //创建输入流用于读取流
 BufferedReader br=null; //包装流,加快读取速度
 StringBuffer html=new StringBuffer(); //用来保存读取页面的数据.
 String temp=""; //创建临时字符串用于保存每一次读的一行数据，然后html调用append方法写入temp;
 try {
  URL url2 = new URL(url1); //获取URL;
  is = url2.openStream(); //打开流，准备开始读取数据;
  br= new BufferedReader(new InputStreamReader(is)); //将流包装成字符流，调用br.readLine()可以提高读取效率，每次读取一行;
  while ((temp = br.readLine()) != null) {//读取数据,调用br.readLine()方法每次读取一行数据,并赋值给temp,如果没数据则值==null,跳出循环;
  html.append(temp); //将temp的值追加给html,这里注意的时String跟StringBuffere的区别前者不是可变的后者是可变的;
  }
  //System.out.println(html); //打印出爬取页面的全部代码;
  if(is!=null)  //接下来是关闭流,防止资源的浪费;
  {
   is.close();
   is=null;
  }
  Document doc=Jsoup.parse(html.toString()); //通过Jsoup解析页面,生成一个document对象;
  Elements elements=doc.getElementsByClass("XX");//通过class的名字得到（即XX）,一个数组对象Elements里面有我们想要的数据,至于这个div的值呢你打开浏览器按下F12就知道了;
  for (Element element:elements) {
   System.out.println(element.text()); //打印出每一个节点的信息;你可以选择性的保留你想要的数据,一般都是获取个固定的索引;  
  }   
 } catch (MalformedURLException e) {
  // TODO Auto-generated catch block
  e.printStackTrace();
 } catch (IOException e) {
  // TODO Auto-generated catch block
  e.printStackTrace();
 }
 
 
 
}

名称栏目：JAVA超级简单的爬虫实例讲解-创新互联
本文网址：http://cdkjz.cn/article/ccejid.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

彩乐斯贸易成都企业网站建设成都响应式网站发光字制作温岭熙道网站成都logo设计标志简阳电信服务器托管成都移动服务器托管四川雕琢时光盐亭做网站

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

JAVA超级简单的爬虫实例讲解-创新互联

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

JAVA超级简单的爬虫实例讲解-创新互联

相关资讯

go语言写入word文档 golang写入文件

gis平台开发技术攻关 gis开发平台有哪些

c语言中对函数没有评估 c语言中对函数没有评估怎么办

go语言上传一个file go语言写入文件

下载帝国cms原代码 帝国cms80版

怎么查看mysql版本 mysql创建数据库

zblog相册 zblogphp

php大批量导入数据库 phpexcel导入大量数据

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

下载帝国cms原代码帝国cms80版

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接