当前位置: 首页 > news >正文

title:(网站建设)免费行情软件app网站mnw直

title:(网站建设),免费行情软件app网站mnw直,增城住房和城乡建设局网站,wordpress 导购按钮原项目链接 Java爬虫抓取豆瓣图书信息 本地运行 运行过程 另建项目#xff0c;把四个源代码文件拷贝到自己的包下面 在代码爆红处按ALTENTER自动导入maven依赖 直接运行Main.main方法#xff0c;启动项目 运行结果 在本地磁盘上生成三个xml文件 其中的内容即位爬取…原项目链接 Java爬虫抓取豆瓣图书信息 本地运行 运行过程 另建项目把四个源代码文件拷贝到自己的包下面 在代码爆红处按ALTENTER自动导入maven依赖 直接运行Main.main方法启动项目 运行结果 在本地磁盘上生成三个xml文件 其中的内容即位爬取后到的图书信息包括 书名作者名出版社名isbn号图书对应的豆瓣链接图书封面图片地址 可惜并没有直接爬取到图书的内容不过可以凭借爬取得到的图书元数据去其他网站获取电子版pdf 项目运行逻辑 使用apache提供的httpclient工具包手动创建一个http客户端使用该http客户端向豆瓣官网发送GET请求获取response相应数据类型为html页面使用正则表达式工具匹配得到的html页面中有关图书信息的项利用dom4j库将这些图书信息项转换成xml元素并存储到本地 收获 CloseableHttpClient接口 该接口代表一个http客户端实现类可以是InternalHttpClient 创建一个默认http客户端 创建一个不使用代理的默认客户端使用如下代码 CloseableHttpClient httpClient HttpClients.createDefault();创建一个使用代理的http客户端 CloseableHttpClient httpClient HttpClients.custom().setProxy(new HttpHost(ip,port)).build();上述代码可以拆解为 //新建一个完全默认的HttpClientBuilder HttpClientBuilder hb HttpClients.custom(); //为该HttpClientBuilder设置代理setProxy方法修改当前hb的代理属性后返回this自身 hb hb.setProxy(new HttpHost(ip,port)); //调用build方法完成http客户端的构造 CloseableHttpClient httpClient hb.build();关于Java程序内设置的代理与操作系统设置的全局代理的关系在这篇文章中有更详细的说明【Java程序代理与系统代理关系】 多个重复任务使用多线程解决 ListThread threadList new LinkedListThread(); while (...) {threadList.add(new AClassExtendsThread(...)); } for (Thread thread:threadList) {thread.start(); } for (Thread thread:threadList) {try {thread.join();} catch (InterruptedException e) {e.printStackTrace();} }使用dom4j写入xml文件 Writer fileWriter; Element root;//xml根标签内含要写入的所有信息这些信息通过其他代码已经存入root中 String fileAddress; try {fileWriter new FileWriter(fileAddress);XMLWriter xmlWriter new XMLWriter(fileWriter);xmlWriter.write(root);xmlWriter.close();System.out.println([ fileAddress ]写入成功); } catch (IOException e) {e.printStackTrace(); }正则表达式匹配 String regex;//正则表达式 Pattern xxxRegex Pattern.compile(regex); m xxxRegex.matcher(entityString); while (m.find()) {//执行对应操作 }dom4j标签操作 Element为元素类或标签类 Document newDocument DocumentHelper.createDocument(); Element rootElement newDocument.addElement(root);添加属性代码 bookElement.addAttribute(id,attribute);添加子标签代码 bookElement.addElement(name).setText(bookName);
http://www.w-s-a.com/news/501791/

相关文章:

  • 网站设计的导航栏怎么做太原有网站工程公司吗
  • 苏州虎丘区建设局网站如何在一个数据库做两个网站
  • 淘宝天猫优惠券网站建设费用腾讯邮箱企业邮箱登录
  • 深圳福田做网站公司海航科技网站建设
  • 网站降权查询wordpress更换文章背景色
  • 大型电商网站开发金融企业网站建设公司
  • 成都营销型网站建设价格化妆品品牌推广方案
  • 深圳公司手机网站制作苏州网站推广哪家好
  • 网站建设开发方式包括购买学校网站建设费计入什么科目
  • 做简单网站的框架图中小微企业查询平台
  • 哪些网站可以免费做产品推广建设建设部网站
  • 网站开发销售怎么做django做网站
  • 淘宝客网站做百度竞价万网域名怎么绑定网站
  • 建设网站找哪个公司北京知名大公司有哪些
  • 专业彩票网站开发网站流量在哪设置
  • 网站建设对应的岗位榆林做网站公司
  • 网站建设公司怎么算专业js网站分页怎么做
  • 网和网站的区别phpcms和帝国cms哪个好
  • wordpress改网站名字长沙网络营销外包
  • 宝塔怎么做第二个网站网站内容设计遵循的原则有
  • 网站违反了 google 质量指南免费ppt模版网站
  • 郑州网站建设郑州网站建设成都那家网站建设好
  • 温州网站排名优化公司如何招聘软件网站开发人员
  • 成都 网站建设公司哪家好襄阳行业网站建设
  • wordpress 调用时间做网站seo的公司哪家好
  • 手机上网站搭建网站账户系统
  • 西乡网站的建设柳州建站
  • 宁夏网站建设怎么样互联网 网站设计
  • 成都关键词seo推广平台手机端关键词排名优化软件
  • 学做软件的网站卡盟平台