当前位置: 首页 > news >正文

wordpress站添加根部单页打不开做图网站

wordpress站添加根部单页打不开,做图网站,好域名推荐,php手机网站模板目录 前言 一、正则基本使用 1.1 导包 1.2 接口方法 1.3 换行匹配问题 二、实战案例 完整代码 前言 在爬虫工作中#xff0c;我们主要会遇到两种类型的文本数据#xff1a; JSON格式数据 HTML文档数据 对于JSON字符串数据#xff0c;通常使用Python的字典操作进行键…目录 前言 一、正则基本使用 1.1 导包 1.2 接口方法 1.3 换行匹配问题 二、实战案例 完整代码 前言 在爬虫工作中我们主要会遇到两种类型的文本数据 JSON格式数据 HTML文档数据 对于JSON字符串数据通常使用Python的字典操作进行键值对提取或者使用正则语法 对于HTML文档则主要采用XPath表达式和CSS选择器bs4进行数据解析和提取。 一、正则基本使用 1.1 导包 import re 1.2 接口方法 re.findall(参数1,参数2) 参数1写正则语法匹配规则 参数2 字符串数据 例1匹配 id 的内容 import re # 1,字符串数据 str meta idmy name is zhouhuan http-equivContent-Type contenttext/html;charsetutf-8中国共??产yes党 # 2,匹配语法 result re.findall(id(.*?) http,str) # 3,打印结果 print(result) .*?要匹配的内容换成 .*? () 只会返回括号内的内容 例2匹配所有中文 import re # 1,字符串数据 str meta idmy name is zhouhuan http-equivContent-Type contenttext/html;charsetutf-8中国共??产yes党 # 2,匹配所有中文 result re.findall([\u4e00-\u9fa5],str) # 3,打印结果 print(result) 例3过滤和替换非法字符 import re # 1,字符串数据 str abc?de|fghi:jk # 2,过滤非法字符 result1 re.findall([\\\\/:*?\|],str) # 3,替换非法字符 result2 re.sub([\\\\/:*?\|],_,str) # 4,打印结果 print(过滤的非法字符有,result1) print(替换后的str字符串为,result2) 1.3 换行匹配问题 import re # 1,换行匹配问题 str div中国共产党万岁/div# 2,规则默认是在一行匹配换行后重新匹配所以匹配到的是空 [] result re.findall(div(.*?)/div,str) # 打印结果 print(result) # [] 解决方案待定... 二、实战案例 需求爬取斗鱼直播星秀板块直播的主播《标题》和《网名》 链接url星秀直播_星秀视频_斗鱼直播 分析步骤 1先抓包找到需要的目标 url 2先打印一下爬取到的所有数据 完整代码 import re import requests # 实战之爬取斗鱼星秀板块主播标题 # 1目标url url https://www.douyu.com/wgapi/ordnc/live/web/room/mixList/2/1008/0/1? # 2身份伪装 header{User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/133.0.0.0 Safari/537.36 } # 3发起请求 response requests.get(urlurl,headersheader) # 4打印响应内容确认是否获得响应 # print(response.text) # 5使用正则解析:主播标题 title_list re.findall(rn:(.*?),response.text) print(title_list) # 6使用正则解析:主播名字 name_list re.findall(nn:(.*?),response.text) print(name_list)# 7展示数据:len(title_list) 打印列表的长度 print(主播网名 直播标题) for i in range(len(title_list)):print(name_list[i],,title_list[i])
http://www.w-s-a.com/news/749716/

相关文章:

  • 国外有哪些网站是做弱电的中国国家培训网正规吗
  • 30分钟网站建设教程视频全屋整装120平米的多少钱
  • 生成链接的网站aso优化平台
  • 策划网站建设方案电商扶贫网站建设
  • 网站策划建设方法企业网站建设问题研究
  • 昆明专业网站建设的公司帮别人制作wordpress赚钱吗
  • 高校校园网站建设天水市建设局网站公告
  • 北京网站建设需要花多少钱企业建设网站的目的是
  • 网站模板 免费百度seo优化招聘
  • 过年做那些网站能致富怎样免费建立自己网站
  • 网站去哪里备案长沙网络推广
  • 企业网站规划书vue适合什么样的网站开发
  • 个人网站备案名字网站设计的提案
  • 网站自己做还是找人做常州钟楼区邹区建设局网站
  • 网站文件上传wordpress修改asp做微网站
  • 妇女之家网站建设方案英语不行如何编程做网站
  • 深圳企业网站建设推广服务网站托管一年多少钱
  • wordpress 百度地图api网络seo天津
  • 网站营销咨询顾问餐饮加盟网站建设方案
  • 网站后台管理系统的重要技术指标wordpress下单邮件通知的实现
  • 通化县住房和城乡建设局网站定制网站收费
  • 湖北做网站教程哪家好成都网站建设询q479185700上快
  • 网站的seo方案鹰潭做网站的公司
  • 高级室内设计网站太原网站设计费用
  • 智信建设职业培训学校网站深圳做网站建设开发
  • 宣城市住房和城乡建设局网站网站界面设计专利
  • 免费个人网站建站申请如何做内网网站
  • 福州专业网站建设怎么做黄骅港怎么读
  • 望京 网站建设深圳发型网站建设
  • 电商网站的相同点医疗网站建设代理商