当前位置：首页 > news >正文

江门公司网站制作销售方案怎么写

news 2025/12/20 19:25:33

江门公司网站制作,销售方案怎么写,做网站的结论,网页制作教程考拉一、查找对应链接 # 警告#xff1a;以下代码仅供学习和交流使用#xff0c;严禁用于任何违法活动。 # 本代码旨在帮助理解和学习编程概念#xff0c;不得用于侵犯他人权益或违反法律法规的行为。 1、打开百度页面百度一下#xff0c;你就知道 2、点击F12 或右键鼠标…一、查找对应链接 # 警告以下代码仅供学习和交流使用严禁用于任何违法活动。 # 本代码旨在帮助理解和学习编程概念不得用于侵犯他人权益或违反法律法规的行为。 1、打开百度页面百度一下你就知道 2、点击F12 或右键鼠标选择下方的检查进入调试模式 3、选择Network 选项点击显示全部信息 all 完成第二步后点击左上角的刷新或快捷键 CtrlR 进行刷新就会出现第三个点的信息我们可以看到显示的信息正是我们所需要的证明这就是我们需要的目标链接 4、点回 Headers 看一下资源链接和请求方式方便后续操作可以看到请求链接为百度一下你就知道请求方式为GET 请求状态码为 200表示成功回到我们的IDE编辑器中开始动手敲代码二、编辑代码 1、导入第三方库 requests 这是一个用于请求网页链接获取对应信息的第三方库导入前需要在终端中进行安装 pip install requests 2、向对应链接发送请求并查看状态码若是200 表示请求成功这时的内容还是比较混乱的我们需要对信息做一步清洗提取所需要的一部分内容 3、目标url url https://www.baidu.com/ 4、构造请求头为防止服务器识别到异常请求而不返回数据我们需要模拟浏览器发送请求 #构建请求头模拟浏览器发送请求否者会被检测到返回信息就为空 headers {user-agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36 } 5、使用正则表达式提取热搜的内容部分正则表达式返回的数据类型为列表 #清洗源码提取关键信息 re_title re.findall(card_title: (.*?),response) #获取热搜标题 re_linkurl re.findall(linkurl: (.*?),response) #热搜对应链接 re_index re.findall(index: (.*?),response) #热搜排名 6、打印后发现百度热搜的链接做了百分比加密无法直接使用需要进一步解密 from urllib.parse import unquote_plus #导入解码库默认链接采用了百分比编码无法直接使用需要进行解码 # 包含URL编码的字符串 encoded_url_list re_linkurl list_url [] #创建一个列表用户存放解码后的链接 for i in encoded_url_list: #遍历url列表decoded_url unquote_plus(i) # 使用unquote_plus函数解码URL print(decoded_url) # 打印解码后的URLlist_url.append(decoded_url) #将解码后的链接放入列表中 print(len(list_url)) #查看列表长度信息是否完全获取三、完整代码 # 警告以下代码仅供学习和交流使用严禁用于任何违法活动。 # 本代码旨在帮助理解和学习编程概念不得用于侵犯他人权益或违反法律法规的行为。 import requests #导入第三方请求库 import re #目标url url https://www.baidu.com/ #构建请求头模拟浏览器发送请求否者会被检测到返回信息就为空 headers {user-agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36 } #发送请求获取网页源码 response requests.get(url,headersheaders).text #清洗源码提取关键信息 re_title re.findall(card_title: (.*?),response) #获取热搜标题 re_linkurl re.findall(linkurl: (.*?),response) #热搜对应链接 re_index re.findall(index: (.*?),response) #热搜排名 print(re_index,re_title,re_linkurl) from urllib.parse import unquote_plus #导入解码库默认链接采用了百分比编码无法直接使用需要进行解码 # 包含URL编码的字符串 encoded_url_list re_linkurl list_url [] #创建一个列表用户存放解码后的链接 for i in encoded_url_list: #遍历url列表print(i)# 使用unquote_plus函数解码URLdecoded_url unquote_plus(i) # 打印解码后的URLprint(decoded_url)list_url.append(decoded_url) #将解码后的链接放入列表中 print(len(list_url)) #查看列表长度信息是否完全获取 # 警告以下代码仅供学习和交流使用严禁用于任何违法活动。 # 本代码旨在帮助理解和学习编程概念不得用于侵犯他人权益或违反法律法规的行为。

查看全文

http://www.w-s-a.com/news/198580/