当前位置: 首页 > news >正文

镇江网站建设价格做网站和推广工资多少

镇江网站建设价格,做网站和推广工资多少,做网站时空间的选择,wordpress是php文件路径#x1f3c6; 作者简介#xff1a;席万里 ⚡ 个人网站#xff1a;https://dahua.bloggo.chat/ ✍️ 一名后端开发小趴菜#xff0c;同时略懂Vue与React前端技术#xff0c;也了解一点微信小程序开发。 #x1f37b; 对计算机充满兴趣#xff0c;愿意并且希望学习更多的技… 作者简介席万里 ⚡ 个人网站https://dahua.bloggo.chat/ ✍️ 一名后端开发小趴菜同时略懂Vue与React前端技术也了解一点微信小程序开发。 对计算机充满兴趣愿意并且希望学习更多的技术接触更多的大神提高自己的编程思维和解决问题的能力。 如果本篇文章对友友你有所帮助那还请点个小赞赞~ 文章目录 谁为影狂-豆瓣数据【数据获取与预处理课设】1.数据获取可行性及需求分析1.1 课题背景1.2 目的和意义1.3 主要研究内容1.4 课程设计创新点概述 2.核心算法2.1 算法描述2.2 问题总结 4.详细设计4.1 流程图4.2 代码4.3 效果展示 5. 总结 谁为影狂-豆瓣数据【数据获取与预处理课设】 1.数据获取可行性及需求分析 1.1 课题背景 《数据获取与预处理》是一门实践性较强的软件基础课程为了学好这门课程必须在掌握理论知识的同时加强上机实践也要加强同其他学科的关联。本课程设计的目的就是要达到理论与实际应用相结合使同学们能够根据特定的案列学会分析爬取页面的方法学会数据组织的方法能把现实世界中的实际问题在计算机内部表示出来能够运用数据获取与预处理的原理和方法解决简单的实际问题逐步培养学生良好的程序设计能力。 1.2 目的和意义 1目的从豆瓣top250上面获取的电影名称、导演和演员、评分、排名、图片等信息并保存下来 2意义通过对电影数据的分析得出自己想要的信息。 1.3 主要研究内容 本文的主要研究内容包括下面两个部分。 1分析网页 对网页进行分析寻找规律获得想要的数据链接 2数据的提取与保存 对从网站中获取的信息进行分析提取所需要的信息并把这些信息保存下来并将部分信息做成折线图。 1.4 课程设计创新点概述 在实现时学到不同的方法读取和存储数据实现按两种不同的xpath方法分别存电影封面图片和电影名称、导演和演员、评分、排名、简介等信息对网页的分析更加详细。并对爬取的信息进行了处理获取的数据信息更加简洁看起来更轻松 2.核心算法 2.1 算法描述 for start_num in range(0, 250, 25)进行10次循环每次读取25个电影的图片信息分步实现可以方便查出程序问题requests.get向网页发出请求。 response requests.get(fhttps://movie.douban.com/top250?start{start_num}, headersheaders) 后面用网页上分析复制下来的xpath获取对应数据 lis html.xpath(//*[idcontent]/div/div[1]/ol/li) 存放到文件和列表中按列表前十绘制折线图 2.2 问题总结 代码量大代码有部分太过于繁琐对于折线图的绘制函数调用不是很合理绘制图是在程序运行中实现导致不关掉折线图就无法继续爬取数据。网络爬虫如果不严格控制网络采集的速度会对被采集网站服务器造成很重的负担。恶意消耗别人网站的服务器资源甚至是拖垮别人网站是一件不道德的事情。 本人承诺本次课题中爬取的数据都是公开数据取得数据的手段合法项目中爬取取得的所有数据仅供学习使用非商用且没有对网站造成伤害 4.详细设计 首先根据url访问到电影网站页面通过request请求访问到电影信息调用读取电影封面函数读取电影封面和链接将网络上的内容下载到本地保存在c盘的douban文件中再调用获取电影信息函数读取电影名、导演和演员、评分、排名、简介等信息以及信息并把它们分别保存在豆瓣top250.csv文件中以及把排行前10的电影评分和评价人数做成折线图。 4.1 流程图 4.2 代码 打开豆瓣网站右键鼠标选择检查点击网络在里面获得user-agent,再获取网页规律得出url通过requests.get函数赋值给response headers {User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36 Edg/113.0.1774.57} i 0 for start_num in range(0, 250, 25):# 发起get请求:get方法会返回请求成功的响应对象response requests.get(fhttps://movie.douban.com/top250?start{start_num}, headersheaders) # urltime.sleep(random.uniform(0.5, 1))img(response.text, start_num)massage(response, i)i 1存储图片函数先对网页分析再用etree.HTML()函数将字符串网页转换成_Element对象再用列表存储电影信息然后分别用title存放电影标题img_url存放电影封面地址再用urllib.request.urlretrieve方法将网上内容下载本地文件夹 element html.etree.HTML(response)# 用response.text获取字符串格式的网页用etree.HTML()可以将字符串格式的网页转换成_Element对象lis element.xpath(//ol[classgrid_view])[0]i 1for li in lis:title li.xpath(.//span[classtitle]/text())[0] # 获取影片标题img_url li.xpath(.//img/src)[0] # 获取封面地址#封面地址在img这个标签下的src属性中file_name C:/douban/ str(start_num i) . title .jpg # 点号能防止和名字粘在一起urllib.request.urlretrieve(img_url, filenamefile_name) # 将网络上的文件下载到本地。该函数有两个必须的参数第一个是文件的 URL 地址第二个是本地文件的路径i 1绘制折线图函数将列表中前10个电影名称评分评价人数按xy轴画折线图 mpl.rcParams[font.sans-serif] [SimHei] # 指定默认字体SimHei为黑体movies movies[:10] # 取排名前十eval_num eval_num[:10]rating rating[:10]movies movies[::-1]#切片eval_num eval_num[::-1]rating rating[::-1]fig, ax1 plt.subplots() #返回一个包含一个 Axes 对象的 tupleAxes 对象被赋值给了变量 ax1fig.set_size_inches(10, 7) # 设置画布的尺寸ax2 ax1.twinx() ax1.plot(movies, eval_num, colorblue, label评价数, markero)ax1.set_xlabel(电影名称, fontsize16) # 设置x轴标签的文本内容#字体高度ax1.set_ylabel(评价数, colorblue, fontsize16) # 设置y轴标签的文本内容ax1.tick_params(axisy, labelcolorblue) # axisy 表示设置y轴的刻度线和刻度标签ax1.legend(locupper left) # 将标签的位置设置在画布顶部中央ax2.plot(movies, rating, colorred, label评分, marker^)ax2.set_ylabel(评分, colorred, fontsize16) # 设置y轴标签的文本内容ax2.tick_params(axisy, labelcolorred)ax2.spines[right].set_position((axes, 1))ax2.legend(locupper center)plt.title(电影评价数及评分折线图, fontsize18) # 设置标题plt.show()调用存储电影信息文件在网页选择整个电影获取html.xpath再用相同的方法获取电影名、导演和演员、评分、排名、简介等信息的xpath在程序中处理得到我们想要的数据并打印然后存入豆瓣top250.csv文件下方调用函数绘制折线图。 html etree.HTML(res.text)lis html.xpath(//*[idcontent]/div/div[1]/ol/li) # 整个电影的信息movies [] # 电影名称列表eval_num [] # 评价数列表rating [] # 评分列表for li in lis:title li.xpath( ./ div / div[2] / div[1] / a / span[1]/text())[0]link li.xpath(./div/div[2]/div[1]/a/href)[0] # href超链接director li.xpath(./div/div[2]/div[2]/p[1]/text())[0].strip() score li.xpath(./div/div[2]/div[2]/div/span[2]/text())[0] peonum li.xpath(./div/div[2]/div[2]/div/span[4]/text())[0]intd getintd(li) # 有些电影没有简介返回空列表报错list index out of rangeprint(title, link)print(director)print(评分:, score)print(评价人数:, .join(filter(str.isdigit, peonum))) # 只保留数字print(简介:, intd)movies.append(title)eval_num.append(.join(filter(str.isdigit, peonum)))rating.append(score)with open(./豆瓣top250.csv., a, newline, encodingutf-8-sig) as fp: writer csv.writer(fp)writer.writerow((title, link, director, score, peonum, intd))if i 0:movie_visual(movies, eval_num, rating)4.3 效果展示 5. 总结 在这次数据获取与预处理实训中我学到了对request库的运用以及Python中调用各种库的便利同时也加强了我通过使用lxml中etree对爬取到的数据进行Xpath解析的运用。也学会了分析爬取页面的方法以及数据提取的方法。对于爬虫这项技术我表现出很大的热情我觉得这项技术非常实在有用当然我们也不能违背法律要合理运营爬虫。 注本人承诺本次课题中爬取的数据都是公开数据取得数据的手段合法项目中爬取取得的所有数据仅供学习使用非商用且没有对网站造成伤害 。
http://www.w-s-a.com/news/283400/

相关文章:

  • 无锡手机网站建设服务苏州展厅设计企业
  • 无锡网站制作需要多少钱北京二次感染最新消息
  • 网站开发视频播放无画面杭州房产信息网官网
  • 网站开发 改进如何创建公众号平台
  • wordpress网站响应很慢只有asp网站代码可以重新编译吗
  • 哪个网站教做饭做的好wordpress热点文章
  • 可以做推广东西的网站重庆网站建设 重庆网站制作
  • 珠海网站建设培训学校wordpress去版权 合法
  • 建设食品商购网站学校网站设计实验报告
  • 建个网站多少钱沭阳奥体小区做网站的
  • 广州视频网站建站公司php网页设计作业代码
  • 成都公司网站设计如何制作网址最简单的方法
  • 温州 做网站福建住房城乡建设部网站
  • 网站自动化采集成都网站设计费用
  • 广东专业网站定制建设淘宝网站的人员组织结构
  • 网站改版seo无锡有多少家公司
  • h5美食制作网站模板下载wordpress大学百度云
  • 零陵做网站建立网站的公司平台
  • 某企业电子商务网站建设网站开发实验结论
  • 自己做的网站突然打不开杭州哪些做网站公司好
  • 株洲专业建设网站免费cms内容管理系统
  • 网上建立网站赚钱网站建设方案书纯文字
  • 专业网站设计哪家好it外包合同模板
  • 个人网站备案都需要什么中小企业服务网
  • 佛山网站建设哪个在公司网站投简历该怎么做
  • 八戒网站做推广老域名全部失效请拿笔记好
  • iss服务器网站建设甘肃建设厅网站执业注册中心
  • 域名访问网站 过程网站 免费 托管运营
  • 下单的网站建设教程wordpress php7.1
  • 爱网站查询怎么做网站的图片跳转