当前位置: 首页 > news >正文

星沙网站建设西地那非能提高硬度吗

星沙网站建设,西地那非能提高硬度吗,网站建设 可以吗,钓鱼网站在线下载github项目--crawl4ai 输出html输出markdown格式输出结构化数据与BeautifulSoup的对比 crawl4ai github上这个项目#xff0c;没记错的话#xff0c;昨天涨了3000多的star#xff0c;今天又新增2000star。一款抓取和解析工具#xff0c;简单写个demo感受下 这里我们使用cra… github项目--crawl4ai 输出html输出markdown格式输出结构化数据与BeautifulSoup的对比 crawl4ai github上这个项目没记错的话昨天涨了3000多的star今天又新增2000star。一款抓取和解析工具简单写个demo感受下 这里我们使用crawl4ai抓取github每日趋势每天通过邮件发到自己邮箱 输出html async def github_trend_html():async with AsyncWebCrawler(verboseTrue) as crawler:result await crawler.arun(urlhttps://github.com/trending,)assert result.success, github 数据抓取失败return result.cleaned_html输出的还是html但对原始页面做了处理比如移除不相关元素动态元素简化html结构。 输出markdown格式 async def github_trend_md():async with AsyncWebCrawler(verboseTrue) as crawler:result await crawler.arun(urlhttps://github.com/trending,)assert result.success, github 数据抓取失败return result.markdown用md软件打开看一下效果 输出结构化数据 async def github_trend_json():schema {name: Github trending,baseSelector: .Box-row,fields: [{name: repository,selector: .lh-condensed a[href],type: text,},{name: description,selector: p,type: text,},{name: lang,type: text,selector: span[itempropprogrammingLanguage],},{name: stars,type: text,selector: a[href*/stargazers]},{name: today_star,type: text,selector: span.float-sm-right,},],}extraction_strategy JsonCssExtractionStrategy(schema, verboseTrue)async with AsyncWebCrawler(verboseTrue) as crawler:result await crawler.arun(urlhttps://github.com/trending,extraction_strategyextraction_strategy,bypass_cacheTrue,)assert result.success, github 数据抓取失败github_trending_json json.loads(result.extracted_content)for ele in github_trending_json:ele[repository] https://github.com/ .join(ele[repository].split())return github_trending_json与前两种不同的是结构化输出需要通过自定义schema来定义解析的数据结构。控制台按照我们定义的schema输出了标准了JSON数据。将数据放入html模版通过邮件每日发送。看一下邮件显示 与BeautifulSoup的对比 记得第一次用soup的时候对于只用过Java sax解析xml的我来说soup真的太方便了。今天简单测试了下crawl4ai和soup相比 crawl4ai数据采集分析更方便soup需要配合使用request进行网页抓取BeautifulSoup负责html解析html解析有点类似都是通过CSS选择器但crawl4ai通过定义schema解析更方便数据解析方面crawl4ai除了提供了markdown和简化版的html还提供了通过集成OpenAI提取结构化数据的能力(尚未体验)
http://www.w-s-a.com/news/44716/

相关文章:

  • 郑州网站模板动漫设计与制作设计课程
  • 在线制作网站的工具岳阳网站设计改版
  • 网站建设需要汇报哪些内容前端开发的工作内容
  • 无锡阿凡达网站建设美团app开发公司
  • 个性化企业网站制作公司深圳高端网站定制公
  • 专业深圳网站定制开发企业网站开发 流程
  • 网站建设推广的软文php网站平台
  • 如何做代刷网站长外贸网站个性设计
  • 合同网站开发 设计 后期维护如何搭建海外网络
  • 提供网站建设服务优化大师哪个好
  • 军队营房基础建设网站哦咪咖网站建设
  • fifa17做任务网站app下载免费安装
  • 网站开发用哪些技术seo是什么意思为什么要做seo
  • 网站会动的页面怎么做的与网站建设有关的招标文件
  • 公司网站如何做seowordpress付费资源
  • 福田做商城网站建设哪家公司便宜点WordPress安装子目录
  • 南京建设交易中心网站wordpress 拼车
  • 上海今天发生的重大新闻5条河南网站seo费用
  • 广东深圳最新情况临安网站seo
  • 华为快速建站女人做春梦网站
  • 建外贸网站费用手机排行榜zol
  • 长治网站制作的网站做网站要什么知识条件
  • discuz 做门户网站wordpress怎么添加图片不显示图片
  • 东营网站建设方案范文百度应用搜索
  • 网站 常见推广js代码放wordpress哪里
  • 靖江网站开发徐州住房和城乡建设局网站
  • 南宁网站建设公司如何为老板打造网站赚钱的wordpress optimizer
  • 做微商好还是开网站好网站网络推广
  • 网站建设岗位所需技能泊头网站优化
  • 企业网站建设是什么网络营销岗位介绍