当前位置: 首页 > news >正文

深圳网站专业制作wordpress下载整站源码

深圳网站专业制作,wordpress下载整站源码,h5模板制作软件,唐山seo设计网站要批量提取增值税发票的关键信息并将其导出为 Excel 文件#xff0c;可以使用 Python 脚本结合 pdfplumber#xff08;用于解析 PDF 内容#xff09;、pandas#xff08;用于处理数据并导出 Excel#xff09;等库来实现。以下是实现这一目标的详细步骤。 1. 环境设置 首…要批量提取增值税发票的关键信息并将其导出为 Excel 文件可以使用 Python 脚本结合 pdfplumber用于解析 PDF 内容、pandas用于处理数据并导出 Excel等库来实现。以下是实现这一目标的详细步骤。 1. 环境设置 首先需要安装所需的 Python 库 pip install pdfplumber pandas openpyxl2. 编写 Python 脚本 import pdfplumber import pandas as pd import os# 要处理的PDF文件夹路径 pdf_folder path_to_your_pdf_folder # 输出Excel文件路径 output_excel output.xlsx# 定义存储提取信息的列表 data []# 遍历文件夹中的所有PDF文件 for filename in os.listdir(pdf_folder):if filename.endswith(.pdf):pdf_path os.path.join(pdf_folder, filename)with pdfplumber.open(pdf_path) as pdf:# 假设发票信息在第一页解析第一页内容first_page pdf.pages[0]text first_page.extract_text()# 提取关键信息下面是一些假设的示例正则表达式invoice_number find_value_by_keyword(text, 发票号码)invoice_date find_value_by_keyword(text, 开票日期)buyer_name find_value_by_keyword(text, 购买方名称)buyer_tax_id find_value_by_keyword(text, 购买方纳税人识别号)service_name find_value_by_keyword(text, 货物或应税劳务、服务名称)quantity find_value_by_keyword(text, 数量)unit_price find_value_by_keyword(text, 单价)amount find_value_by_keyword(text, 金额)tax_rate find_value_by_keyword(text, 税率)tax_amount find_value_by_keyword(text, 税额)total_amount find_value_by_keyword(text, 价税合计)seller_name find_value_by_keyword(text, 销售方名称)seller_tax_id find_value_by_keyword(text, 销售方纳税人识别号)# 将提取的信息添加到列表中data.append({PDF文件名: filename,发票号码: invoice_number,开票日期: invoice_date,购买方名称: buyer_name,购买方纳税人识别号: buyer_tax_id,服务名称: service_name,数量: quantity,单价: unit_price,金额: amount,税率: tax_rate,税额: tax_amount,价税合计: total_amount,销售方名称: seller_name,销售方纳税人识别号: seller_tax_id})# 将数据导出到Excel df pd.DataFrame(data) df.to_excel(output_excel, indexFalse)print(f提取完成结果已保存到 {output_excel})def find_value_by_keyword(text, keyword):# 定义一个简单的提取函数实际需要根据发票格式调整lines text.split(\n)for i, line in enumerate(lines):if keyword in line:return line.replace(keyword, ).strip()return 3. 脚本说明 PDF文件名: 使用 os.listdir 遍历指定文件夹中的所有 PDF 文件。PDF解析: 使用 pdfplumber 打开并读取 PDF 内容假设发票内容位于第一页。关键字提取: 使用 find_value_by_keyword 函数从文本中提取关键信息该函数可以根据实际情况调整正则表达式。数据存储: 将提取的信息存储在列表中最后将列表转换为 DataFrame 并导出为 Excel 文件。 4. 注意事项 发票格式: 此示例假设发票的格式是一致的如果格式有变动可能需要调整关键字提取的逻辑。正则表达式: 如果发票内容较复杂可以使用正则表达式进行更精准的匹配。 5. 运行脚本 将脚本保存为 .py 文件修改 pdf_folder 路径为你的 PDF 文件夹路径运行脚本后提取的信息将会被导出为一个 Excel 文件。
http://www.w-s-a.com/news/101179/

相关文章:

  • 直播网站模板新营销平台电商网站
  • 建设部指定招标网站免费的企业查询软件
  • 做前端常用的网站及软件下载平台优化是什么意思
  • 企石镇仿做网站wordpress 网站白屏
  • 班级网站建设规划书专业定制网红变色杯
  • 上海网站设计公司电话甘肃路桥建设集团有限公司官方网站
  • 哈尔滨网站建设网站开发陕西省建设监理工程协会网站
  • 微信公众号电商网站开发wordpress增加论坛
  • 网站建设视频百度网盘下载免费wordpress搭建
  • 哈尔滨市网站建设公司汕头市公司网站建设平台
  • 东莞网站建设方案外包甘肃两学一做网站
  • 网站建设优化排名推广平面设计职业学校
  • 网后台的网站怎么做网站代理商
  • 网站如何转移到新的空间服务器上手机无人区离线地图app
  • 网站建设模板的买域名做网站的坏处
  • 长春做网站qianceyun做景观素材有哪几个网站
  • 自己建的网站也要注册域名吗邯郸市做网站
  • 天津网站建设制作软件潍坊个人做网站
  • 重庆城市建设集团官方网站php用什么做网站服务器
  • 深圳坪山站重庆市园林建设有限公司网站
  • 网站建设图片教程如何用自己的电脑建网站
  • 《网页设计与网站建设》A卷答案广东新闻联播
  • 海南专业网站运营托管wordpress 去掉主题
  • 企业品牌网站制作甜品制作网站
  • 手机网站怎么制作影响力网站建设
  • 猪八戒网站做私活赚钱吗一尊网 又一个wordpress站点
  • 上海市做网站的公司滨州哪里做网站
  • 简单的网站建设步骤wordpress 贴吧主题
  • 金泉网做网站找谁表格做网站
  • 北京做兼职从哪个网站好江西省建设监督网站电子网