当前位置: 首页 > news >正文

设计培训网站建设凤岗网站建设

设计培训网站建设,凤岗网站建设,北京网络营销,上海有什么企业文章目录 1、问题描述2、问题原因3、问题解决 1、问题描述 今天在使用PDFPlumber模块提取PDF文本时extract_text()方法报错#xff0c;报错内容如下#xff1a; Traceback (most recent call last):......File F:\Python\...\site-packages\pdfminer\pdffont.py… 文章目录 1、问题描述2、问题原因3、问题解决 1、问题描述 今天在使用PDFPlumber模块提取PDF文本时extract_text()方法报错报错内容如下 Traceback (most recent call last):......File F:\Python\...\site-packages\pdfminer\pdffont.py, line 1091, in __init__self.unicode_map ttf.create_unicode_map()File F:\Python\...\site-packages\pdfminer\pdffont.py, line 826, in create_unicode_mapassert False, str((Unhandled, fmttype)) AssertionError: (Unhandled, 6)报错代码如下 import pdfplumberwith pdfplumber.open(rfF:\...\file.pdf) as pdf:for page in pdf.pages:print(page.extract_text())2、问题原因 经查找原因最终确定可能是PDF文件本身的原因具体可见这篇文章https://github.com/jsvine/pdfplumber/discussions/994?sortnew ChatGPT则认这种错误是因为库内部遇到了某种它无法处理的情况ChatGPT给出的解决方案如下 1 更新PDFPlumber库 pip install --upgrade pdfplumber2 检查PDF文件 确认PDF文件没有损坏并且是文本格式的PDF而不是扫描的图像 3 使用其他方法 可以尝试使用extract_words()或extract_tables()等其他方法这取决于你需要提取的内容类型 4 捕获异常 添加异常处理这样即使遇到错误也不会导致程序崩溃 try:text page.extract_text() except AssertionError as e:print(e)text None5 尝试其他库 可以考虑使用其他PDF处理库如PyPDF2或PyMuPDF等 在尝试了ChatGPT的一些建议后确定可能是PDF本身的原因因此考虑使用其他库 3、问题解决 经过尝试最终发现PyMuPDF库可以解析使用 import fitzwith fitz.open(rfF:\...\file.pdf) as doc:for page in doc.pages():print(page.get_text())看来是PDF本身的原因我们的PDF可能已经损坏
http://www.w-s-a.com/news/705230/

相关文章:

  • 网站建设客户来源江门网站设计华企立方
  • 自己如何做棋牌网站宁波网络推广优化方案
  • 深圳招聘网站推荐seo网站推广方案
  • 彩票网站开发 合法学术会议网站建设
  • 商务网站建设论文答辩pptseo技术博客
  • 怎样才能有自己的网站桂林搭建公司
  • 哪个网站做视频赚钱万科
  • 莆系医疗网站建设wp如何做网站地图
  • 网站建设应急处置方案团购网站 备案问题
  • 网站建设 岗位职责浙江中天建设集团有限公司网站
  • 西海岸建设局网站用wordpress建站学什么
  • 网站静态和动态学校网站建设流程步骤
  • 做群头像的网站在线怎么做俄语网站
  • 西安网站定制开发国内cms推荐
  • windows网站建设教程视频教程wordpress默认用户头像
  • 做网站需要什么软件wordpress会员邮件通知
  • 技术支持网站合肥网站搭建
  • 无为网站设计免费制作企业网站平台
  • 社交网站第一步怎么做房屋装修效果图用什么软件
  • 企业网站 批量备案合肥 网站建设
  • 如何提高网站索引量室内设计师之路网站
  • ps怎么做响应式网站布局图现在做网站都是怎么做的
  • 导购 网站模板网站主题选择
  • 毕业设计医院网站设计怎么做郑州铭功路网站建设
  • 网站根域名是什么php做商城网站步骤
  • 建设网站的那个公司好网站建设万首先金手指12
  • 广东民航机场建设有限公司网站网站开发后端用什么
  • 做风帆网站需要多少钱越野车网站模板
  • 如何做网站平台销售用狗做头像的网站
  • 宝安电子厂做网站美食网页设计的制作过程