当前位置: 首页 > news >正文

青岛网站设计机构国内外知名建设设计网站

青岛网站设计机构,国内外知名建设设计网站,网站服务器费用,秀米编辑器要在Python中标注PDF文件中的关键字#xff0c;可以使用Python的PDFMiner库和Python的matplotlib库。 首先#xff0c;需要安装这两个库。可以使用pip命令进行安装#xff1a; shell 复制代码 pip install pdfminer.six matplotlib 接下来#xff0c;可以使用以下代码实现…要在Python中标注PDF文件中的关键字可以使用Python的PDFMiner库和Python的matplotlib库。 首先需要安装这两个库。可以使用pip命令进行安装 shell 复制代码 pip install pdfminer.six matplotlib 接下来可以使用以下代码实现关键字查找和标注功能 python 复制代码 import pdfminer   from pdfminer.high_level import extract_text   from pdfminer.layout import LAParams   from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter   from pdfminer.converter import TextConverter   import io   import matplotlib.pyplot as plt   from PIL import Image, ImageDraw, ImageFont      def search_and_highlight(pdf_path, keyword, output_path):       # 读取PDF文件       resource_manager PDFResourceManager()       fake_file_handle io.StringIO()       converter TextConverter(resource_manager, fake_file_handle, laparamsLAParams())       page_interpreter PDFPageInterpreter(resource_manager, converter)       with open(pdf_path, rb) as fh:           for page in pdfminer.pdfparser.PDFParser(fh).get_pages():               page_interpreter.process_page(page)           text fake_file_handle.getvalue()       # 关闭打开的PDF文件和文本转换器       converter.close()       fake_file_handle.close()       # 在文本中查找关键字并高亮显示       highlighted_text highlight(text, keyword)       # 将高亮显示的文本写入新的PDF文件       output io.StringIO()       with open(output_path, w) as out:           out.write(highlighted_text)       # 显示带有高亮显示的文本的PDF文件       plt.imshow(Image.open(output), originlower)       plt.axis(off)       plt.show()      def highlight(text, keyword):       words text.split()       start None       result []       for i in range(len(words)):           if words[i] keyword:               if start is not None:                   result[-1] words[i] words[i1] words[i2] words[i3] words[i4] words[i5] words[i6] words[i7] words[i8] words[i9] words[i10] words[i11] words[i12] words[i13] words[i14] words[i15]  # 可以根据需要调整选择的词数范围。例如选择2个词或3个词。也可以使用其他逻辑来确定如何选择这些词。                   start None           else:               if start is None:                   start i       if start is not None:           result[-1] .join(words[start:])  # 如果最后一个匹配项后面还有文本则将其添加到结果中。这可以防止在最后一个匹配项后面出现断句。       return result
http://www.w-s-a.com/news/110414/

相关文章:

  • 成都网站seo技术施工企业样板先行制度
  • 高端网站建设电话河北建筑工程信息网站
  • 亲 怎么给一个网站做备份财务系统有哪些软件
  • wordpress重新手机优化专家下载
  • 怎样把网站做成软件设计工作室怎么接单
  • html网站设计实例代码重庆多个区划定风险区
  • 推广方案设计同一个网站可以同时做竞价和优化
  • 论坛网站开发 go电商扶贫网站建设
  • 个人建站教程优秀的定制网站建设
  • 农村建设集团有限公司网站下载百度极速版
  • 微信公众号个人可以做网站么做企业网站需要哪些
  • 如何用付费音乐做视频网站wordpress如何设置首页
  • 杨凯做网站网站首页 排版
  • 网站图片标签江苏省建设类高工申报网站
  • 网站建设中的英文什么网站可以做医疗设备的
  • 柳州购物网站开发设计服装网站的建设与管理
  • 做网站的上海市哪家技术好北京百姓网免费发布信息
  • 网站文章排版制作网站软件
  • 云南网站开发公司网站商城定制网站建设
  • 企业网站的新闻资讯版块有哪些肇庆自助建站模板
  • 怎么做平台网站吗为网站做seo需要什么
  • 苏州吴江建设局招标网站海南网站搭建价格
  • 网站建设主要研究内容用哪个程序做网站收录好
  • 网站建设如何开单装修设计图免费
  • 做内容网站赚钱吗seo推广具体做什么
  • 连山区网站建设seo简历
  • 自助建站系统官方版太仓高端网站制作
  • 怎样只做自己的网站建设银行唐山分行网站
  • 咸阳鑫承网站建设软件开发公司网站模板
  • 百度怎么免费做网站网站建设大作业有代码