当前位置: 首页 > news >正文

建设网站方案 ppt小游戏秒玩入口

建设网站方案 ppt,小游戏秒玩入口,长春百度网站快速排名,淘宝怎么提高关键词搜索排名文章目录 xps转txt方法一方法二 pdf转txt整页转txt提取pdf表格#xff0c;并转为txt 总结另外参考XPS文件转换为TXT文件XPS文件转换为PDF文件PDF文件转换为TXT文件提取PDF表格并转为TXT示例代码#xff08;部分#xff09; 本文测试代码已上传#xff0c;路径如下#xff… 文章目录 xps转txt方法一方法二 pdf转txt整页转txt提取pdf表格并转为txt 总结另外参考XPS文件转换为TXT文件XPS文件转换为PDF文件PDF文件转换为TXT文件提取PDF表格并转为TXT示例代码部分 本文测试代码已上传路径如下 https://download.csdn.net/download/y601500359/90312050 xps部分内容如图 xps转txt 使用XpsDocument 类。 命名空间:System.Windows.Xps.Packaging 程序集:ReachFramework.dll 方法一 public static string XpsToText(string strXpsPath){try{if (!File.Exists(strXpsPath))return ;string strContent ;System.Windows.Xps.Packaging.XpsDocument _xpsDocument new System.Windows.Xps.Packaging.XpsDocument(strXpsPath, System.IO.FileAccess.Read);IXpsFixedDocumentSequenceReader fixedDocSeqReader _xpsDocument.FixedDocumentSequenceReader;IXpsFixedDocumentReader _document fixedDocSeqReader.FixedDocuments[0];StringBuilder _currentText new StringBuilder();for (int i 0; i _document.FixedPages.Count; i){IXpsFixedPageReader _page _document.FixedPages[i];System.Xml.XmlReader _pageContentReader _page.XmlReader;if (_pageContentReader ! null){while (_pageContentReader.Read()){if (_pageContentReader.Name Glyphs){if (_pageContentReader.HasAttributes){string strAtti;for (int ii 0; ii _pageContentReader.AttributeCount; ii){strAtti _pageContentReader[ii];}if (_pageContentReader.GetAttribute(UnicodeString) ! null){_currentText.Append(_pageContentReader.GetAttribute(UnicodeString));}}}}}}strContent _currentText.ToString();_xpsDocument.Close();return strContent;}catch{return ;}}方法二 public static string ReadXps(string strXpsPath){StringBuilder sb new StringBuilder();//读取文档XpsDocument xpsDocument new XpsDocument(strXpsPath, FileAccess.Read);//var reader xpsDocument.FixedDocumentSequenceReader;//循环文档foreach (var document in reader.FixedDocuments){//循环页foreach (var page in document.FixedPages){//读取XML内容XmlReader xrdr page.XmlReader;while (xrdr.Read()){switch (xrdr.NodeType){case XmlNodeType.Element:if (xrdr.Name Glyphs){sb.Append(xrdr[UnicodeString]);sb.Append(\n);}break;case XmlNodeType.Whitespace://sb.Append(,);break;default://sb.Append(-);break;}}}}return sb.ToString();}pdf转txt 整页转txt static void ConvertPdf2Txt(string filename) {// 创建PdfDocument对象并加载PDF文件PdfDocument doc new PdfDocument();doc.LoadFromFile(filename);// 创建 StringBuilder 对象StringBuilder builder new StringBuilder();// 初始化 PdfTableExtractor 类的实例PdfTableExtractor extractor new PdfTableExtractor(doc);//提取PDF所有页面的文本string strtxt;foreach (PdfPageBase page in doc.Pages){builder.Append(page.ExtractText());//PdfTextExtractor txtExtractor new PdfTextExtractor(page);strtxt page.ExtractText();}//将提取到的文本写为.txt格式并保存到本地路径string strPath filename.Substring(0, filename.LastIndexOf(.) 1) txt;File.WriteAllText(strPath, builder.ToString());doc.Close(); }提取pdf表格并转为txt static void ConvertPdf2Txt(string filename) {// 创建PdfDocument对象并加载PDF文件PdfDocument doc new PdfDocument();doc.LoadFromFile(filename);// 创建 StringBuilder 对象StringBuilder builder new StringBuilder();// 初始化 PdfTableExtractor 类的实例PdfTableExtractor extractor new PdfTableExtractor(doc);// 声明 PdfTable 数组PdfTable[] tableList null;int tableCount 1;//将提取到的文本写为.txt格式并保存到本地路径string strPath filename.Substring(0, filename.LastIndexOf(.) 1) txt;// 循环遍历页面for (int pageIndex 0; pageIndex doc.Pages.Count; pageIndex){// 从特定页面提取表格tableList extractor.ExtractTable(pageIndex);// 判断表格列表是否为空if (tableList ! null tableList.Length 0){// 遍历列表中的表格foreach (PdfTable table in tableList){// 获取特定表格的行数和列数int row table.GetRowCount();int column table.GetColumnCount();// 遍历行和列for (int i 0; i row; i){for (int j 0; j column; j){// 获取特定单元格的文本string text table.GetText(i, j);if(text.IndexOf(\n) 0){text Regex.Replace(text, [\n], );}// 将文本添加到 StringBuilder 中并添加制表符builder.Append(text \t);}builder.Append(\r\n);}// 写入 .txt 文件File.WriteAllText(strPath, builder.ToString());tableCount 1;}}}doc.Close(); }总结 从上述操作可以看出由于xps文件的特殊性如果文本内容出现换行是无法检测的而且如果直接通过xps文件读取为txt文件格式会比较乱如果想要格式尽量不乱那么可以先转换为pdf文件然后再通过pdf文件转换为txt。 其中如果pdf提取表格可以进一步优化表格对齐内容其中关键代码位置如下图所以如果想要将xps文件转换为txt甚至是csv或者excel可以合理利用一下上述思路。 另外参考 在C#中处理不同文件格式如XPS、PDF和TXT的转换和表格提取是一个复杂且通常需要依赖第三方库的任务。以下是如何在C#中实现这些操作的概述 XPS文件转换为TXT文件 将XPS转换为PDF如果需要中间格式 可以使用System.Printing.PrintQueue和XpsDocumentWriter类将XPS文件打印到PDF打印机如果安装了支持PDF的打印机驱动程序。或者使用第三方库如Xps2Pdf、DinoPDF等来进行转换。 将PDF转换为TXT 使用PDF解析库如iTextSharp、PdfSharp、Aspose.PDF、MuPDF的.NET绑定等来读取PDF内容。解析PDF文本内容可能需要处理PDF中的文本布局、字体和编码。将解析后的文本写入TXT文件。 由于直接从XPS到TXT的转换较为罕见且中间可能需要处理复杂的格式和布局因此通常建议先将XPS转换为PDF再从PDF中提取文本。 XPS文件转换为PDF文件 如上所述可以使用System.Printing.PrintQueue和XpsDocumentWriter类将XPS文件打印到PDF打印机或者使用第三方库进行转换。 PDF文件转换为TXT文件 使用PDF解析库读取PDF内容。遍历PDF页面提取文本。将文本写入TXT文件。 提取PDF表格并转为TXT 使用PDF解析库读取PDF内容。分析PDF中的文本和布局识别表格结构这可能需要自定义逻辑因为PDF不是为表格数据设计的格式。提取表格数据。将表格数据格式化为TXT格式例如使用逗号、制表符或其他分隔符分隔单元格。 示例代码部分 以下是一个使用iTextSharp库从PDF中提取文本的简单示例 using System; using System.IO; using iTextSharp.text.pdf; using iTextSharp.text.pdf.parser;class Program {static void Main(){string pdfPath path/to/your/pdf/file.pdf;string txtPath path/to/your/output/file.txt;using (FileStream stream new FileStream(pdfPath, FileMode.Open, FileAccess.Read)){PdfReader reader new PdfReader(stream);using (StreamWriter writer new StreamWriter(txtPath)){for (int i 1; i reader.NumberOfPages; i){ITextExtractionStrategy strategy new SimpleTextExtractionStrategy();string text PdfTextExtractor.GetTextFromPage(reader, i, strategy);writer.WriteLine(text);}}}Console.WriteLine(PDF text extracted to TXT file.);} }请注意这个示例代码仅用于从PDF中提取纯文本并不处理表格提取的复杂逻辑。对于表格提取您可能需要进一步分析PDF的布局和文本内容这通常是一个更加复杂和耗时的过程。 此外由于处理PDF和XPS文件通常涉及复杂的格式和布局因此强烈建议使用成熟的第三方库并仔细阅读其文档和示例代码以了解如何处理这些文件格式。
http://www.w-s-a.com/news/601254/

相关文章:

  • 国外网站备案流程企业网站 流程
  • 重庆网站建设letide童程童美少儿收费价目表
  • 苏州建站仿站东莞排名推广
  • 大中小网站的区分wordpress个人主页主题
  • 商务网站建设的可行性分析包括小程序源码网免费
  • 永州网站建设收费标准重庆网站建设公司夹夹虫专业
  • python做网站多少钱wordpress 2.8
  • 深圳网站平台网站开发工作程序怎么写
  • 自己可以接单做网站吗wordpress 添加自定义按钮
  • 网站首页权重宣传页制作
  • 智能网站建设软件有哪些方面网页的建设
  • 石铜路网站建设生鲜电商网站开发
  • 怎么提高网站加载速度慢网站的轮播怎么做的
  • 网络网站推广优化建筑工程教育网官方网站
  • 旅行社网站策划做网站编辑好还是美工好
  • 珠海做网站找哪家好在线磁力搜索神器
  • 做网站优化有必要wordpress导航栏字体
  • 中山网站建设半江红沈阳免费网站建站模板
  • 工信部网站备案管理系统网站备案负责人 更换
  • 我要做个网站该怎么做怎么做电商平台网站
  • wordpress教程 网站标题莱芜大众网
  • 网站建设业务终止合作范本主机公园wordpress
  • 口碑好企业网站建设网站建设与什么专业有关
  • 助贷获客系统快速优化排名公司推荐
  • 重庆做网站优化推广的公司企业网站如何进行定位
  • 高密市赏旋网站设计有限公司山东广饶县建设局网站
  • 成都哪里有网站开发公司网业分离是什么
  • 购物导购网站开发女孩学建筑学好找工作吗
  • 做网站沈阳掌握夏邑进入公众号
  • 怎么做自动提卡网站谷歌推广怎么做