作者回复: 赞!
作者回复: 有的,而且有封装好的库,地址如下 https://wkhtmltopdf.org/downloads.html
作者回复: 首先,你可以将COM理解为DLL提供的一系列的可以操纵Windows的函数;其次还要把COM当作规范,因为你可以跨语言来使用它提供的函数,本讲中的Word、Excel、Powerpoint使用到的另存为函数,就是COM编程接口提供的,更详细的解释可以参考:https://baike.baidu.com/item/com%E7%BC%96%E7%A8%8B
作者回复: import PyPDF2 from docx import Document def pdf_to_word(pdf_path, docx_path): # 读取PDF文件 with open(pdf_path, 'rb') as file: pdf_reader = PyPDF2.PdfFileReader(file) # 创建空白的Word文档 doc = Document() # 遍历PDF的每一页 for page_num in range(pdf_reader.numPages): # 读取当前页 page = pdf_reader.getPage(page_num) # 提取当前页的文本 text = page.extractText() # 将文本写入Word文档 doc.add_paragraph(text) # 保存Word文档 doc.save(docx_path) # 调用pdf_to_word函数进行转换 pdf_to_word('input.pdf', 'output.docx') 我提供一个简单实现方法
作者回复: 你好,我曾遇到过一次,程序执行最后提示操作超时的类似场景,经排查是当前用户权限不足导致的。 因为代码hang住,没有更多报错可供参考,无法更详细定位问题的原因,你可以先从程序权限入手看一下是否也是同类问题导致的
作者回复: 问题出现在合并后写入文件的字符编码,是否有设置编码参数呢? 以标准open调用为例,open(filename,encoding=utf8)
作者回复: 先看错误提示,根据提示有针对性的解决问题
作者回复: 在Mac 系统上就没有这么便利了, 像是word转换为pdf要用 docx2pdf, excel最方法的是pandas ,而Powerpoint最方便且格式上处理的比较好的是wps office