01 | 拆分与合并:如何快速地批量处理内容相似的Excel?
该思维导图由 AI 生成,仅供参考
- 深入了解
- 翻译
- 解释
- 总结
本文介绍了如何使用Python来快速批量处理内容相似的Excel文件,主要包括批量合并和批量拆分两个场景。作者首先介绍了如何用Python操作Excel文件,包括安装支持Excel读取和写入的扩展库xlrd和xlwt,并给出了相应的代码示例。然后详细讲解了如何实现Excel的合并,通过循环功能和读写文件操作,作者展示了如何将多个Excel文件的内容合并到一个文件中。文章还介绍了如何进行Excel的批量拆分,通过逐行读取并使用循环功能批量操作,实现了对每一行内容的处理,从而实现Excel的批量拆分。作者强调了掌握读写文件和行列坐标控制的重要性,以及如何使用Python来实现自动化操作,提高工作效率。总的来说,本文以简洁清晰的语言介绍了使用Python处理Excel文件的方法,为读者提供了快速了解和掌握相关技术的指导。文章还提到了Python丰富的扩展库和时序图分析方法,以及对工作效率提升的思考。通过本文,读者可以学习到如何利用Python进行Excel文件的批量处理,并且可以应用类似的方法处理其他办公软件的操作。
《Python 自动化办公实战课》,新⼈⾸单¥59
全部留言(83)
- 最新
- 精选
- 🐑置顶编辑小提示:专栏的完整代码位置是https://github.com/wilsonyin123/python_productivity,可点击链接下载查看。 或者通过网盘链接提取后下载,链接是: https://pan.baidu.com/s/1UvEKDCGnU6yb0a7gHLSE4Q?pwd=5wf1,提取码: 5wf1。2022-03-30
- 达文西置顶上周刚碰到类似的需求,客户发过来的excle跟系统要求的模板跟数据格式都不对应,上万条数据,手动改肯定是搞不来了.就自己摸索着一天用python处理了一下做适配.不得不说python确实简单好学,很适合处理这些简单重复的业务场景.
作者回复: 这是python最擅长的领域之一了。给这些非标的数据做格式化特别好用。
2021-02-0314 - 李京斌能否共享讲课中提到的文件(EXCEL文件等)。
作者回复: https://github.com/wilsonyin123/python_productivity 代码和课程中的文件都在链接中
2021-02-07310 - 旧草例子保存的excel是xlsx,而官方文档写着: xlwt is a library for writing data and formatting information to older Excel files (ie: .xls) by https://xlwt.readthedocs.io/en/latest/
作者回复: 感谢指正,xlsx应该为xls格式
2021-02-04210 - 唐超伟2.01版本的xlrd不支持xlsx文件,只支持xls文件 亲测装旧版本的可用 pip install xlrd==1.2.0
作者回复: 感谢反馈, 可以使用openpyxl库代替xlrd xlwt 实现xlsx文件的读写
2021-03-0168 - Nick老师,我现在正好也碰到类似这样合并Excel文件的业务场景。大概有几十个拆分的Excel文件,要合并导入到数据库中,按照今天课程的思路,将所有的数据合并到一个Excel文件中来处理,但现在的问题是数据量比较大,超过了千万条记录。已经超出了Excel的最大范围,请问这种情况该怎么处理?我自己目前想到的是通过循环读所有的Excel文件,将数据一条条的插入到数据库中,请问老师还有什么高见?
作者回复: 千万条数据存入到 Excel已经不合适了。存入到数据库是比较好的解决方案。 我们以MySQL为例,为了避免你的内存不足,建议你读取一个文件向数据库写一次。python可以使用mysqlDB这个库写入数据库。 如果你需要跨文件做一些关联处理,必须一次性把这些文件都读入到内存的话,可以使用一个叫做pandas的库来进行相关处理。 如果数据的量级再大,建议你直接写入数据库,用SQL来处理数据之间的关系。
2021-02-0428 - Fan哈哈哈,这个主题讲得好,比爬虫,Django 那些内容实用多了。
作者回复: 都很有用,过年女朋友让你在某东某宝抢个化妆品,爬虫的功能就派上用场了。
2021-02-0337 - 陈芳像我这样情况的,是不是应该学习【零基础学Python】,而不是这个课程。感觉十分吃力,连怎么开门都不知道
作者回复: 你好,我觉得问题并不是对python不熟悉造成的,而是对编程的基础概念比如运行环境、计算机原理等不熟悉导致,这些知识对于初学者没有必要先全部掌握,会造成学习的挫败感,建议你可以先跟着专栏的程序来模仿,通过模仿再慢慢理解,之后再从理解到运用,之后再慢慢补齐计算机原理和windows系统知识,这样会让进阶之路更平缓一些
2021-03-115 - 比国王老师,只论报表的拆分和合并,Python比VBA强在哪些方面?因为打开Excel就可以写VBA,非常方便,但如果知道Python比VBA更好的话,就可以说服自己学习Python而放弃使用VBA了。
作者回复: 只论报表的拆分和合并 ,python 和 VBA 都是利用 COM组件和Excel完成底层交互的。但是考虑现在代码的丰富程度,以及学习成本,Python无疑要比VBA要好太多,我来说服你学Python吧 :)
2021-12-203 - 巩春雨老师,您讲的都是对于一些简单格式的excel数据有效。实际工作中财务的一些表格都是包含大量的格式,如合并单元格,涂色,隐藏,筛选及单元格内存在大量的公式。如果我把10个文件合并到一个文件中的不同sheet,如何能把相应的格式及公式快速的复制过去
作者回复: 你好啊, 我想先带你解决从手动到自动的思路问题, 自动化的前提解决了,再细化特殊问题,. 比如你提到的,单元格公式问题,公式能够正常处理的前提是是否被正常读取了,你会发现openpyxl 、xlrd这两个模块在读取excel的时候,有一个data_only 参数,控制着读取公式的行为, data_only为True读取的公式单元格就是None(需要用excel再打开文件一次才能显示值),如果是False就是公式本身. 还有一个终极方案,用python将公式内容以python字符串方式写入,如: xls["B10"] = "=SUM(B1:B9)" 通过这两个参数控制
2021-02-0823