Python 自动化办公实战课
尹会生
前游戏公司技术总监,前新浪网研发中心技术经理
21781 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 37 讲
Python 自动化办公实战课
15
15
1.0x
00:00/00:00
登录|注册

01 | 拆分与合并:如何快速地批量处理内容相似的Excel?

循环处理多个Excel文件
根据需求拆分并保存为新的Excel文件
逐行读取Excel内容
使用Python实现
循环处理多个Excel文件
将内容写入到新的Excel文件
读取Excel文件内容
使用Python实现
网盘链接
GitHub链接
分享使用Python解决问题的经验
可以用于其他办公软件的类似操作
丰富的扩展库
以时间顺序排列程序中的事件的图表
批量处理多个文件
xlwt
xlrd
写入Excel文件内容
读取Excel文件内容
使用Python解决重复性问题
利用循环完成自动化操作
找到重复操作的部分
分析问题的方法
提升工作效率
代替手工操作
批量拆分
批量合并
完整代码
思考题
扩展库
时序图
循环功能
Python库
Excel操作
思考题
时序图
Python自动化操作
Excel批量处理
文章内容
总结

该思维导图由 AI 生成,仅供参考

你好,我是尹会生。今天是咱们的第一节课,我先带你学习下,如何用 Python 操作 Excel。
Excel 是我们在工作中用到的最频繁的软件之一,它有着强大的计算能力和便捷的图表功能。如果我们要在同一个 Excel 文件中进行操作,手工进行也很方便,但问题是,如果我们需要同时操作多个 Excel 文件,就是一件非常耗时的事情了。
在工作场景中,需要同时操作多个 Excel 的情况主要有 2 种:批量合并和批量拆分。我来带你看 2 个场景。
批量合并。假设你需要对某些工作内容进行问卷调查,这时你用 Excel 做了调查问卷模版。我想你会这样做:先把 Excel 通过工作群分发给所有员工,再把群里收集到的反馈附件汇总成一个文件。
批量拆分。假设你是公司的财务人员,你需要使用 Excel 对员工工资进行核算,之后再打印出来。但是公司要求员工薪水保密,所以每个员工的工资需要拆分成一个独立的文件,最后还需要打印出来。
无论是合并,还是拆分,我们都面临着一个困境:没有现成的软件可以实现多个 Excel 文件的合并和拆分操作,所以你只好对每一个 Excel 文件都进行“打开 - 复制粘贴 - 保存”的工作。
很多人在面对这样的工作需求时,都忍不住立马去做,却很少停下来分析问题。其实,这三步是很简单的工作,不过也是无意义的重复工作,既浪费了时间,又没有真正产生价值。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文介绍了如何使用Python来快速批量处理内容相似的Excel文件,主要包括批量合并和批量拆分两个场景。作者首先介绍了如何用Python操作Excel文件,包括安装支持Excel读取和写入的扩展库xlrd和xlwt,并给出了相应的代码示例。然后详细讲解了如何实现Excel的合并,通过循环功能和读写文件操作,作者展示了如何将多个Excel文件的内容合并到一个文件中。文章还介绍了如何进行Excel的批量拆分,通过逐行读取并使用循环功能批量操作,实现了对每一行内容的处理,从而实现Excel的批量拆分。作者强调了掌握读写文件和行列坐标控制的重要性,以及如何使用Python来实现自动化操作,提高工作效率。总的来说,本文以简洁清晰的语言介绍了使用Python处理Excel文件的方法,为读者提供了快速了解和掌握相关技术的指导。文章还提到了Python丰富的扩展库和时序图分析方法,以及对工作效率提升的思考。通过本文,读者可以学习到如何利用Python进行Excel文件的批量处理,并且可以应用类似的方法处理其他办公软件的操作。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《Python 自动化办公实战课》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(83)

  • 最新
  • 精选
  • 🐑
    置顶
    编辑小提示:专栏的完整代码位置是https://github.com/wilsonyin123/python_productivity,可点击链接下载查看。 或者通过网盘链接提取后下载,链接是: https://pan.baidu.com/s/1UvEKDCGnU6yb0a7gHLSE4Q?pwd=5wf1,提取码: 5wf1。
    2022-03-30
  • 达文西
    置顶
    上周刚碰到类似的需求,客户发过来的excle跟系统要求的模板跟数据格式都不对应,上万条数据,手动改肯定是搞不来了.就自己摸索着一天用python处理了一下做适配.不得不说python确实简单好学,很适合处理这些简单重复的业务场景.

    作者回复: 这是python最擅长的领域之一了。给这些非标的数据做格式化特别好用。

    2021-02-03
    14
  • 李京斌
    能否共享讲课中提到的文件(EXCEL文件等)。

    作者回复: https://github.com/wilsonyin123/python_productivity 代码和课程中的文件都在链接中

    2021-02-07
    3
    10
  • 旧草
    例子保存的excel是xlsx,而官方文档写着: xlwt is a library for writing data and formatting information to older Excel files (ie: .xls) by https://xlwt.readthedocs.io/en/latest/

    作者回复: 感谢指正,xlsx应该为xls格式

    2021-02-04
    2
    10
  • 唐超伟
    2.01版本的xlrd不支持xlsx文件,只支持xls文件 亲测装旧版本的可用 pip install xlrd==1.2.0

    作者回复: 感谢反馈, 可以使用openpyxl库代替xlrd xlwt 实现xlsx文件的读写

    2021-03-01
    6
    8
  • Nick
    老师,我现在正好也碰到类似这样合并Excel文件的业务场景。大概有几十个拆分的Excel文件,要合并导入到数据库中,按照今天课程的思路,将所有的数据合并到一个Excel文件中来处理,但现在的问题是数据量比较大,超过了千万条记录。已经超出了Excel的最大范围,请问这种情况该怎么处理?我自己目前想到的是通过循环读所有的Excel文件,将数据一条条的插入到数据库中,请问老师还有什么高见?

    作者回复: 千万条数据存入到 Excel已经不合适了。存入到数据库是比较好的解决方案。 我们以MySQL为例,为了避免你的内存不足,建议你读取一个文件向数据库写一次。python可以使用mysqlDB这个库写入数据库。 如果你需要跨文件做一些关联处理,必须一次性把这些文件都读入到内存的话,可以使用一个叫做pandas的库来进行相关处理。 如果数据的量级再大,建议你直接写入数据库,用SQL来处理数据之间的关系。

    2021-02-04
    2
    8
  • Fan
    哈哈哈,这个主题讲得好,比爬虫,Django 那些内容实用多了。

    作者回复: 都很有用,过年女朋友让你在某东某宝抢个化妆品,爬虫的功能就派上用场了。

    2021-02-03
    3
    7
  • 陈芳
    像我这样情况的,是不是应该学习【零基础学Python】,而不是这个课程。感觉十分吃力,连怎么开门都不知道

    作者回复: 你好,我觉得问题并不是对python不熟悉造成的,而是对编程的基础概念比如运行环境、计算机原理等不熟悉导致,这些知识对于初学者没有必要先全部掌握,会造成学习的挫败感,建议你可以先跟着专栏的程序来模仿,通过模仿再慢慢理解,之后再从理解到运用,之后再慢慢补齐计算机原理和windows系统知识,这样会让进阶之路更平缓一些

    2021-03-11
    5
  • 比国王
    老师,只论报表的拆分和合并,Python比VBA强在哪些方面?因为打开Excel就可以写VBA,非常方便,但如果知道Python比VBA更好的话,就可以说服自己学习Python而放弃使用VBA了。

    作者回复: 只论报表的拆分和合并 ,python 和 VBA 都是利用 COM组件和Excel完成底层交互的。但是考虑现在代码的丰富程度,以及学习成本,Python无疑要比VBA要好太多,我来说服你学Python吧 :)

    2021-12-20
    3
  • 巩春雨
    老师,您讲的都是对于一些简单格式的excel数据有效。实际工作中财务的一些表格都是包含大量的格式,如合并单元格,涂色,隐藏,筛选及单元格内存在大量的公式。如果我把10个文件合并到一个文件中的不同sheet,如何能把相应的格式及公式快速的复制过去

    作者回复: 你好啊, 我想先带你解决从手动到自动的思路问题, 自动化的前提解决了,再细化特殊问题,. 比如你提到的,单元格公式问题,公式能够正常处理的前提是是否被正常读取了,你会发现openpyxl 、xlrd这两个模块在读取excel的时候,有一个data_only 参数,控制着读取公式的行为, data_only为True读取的公式单元格就是None(需要用excel再打开文件一次才能显示值),如果是False就是公式本身. 还有一个终极方案,用python将公式内容以python字符串方式写入,如: xls["B10"] = "=SUM(B1:B9)" 通过这两个参数控制

    2021-02-08
    2
    3
收起评论
显示
设置
留言
83
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部