作者回复: 这是python最擅长的领域之一了。给这些非标的数据做格式化特别好用。
作者回复: https://github.com/wilsonyin123/python_productivity 代码和课程中的文件都在链接中
作者回复: 感谢指正,xlsx应该为xls格式
作者回复: 感谢反馈, 可以使用openpyxl库代替xlrd xlwt 实现xlsx文件的读写
作者回复: 千万条数据存入到 Excel已经不合适了。存入到数据库是比较好的解决方案。 我们以MySQL为例,为了避免你的内存不足,建议你读取一个文件向数据库写一次。python可以使用mysqlDB这个库写入数据库。 如果你需要跨文件做一些关联处理,必须一次性把这些文件都读入到内存的话,可以使用一个叫做pandas的库来进行相关处理。 如果数据的量级再大,建议你直接写入数据库,用SQL来处理数据之间的关系。
作者回复: 都很有用,过年女朋友让你在某东某宝抢个化妆品,爬虫的功能就派上用场了。
作者回复: 你好,我觉得问题并不是对python不熟悉造成的,而是对编程的基础概念比如运行环境、计算机原理等不熟悉导致,这些知识对于初学者没有必要先全部掌握,会造成学习的挫败感,建议你可以先跟着专栏的程序来模仿,通过模仿再慢慢理解,之后再从理解到运用,之后再慢慢补齐计算机原理和windows系统知识,这样会让进阶之路更平缓一些
作者回复: 只论报表的拆分和合并 ,python 和 VBA 都是利用 COM组件和Excel完成底层交互的。但是考虑现在代码的丰富程度,以及学习成本,Python无疑要比VBA要好太多,我来说服你学Python吧 :)
作者回复: 你好啊, 我想先带你解决从手动到自动的思路问题, 自动化的前提解决了,再细化特殊问题,. 比如你提到的,单元格公式问题,公式能够正常处理的前提是是否被正常读取了,你会发现openpyxl 、xlrd这两个模块在读取excel的时候,有一个data_only 参数,控制着读取公式的行为, data_only为True读取的公式单元格就是None(需要用excel再打开文件一次才能显示值),如果是False就是公式本身. 还有一个终极方案,用python将公式内容以python字符串方式写入,如: xls["B10"] = "=SUM(B1:B9)" 通过这两个参数控制