python处理excel大量数据慢,pythonexcel数据处理范例
大家好,给大家分享一下python如何处理数据量很大的excel文件,很多人还不知道这一点。下面详细解释一下。现在让我们来看看!
大家好,给大家分享一下python如何处理数据量很大的excel文件,很多人还不知道这一点。下面详细解释一下。现在让我们来看看!

电子表格格式
我们在日常工作中常常见到各种后缀的电子表格,例如最常见的xlsx以及较为常见的csv、xls等格式的表格。
同样是电子表格,它们之间有什么区别吗?
• xls为Excel早期表格格式怎样用python画弧形花瓣。
xls格式是Excel2003版本及其以前版本所生成的文件格式。其最大的特点就是:仅有65536行、256列。
因此规模过大的数据不可以使用xls格式读写。
• xlsx为Excel2007及其之后的表格格式,也是现在Excel表格的主流格式。
与xls相比,它可以存储1048576行、16384列数据,存储相同数据,xlsx格式要比xls格式文件要小得很多。
• CSV为逗号分隔值文件。
CSV逗号分隔值文件格式,其以纯文本形式存储表格数据(数字和文本),可以用Excel软件打开。
• xlrd 模块既可读取 xls 文件也可读取 xlsx 文件;xlwt只可写 xlsx 文件;openpyxl 可以读写 xlsx 文件;pandas 可以同时读写 xls、xlsx 文件。
注:xlrd 2.0.0 及更高版本只能读取 .xls 文件,建议使用其他库读取 .xlsx文件 或 安装 xlrd 早期版本。
1.使用 xlrd 来处理
xlrd命令

示例1:Python读取Excel文件特定数据

示例2:Python读取Excel文件所有数据

2.使用 xlwt 来处理
使用xlwt模块写入Excel文件
xlwt模块只能写xls文件,不能写xlsx文件(写xlsx程序不会报错,但最后文件无法直接打开,会报错)。
默认保存在py文件相同路径下,如果该路径下有相同文件,会被新创建的文件覆盖。

示例:新建excel文件并写入数据

3.使用 openpyxl 来处理
openpyxl可以对excel文件进行读写操作
openpyxl模块可实现对excel文件的读、写和修改,只能处理xlsx文件,不能处理xls文件。



4.使用Pandas库来处理excel数据
Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据。


写excel
修改excel–以修改原Excel文件中gender列数据为例,把girl修改为female,boy修改为male:

示例1:读取excel数据

示例2:操作Excel中的行列

其他
当收到的文件既有xls,又有xlsx时,先转换为统一格式再做统计修改更方便。
需要用到pywin32库,方法如下:

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐

所有评论(0)