python学习-使用pandas 按照行数分割表格

2023-03-23 06:48:15 阅读次数：276

问题

1. 一张excel表格，大概1万行，需要录入系统
1. 系统每次最多只能录入500行表格数据，一旦超过500行，就会录入失败
1. 需要把1万行的数据按照500行分割，形成20个表格，这样才能录入系统

思路

使用pandas得到总行数，比如10002行，分割表格的时候，要保留一行表头
第一张表，是1-500行，第二张表是 501-1000，以此类推
最后一张表应该是1000-10002行，生成的表格数量是10000/500+1,21张
生成的表格按照顺序保存到一个目录中
写一个函数，可以按照任意指定的分割数量进行分割。

代码实现

#按行数分割表格函数
#问题
#1.如果有有一个十万行表格，要录入系统，但是系统每次最多只能录入500行？
#解决问题：
#1.按照指定的行数分割表格
#2.分割出来的表格按照序号命名
import pandas as pd
import os
def SplitExcel(file,num):
    file_dir='result'   #创建目录
    if os.path.isdir(file_dir):
        os.rmdir(file_dir)
    else:
        os.mkdir(file_dir)
    n = 1
    row_list = []
    df = pd.DataFrame(pd.read_excel(file, sheet_name=0))
    row_num = int(df.shape[0])  # 获取行数
    if num >= row_num:  #如果分割行数大于总行数，报错
        raise Exception('too much!!')
    try:
        for i in list(range(num,row_num,num)):
            row_list.append(i)
        row_list.append(row_num)  # 得到完整列表
    except Exception as e:
        print (e)

    (name,ext)=os.path.splitext(file)  #获取文件名

    for m in row_list:

        filename=os.path.join(file_dir,name+'-' + str(n) + '.xlsx')
        if m <row_num:
            df_handle=df.iloc[m-num:m] #获取n行之前
            print (df_handle)
            df_handle.to_excel(filename , sheet_name='sheet1',index=False)
        elif m == int(row_num):
            remainder=int(int(row_num)%num) #余数
            df_handle=df.iloc[m-remainder:m] #获取最后不能整除的行
            df_handle.to_excel(filename , sheet_name='sheet1', index=False)
        n = n + 1

if __name__=='__main__':
    file= 'result.xls'
    SplitExcel(file,num=10)

测试效果

一张83行的表格，去除表头，一共82行，按照10行分割，一共要获得9张表格，最后一张表格，应该只有两行，中间的表格，数据必须是连续的，

分割前

python学习-使用pandas 按照行数分割表格

分割后

python学习-使用pandas 按照行数分割表格

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

python学习-使用pandas 按照行数分割表格

python学习-使用pandas 按照行数分割表格

问题

思路

代码实现

测试效果

分割前

分割后

相关文章

python四种抽样方法的使用：随机抽样、聚类抽样、系统抽样、分层抽样

视频 | Python测试开发之调试print代码实例

python简单介绍及基础知识（一）

使用Python扩展PAM（part 2）

1行Python代码，把Excel转成PDF，python-office功能更新~

IronPython 与 c# 交互之导入Python模块的两种方法

python性能测试之pyperformance

Python高维统计建模变量选择:SCAD平滑剪切绝对偏差惩罚、Lasso惩罚函数比较

一篇文章教会你Python中三种简单函数的使用

一篇文章带你剖析Python 字节流处理神器struct

作者介绍

最新文章

【python基础】学习路线

python实战三：使用循环while模拟用户登录

python递归遍历路径下的所有文件和文件夹

仅用pygame+python实现植物大战僵尸-----完成比完美更重要

Flask 实现用户登录功能的完整示例：前端与后端整合（附Demo）

python——偏函数的使用

热门文章

python list转dict

定义一个函数，接收三个参数返回一元二次方程

python 倒排索引(Inverted Index)

python取两个列表的并集、交集、差集

解决numpy报错UFuncTypeError: Cannot cast ufunc ‘add‘ output from dtype(‘x‘) to dtype(‘x‘)

python使用xlwt创建与保存excel文件

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

dataframe读取列表中对应的列

python学习——使用元类

设计模式python版（3）-工厂方法模式

python绘图查看支持的字体，解决中文空格现象

python在es中scroll用法详解

端口扫描 -- WebServiceScanner