就像excel表里面,我们修改某一列的名称时,直接打字改就行。
但是在Python数据里面pandas数据框对象修改名称需要一定的方法。
下面对不同情况不同方法进行介绍。
一对一修改
如果只想修改几个列的名称,可以一对一使用字典的格式进行修改,例如:
df=df.rename(columns={'A':'a','B':'b'})
这样就把A改为了a,B改为了b。
全部修改
如果我所有的列名称都是英文我不想要,全部改为我自己设置的名称列表有个怎么做?如果使用上面的方法,一个一个的改就会很慢,因为你需要把原来的名称也打上去......
可以使用下面的方法,直接改为你想要的名称列表:
df=df.set_axis(['股票代码','收盘价','成交量','日期'],axis='columns')
这个数据框本来的四列名称就会变为你的上面的列表,当然要按照顺序传入。
换顺序
有时候我的数据框名称都是对的,可是他们顺序不是我想要的顺序怎么办。在excel里面我们选中这一列然后拖动就行,pandas里面可以这样:
df=df.reindex(columns=['股票代码','日期','收盘价','成交量'])
这样就把日期这一列从最后移到了第2列上了。
指定位置插入列
execl指定位置插入就在后面一列点一个右键然后插入一列就行,pandas里面可以这样:
df.insert(1,'时间',df_month['月份'])
上述代码表示我对df这个数据框的第1列(从第0列开始)插入了一个名称为‘时间’的一列数据,数据值为df_month['月份']这一列,当然也可以传入列表或者np数组。
目前感觉对列名称的操作常用的是这些方法。 还有其他的方法欢迎补充