我有一个使用 Pandas 和列标签的 DataFrame,我需要对其进行编辑以替换原始列标签。
我想更改A原始列名所在的 DataFrame 中的列名:
A
['$a', '$b', '$c', '$d', '$e']
到
['a', 'b', 'c', 'd', 'e'].
我将编辑后的列名存储在一个列表中,但我不知道如何替换列名。
只需将其分配给.columns属性:
.columns
>>> df = pd.DataFrame({'$a':[1,2], '$b': [10,20]}) >>> df $a $b 0 1 10 1 2 20 >>> df.columns = ['a', 'b'] >>> df a b 0 1 10 1 2 20
使用该df.rename()函数并引用要重命名的列。并非所有列都必须重命名:
df.rename()
df = df.rename(columns={'oldName1': 'newName1', 'oldName2': 'newName2'}) # Or rename the existing DataFrame (rather than creating a copy) df.rename(columns={'oldName1': 'newName1', 'oldName2': 'newName2'}, inplace=True)
最小代码示例
df = pd.DataFrame('x', index=range(3), columns=list('abcde')) df a b c d e 0 x x x x x 1 x x x x x 2 x x x x x
以下方法都有效并产生相同的输出:
df2 = df.rename({'a': 'X', 'b': 'Y'}, axis=1) # new method df2 = df.rename({'a': 'X', 'b': 'Y'}, axis='columns') df2 = df.rename(columns={'a': 'X', 'b': 'Y'}) # old method df2 X Y c d e 0 x x x x x 1 x x x x x 2 x x x x x
请记住将结果分配回去,因为修改不是就地的。或者,指定inplace=True:
inplace=True
df.rename({'a': 'X', 'b': 'Y'}, axis=1, inplace=True) df X Y c d e 0 x x x x x 1 x x x x x 2 x x x x x
从 v0.25 开始,您还可以指定在指定errors='raise'要重命名的列无效时引发错误。请参阅v0.25rename()文档。
errors='raise'
rename()
df.set_axis()与axis=1and一起使用inplace=False(返回副本)。
df.set_axis()
axis=1
inplace=False
df2 = df.set_axis(['V', 'W', 'X', 'Y', 'Z'], axis=1, inplace=False) df2 V W X Y Z 0 x x x x x 1 x x x x x 2 x x x x x
这将返回一个副本,但您可以通过设置就地修改 DataFrame inplace=True(这是版本 <=0.24 的默认行为,但将来可能会更改)。
您也可以直接分配标题:
df.columns = ['V', 'W', 'X', 'Y', 'Z'] df V W X Y Z 0 x x x x x 1 x x x x x 2 x x x x x