Featured image of post Pandas Column Renaming Madevant: Methods and Best Practices

Pandas Column Renaming Madevant: Methods and Best Practices

探索这一指南,以了解如何重新命名潘达斯的一栏。 此外,还检查命名栏的最佳做法和公约。

本条是关于如何重新命名潘达斯一栏的指南。

Pandas是一家处理数据集的Adhury图书馆。 它易于阅读不同档案格式的数据,例如: CSV 页: 1 当数据装入Pandas时,该数据储存在一个数据框架物体中。

数据框架是一个两维目标,即数据储存在表格格式中,有行文和栏目。 这类似于在CSV或电子表格档案中储存数据。 当你填充数据时,安达将试图从数据集源文档中填入一栏。

columns

然而,装满的栏目名称可能并不理想,你可能希望将栏目改成更有意义的栏目。

在这一条中,我们将首先讨论在潘达斯命名一栏的最佳做法。 之后,我们将讨论主要议题,即重新命名的方法。

B. 在Pandas 推广哥伦ns的最佳做法

在重新命名本条的指南部分之前,这里有一些最佳做法和公约,你在把座右栏命名在座标时可能要遵循。

采用描述性名称。 象样的假名 col_1 很难理解数据集所载数据,也没有传递大量信息。

✅ 在命名栏时使用斜体。 在萨克岛案中,你的栏目将照此办理: number_of_people 不要这样做 NumberOfPeople

✅ 虽然 s子案比较可取,但你应使用你原始数据集所用的命名公约。 这避免了在数据集与Pandas数据基标之间转移的混淆。

无论你使用哪一种命名公约,整个数据集始终一致。 避免使用PascalCase和其他使用snake_case的列。

最后,它试图使用更短的名字。 这些比较容易归类,因为守则建议和在笔记簿中完成记录通常都是分门别类的。 这意味着在笔记簿中进行编码,需要大量人工打字,而更短的名字使生活更加容易。

如何在潘达斯重新命名哥伦斯

您可以两种方式消费本条的内容。 首先,你可以仅读作参考。 第二,你可以照此办理。 编码 同样,你们也更有可能记住所讨论的概念。 我建议采用后一种方法。

为了制定守则,我将使用谷歌科实验室主办的一份说明书。 你们也可以创造一席之地,完全自由。 这份载有所有法典的注释书将在本教学中撰写。 页: 1

B. 设置说明书

在我们开始重新命名安达的栏目之前,让我们建立笔记,并装载一些样本数据。 建立一个使用以下代码的编码电池和进口点。

1
import pandas as pd

在进口安达后,你可以装满。 california_housing_data 数据集,在你创建谷歌科实验室说明书时,作为样本数据集备存。

1
housing_data = pd.read_csv('/content/sample_data/california_housing_train.csv')

可以看出使用该代码的数据集的头几行:

1
housing_data.head()

您也可将数据集中的栏目列出如下:

1
housing_data.columns

产出如下:

1
Index(['longitude', 'latitude', 'housing_median_age', 'total_rooms',       'total_bedrooms', 'population', 'households', 'median_income',       'median_house_value'],      dtype='object')

这意味着你的数据是正确的,数据框架有我们所需要的。

方法1:使用术语

改用安达列栏最容易的方法是使用 rename 2. 数据框架目标的方法。 采用这种方法 rename a 栏目,指更名的方法。 这种方法有多种论点。

在这种情况下,我们有兴趣重新命名一栏,因此我们将通过关键词栏。 这一论点的价值是一位词典,其条目代表从旧栏名称到新名称的制图。 这方面的一个例子是,我们改名了。 households 页: 1 houses

1
housing_data.rename(columns={ 'households': 'houses' })

产出如下:

Housing data after renaming pandas dataframe column

如你所知,我们通过字典,钥匙是旧的栏目,其价值是新的栏目。 价值不必只是一种扼杀。 如果该职能所退还的价值是新的一栏名称,该职能也可以是一种功能。 如果你想重新命名更多的栏目,你可以在字典上增加更多的条目。

方法2:重新定位

您可用于重新命名安达列栏的另一种方法是替换数据框架的栏目。 附录 population 页: 1 number_of_people 。 采用这种方法,你将撰写以下法典:

1
housing_data.columns = housing_data.columns.str.replace('population', 'number_of_people')

为了印制修改后的清单,我们使用以下代码:

1
housing_data

应为屏幕产生以下产出:

Screenshot-from-2023-04-04-07-35-06

方法3:

或者,你可以将清单分配给数据库的栏目,从而重新命名Pandas的栏目。 例如,如果我想要重新命名所有栏目,以便它们能够使用所有编号,我可以采用以下代码:

1
housing_data.columns = [x for x in range(9)]

在这方面,我已经确定了这个例子。 housing_data.columns 归结为从0到8的分类。 为了编制清单,我使用了“理解”清单,该清单是本土的沙尔特特征,目的是方便地利用一个价值观清单编制价值清单。 for lo。

采用这种方法的不利之处是,你必须重新命名整组名;你不能再重新命名一栏。 理想的情况是,你的栏目名称应当更具描述性,但我只是将这里的数字作为示范。

你们可以通过撰写以下文件来看待产出:

1
housing_data

Screenshot-from-2023-04-04-05-58-41

方法4:利用这套功能重新命名Pandas的Columns

我们将讨论的方法是数据框架标的一套“轴”方法。 这种方法用来为潘达斯两轴的任何轴心确定一个价值清单。 由于我们正在重新命名各栏,我们正在建立之中。 axis 1 。 为了使用这种方法,我们采用以下法典:

1
column_names = [str(x) for x in range(8, -1, -1)]housing_data.set_axis(column_names, axis=1, inplace=True)

第1行从8到0的汇率中产生价值清单,并储存在其中。 column_names 变量。 在第二行,我们称之为“轴心”方法,提供“轴心”方法。 column_names 作为论点和确定轴线,作为轴1加以修改。 我们还要指出: inplace 页: 1 True 因此,它修改了原始数据框架。

我们可以通过书面看待数据框架:

1
housing_data

这应当产生以下成果:

Screenshot-from-2023-04-04-06-47-20

结束语

该条简要地介绍了数据如何以表格格式储存在安达。 我们还讨论了在潘达斯命名一栏以使我们的生活更加容易的最佳做法。

最后,最重要的是,我们还讨论了在安达重新命名各栏的不同方法。

其次,检查 如何建立潘达斯数据框架[举例说明]