如何在 Pandas 中使用默认值向现有 DataFrame 添加新列

Suraj Joshi 2023年1月30日
  1. pandas.DataFrame.assign() 在 Pandas DataFrame 中添加新列
  2. 访问新列以将其设置为默认值
  3. pandas.DataFrame.insert() 在 Pandas DataFrame 中添加新列
如何在 Pandas 中使用默认值向现有 DataFrame 添加新列

我们可以使用 DataFrame 对象的 assign()insert() 方法,以默认值向现有 DataFrame 添加新列。我们还可以将默认值直接分配给要创建的 DataFrame 列。

在以下各节中,我们将使用以下 DataFrame 作为示例。

import pandas as pd

dates = ["April-10", "April-11", "April-12", "April-13"]
fruits = ["Apple", "Papaya", "Banana", "Mango"]
prices = [3, 1, 2, 4]

df = pd.DataFrame({"Date": dates, "Fruit": fruits, "Price": prices})

print(df)

输出:

       Date   Fruit  Price
0  April-10   Apple      3
1  April-11  Papaya      1
2  April-12  Banana      2
3  April-13   Mango      4

pandas.DataFrame.assign() 在 Pandas DataFrame 中添加新列

我们可以使用 pandas.DataFrame.assign() 方法向现有的 DataFrame 添加新列,并为新创建的 DataFrame 列分配默认值。

import pandas as pd

dates = ["April-10", "April-11", "April-12", "April-13"]
fruits = ["Apple", "Papaya", "Banana", "Mango"]
prices = [3, 1, 2, 4]

df = pd.DataFrame({"Date": dates, "Fruit": fruits, "Price": prices})

new_df = df.assign(Profit=6)
print(new_df)

输出:

       Date   Fruit  Price  Profit
0  April-10   Apple      3       6
1  April-11  Papaya      1       6
2  April-12  Banana      2       6
3  April-13   Mango      4       6

该代码在 DataFrame 中创建一个新列 Profit,并将整个列的值设置为 6

访问新列以将其设置为默认值

我们可以使用 DataFrame 索引在 DataFrame 中创建新列并将其设置为默认值。

语法:

df[col_name] = value

它在 DataFrame df 中创建一个新列 col_name,并将整个列的默认值设置为 value

import pandas as pd

dates = ["April-10", "April-11", "April-12", "April-13"]
fruits = ["Apple", "Papaya", "Banana", "Mango"]
prices = [3, 1, 2, 4]

df = pd.DataFrame({"Date": dates, "Fruit": fruits, "Price": prices})

df["Profit"] = 5
print(df)

输出:

       Date   Fruit  Price  Profit
0  April-10   Apple      3       5
1  April-11  Papaya      1       5
2  April-12  Banana      2       5
3  April-13   Mango      4       5

pandas.DataFrame.insert() 在 Pandas DataFrame 中添加新列

pandas.DataFrame.insert() 允许我们在 DataFrame 中在指定位置插入列。

语法:

DataFrame.insert(loc, column, value, allow_duplicates=False)

它在位置 loc 处创建一个名称为 column 的新列,默认值为 valueallow_duplicates=False 确保 dataFrame 中只有一列名为 column 的列。

import pandas as pd

dates = ["April-10", "April-11", "April-12", "April-13"]
fruits = ["Apple", "Papaya", "Banana", "Mango"]
prices = [3, 1, 2, 4]

df = pd.DataFrame({"Date": dates, "Fruit": fruits, "Price": prices})

df.insert(2, "profit", 4, allow_duplicates=False)
print(df)

输出:

       Date   Fruit  profit  Price
0  April-10   Apple       4      3
1  April-11  Papaya       4      1
2  April-12  Banana       4      2
3  April-13   Mango       4      4

在这里,名称为 profit 的列被插入到索引 2,默认值为 4

作者: Suraj Joshi
Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

相关文章 - Pandas DataFrame Column

相关文章 - Pandas DataFrame