Colonne d'exclusion des Pandas

Suraj Joshi 30 janvier 2023
  1. Pandas sélectionne toutes les colonnes sauf une en utilisant la propriété loc
  2. Pandas sélectionne toutes les colonnes sauf une en utilisant la méthode drop()
  3. Pandas sélectionne toutes les colonnes sauf une en utilisant la méthode difference()
Colonne d'exclusion des Pandas

Ce tutoriel explique comment nous pouvons sélectionner toutes les colonnes sauf une d’un DataFrame particulier. Nous utiliserons l’exemple de DataFrame ci-dessous dans cet article.

import pandas as pd

stocks_df = pd.DataFrame(
    {
        "Stock": ["Amazon", "Tesla", "Facebook", "Boeing"],
        "Price(in $)": [3180, 835, 267, 209],
        "Sector": ["Technology", "Technology", "Technology", "Aircraft"],
    }
)

print("Stocks Dataframe:")
print(stocks_df, "\n")

Production :

Stocks Dataframe:
      Stock  Price(in $)      Sector
0    Amazon         3180  Technology
1     Tesla          835  Technology
2  Facebook          267  Technology
3    Boeing          209    Aircraft

Pandas sélectionne toutes les colonnes sauf une en utilisant la propriété loc

import pandas as pd

stocks_df = pd.DataFrame(
    {
        "Stock": ["Amazon", "Tesla", "Facebook", "Boeing"],
        "Price(in $)": [3180, 835, 267, 209],
        "Sector": ["Technology", "Technology", "Technology", "Aircraft"],
    }
)

print("Stocks Dataframe:")
print(stocks_df, "\n")

print("Stocks DataFrame excluding Sector Column:")
filtered_df = stocks_df.loc[:, stocks_df.columns != "Sector"]
print(filtered_df, "\n")

Production :

Stocks Dataframe:
      Stock  Price(in $)      Sector
0    Amazon         3180  Technology
1     Tesla          835  Technology
2  Facebook          267  Technology
3    Boeing          209    Aircraft

Stocks DataFrame excluding Sector Column:
      Stock  Price(in $)
0    Amazon         3180
1     Tesla          835
2  Facebook          267
3    Boeing          209

Il sélectionne tout sauf la colonne Sector de la DataFrame stocks_df, assigne le résultat à filtered_df, et affiche ensuite le contenu du filetered_df.

La propriété loc sélectionne les éléments sur la base des lignes et des colonnes spécifiées. Le symbole : avant , dans la propriété loc spécifie que nous devons sélectionner toutes les lignes. Pour les colonnes, nous avons spécifié de ne sélectionner que la colonne dont le nom n’est pas Sector. Par conséquent, il sélectionnera toutes les colonnes sauf la colonne Sector.

Pandas sélectionne toutes les colonnes sauf une en utilisant la méthode drop()

Nous pouvons déposer des colonnes spécifiques d’un DataFrame en utilisant la méthode drop() en mettant axis=1 dans la méthode.

import pandas as pd

stocks_df = pd.DataFrame(
    {
        "Stock": ["Amazon", "Tesla", "Facebook", "Boeing"],
        "Price(in $)": [3180, 835, 267, 209],
        "Sector": ["Technology", "Technology", "Technology", "Aircraft"],
    }
)

print("Stocks Dataframe:")
print(stocks_df, "\n")

print("Stocks DataFrame excluding Sector Column:")
filtered_df = stocks_df.drop("Sector", axis=1)
print(filtered_df, "\n")

Production :

Stocks Dataframe:
      Stock  Price(in $)      Sector
0    Amazon         3180  Technology
1     Tesla          835  Technology
2  Facebook          267  Technology
3    Boeing          209    Aircraft

Stocks DataFrame excluding Sector Column:
      Stock  Price(in $)
0    Amazon         3180
1     Tesla          835
2  Facebook          267
3    Boeing          209

Elle dépose la colonne Sector du DataFrame stocks_df et assigne le résultat à filtered_df.

Nous pouvons également exclure plusieurs colonnes d’un DataFrame en les supprimant à l’aide de la méthode drop(). Nous fournissons une liste de noms de colonnes à déposer en argument de la méthode drop().

import pandas as pd

stocks_df = pd.DataFrame(
    {
        "Stock": ["Amazon", "Tesla", "Facebook", "Boeing"],
        "Price(in $)": [3180, 835, 267, 209],
        "Sector": ["Technology", "Technology", "Technology", "Aircraft"],
    }
)

print("Stocks Dataframe:")
print(stocks_df, "\n")

print("Stocks DataFrame excluding Sector and Price Column:")
filtered_df = stocks_df.drop(["Sector", "Price(in $)"], axis=1)
print(filtered_df, "\n")

Production :

Stocks Dataframe:
      Stock  Price(in $)      Sector
0    Amazon         3180  Technology
1     Tesla          835  Technology
2  Facebook          267  Technology
3    Boeing          209    Aircraft

Stocks DataFrame excluding Sector and Price Column:
      Stock
0    Amazon
1     Tesla
2  Facebook
3    Boeing

Il exclut les colonnes Price(in $) et Sector du DataFrame stocks_df.

Pandas sélectionne toutes les colonnes sauf une en utilisant la méthode difference()

import pandas as pd

stocks_df = pd.DataFrame(
    {
        "Stock": ["Amazon", "Tesla", "Facebook", "Boeing"],
        "Price(in $)": [3180, 835, 267, 209],
        "Sector": ["Technology", "Technology", "Technology", "Aircraft"],
    }
)

print("Stocks Dataframe:")
print(stocks_df, "\n")

print("Stocks DataFrame excluding Sector Column:")
filtered_df = stocks_df[stocks_df.columns.difference(["Sector"])]
print(filtered_df, "\n")

Production :

Stocks Dataframe:
      Stock  Price(in $)      Sector
0    Amazon         3180  Technology
1     Tesla          835  Technology
2  Facebook          267  Technology
3    Boeing          209    Aircraft

Stocks DataFrame excluding Sector Column:
   Price(in $)     Stock
0         3180    Amazon
1          835     Tesla
2          267  Facebook
3          209    Boeing

Il supprime la colonne Sector de la DataFrame stocks_df et assigne le résultat à filtered_df.

Auteur: Suraj Joshi
Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Article connexe - Pandas DataFrame Column

Article connexe - Pandas Filter